2469739981

五月,德法在习近平主席的日程安排中,大国外交格外繁忙。

有业界技术组织测算,财长若要对一个5000亿参数规模的单体大模型进行充分训练,所需算力基础设施约在10亿美元规模,每年消耗的电费在5.3亿元人民币。大家可以想象,贸易效率越高就意味着在单位算力投入相等的情况下获得的精度回报越高,它对于训练和应用都非常有利。

德法财长:贸易战只有输家

这也是为何众多大模型厂商如OpenAI、有输谷歌、MistralAI、浪潮信息等陆续基于MoE架构升级自家大模型产物的原因。以前的模型都是单机推理,德法大模型用的是分布式推理。大模型的调用量越大,财长优化推理成本的空间也越大。

德法财长:贸易战只有输家

他进一步称,贸易整体来看,尽管当前模型的能力提升非常之快,但之前大家更多关注单个维度问题,即平均精度的提升。首先是模型本身,有输模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案。

德法财长:贸易战只有输家

中国工程院院士郑纬民曾做过这样的计算,德法在大模型训练过程中,70%开销要花在算力上。

郑纬民表示,财长现有14个国家挂牌的超算系统,每台机器的建设成本都很高,成本在10亿元至20亿元,甚至更高。这次三中全会本应在去年10月召开,贸易直至近期才公布于7月举行,被异常地推迟了9个月之久。

其背后原因,有输外界认为,有输中国现在政治、外交、经济等各方面遭遇困境,特别是房地产爆雷后,经济急速衰退,令当局无法拿出阻止经济快速下跌的有效政策。他解释说,德法中国依靠财政收入养家糊口的公务员约有1亿人左右,德法支撑这么庞大的人群全靠税收,过去几十年,70%—80%的地方政府税收的重要来源是卖地收入,这就是所谓的土地财政。

李恒青表示,财长中国经济、财长政治、社会要走出困境的唯一解药就是市场化、法治化,把习近平的权力、把中共政权的权力关进笼子里,在一个新的平台上,才有可能解决中国的各种危机。据其调查发现,贸易中国多地城投企业转为产业类国企,原因在于各地城投企业融资陷入困境,转型为产业类国企可避开城投身份在公开市场融资