“3 个领先模型中有 2个来自中国实验室?中国追赶的速度真是令人难以置信。”在美国知名技术社区Hacker News,一位开发者如此感叹。“中国初创公司已展现出赶超美国人工智能模型的迹象,而且他们追赶的速度比许多业内人士预期的要快。”有外媒12月24日的一篇报道中,也通过对比中美两国AI企业推理模型的表现以和研发速度,得出上述结论。
1月20日,国内两家备受关注的人工智能大模型创业公司月之暗面(Kimi)和深度求索(DeepSeek)几乎在同一时间发布了最新模型,都在性能测试中超过OpenAI的o1正式版模型。
在月之暗面发布的k1.5多模态思考模型中,多模态思考模型实现了SOTA级别多模态推理和通用推理能力。(注:SOTA通常指某个领域中最先进的技术或方法)short-CoT模式下,Kimi k1.5的数学、代码、视觉多模态和通用能力,大幅超越了全球范围内短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,领先达到550%;而在long-CoT模式下,Kimi k1.5的数学、代码、多模态推理能力,也达到长思考SOTA模型OpenAI o1正式版的水平。
而深度求索发布的DeepSeek-R1在后训练阶段大规模使用强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
不到两个月,两家国产推理模型都实现了对OpenAI o1正式版的对标甚至超越,而与OpenAI不同,两家中国公司都公开了他们的原理及技术报告:Kimi k1.5发布原创技术long2short,高效思维链+原生多模,DeepSeek R1则继续主打高性价比。报告一出,引来大量海外从业者的解读和关注。
英伟达高级科学家范麟熙(Jim Fan)在社交媒体发文表示,“两篇论文披露了大量技术细节,并惊人得出相似结论,假期读到令人鼓舞。”
Answera公司创始人保罗·库弗特(Paul Couvert)也感叹,“两款中国o1同日发布,中国AI追赶速度越来越快。”
中央民族大学教授郭全中表示:"中国AI公司之前基本都在摸着Open AI的石头过河,但从K1.5等国产大模型开始,以硅谷为中心的格局已悄然发生变动。国产大模型的突破不仅在于技术指标的提升,也展示了中国AI技术正在走向自主创新的新阶段。期待看到更多中国企业在全球AI舞台上展现实力,推动人工智能技术向着更高水平迈进。”
(责任编辑:王晨曦)