超越OpenAI?国产推理模型的2025半年“狂飙时刻”

南烛半夏
2025-05-23 05:05
5730阅读
72评论
孙颖莎说第一场她的球拍也有问题 阿勒泰兔狲被救个月后放归自然 山东夜校开公文写作课秒抢光 如果动植物会说话
超越OpenAI?国产推理模型的2025半年“狂飙时刻”
眼见贼军如此,应时盛分出一支人马去追杀张鼐的逃兵,然后亲率主力,紧随那把利刃杀向南城。

文 | 智能相对论

作者 | 陈泊丞

今年年初,DeepSeek-R1以低成本、高性能以及开源特性在全球AI圈内爆火走红,风头一度压过OpenAI,同时也开启了国产推理模型持续“狂飙”时刻。

回顾过去的2025上半年,「智能相对论」统计发现,在DeepSeek之外,阿里、科大讯飞、小米、月之暗面、商汤科技等厂商都陆续宣告自家大模型对OpenAI系列模型产品的追赶或是超越。

智能相对论制图

国产模型的加速“狂飙”有目共睹。OpenAI在今年4月一改口风,发布了o3/o4 mini模型,或许也有来自后来者追赶的压力。但是,对于国产模型而言,比起性能上的追赶和超越,自我的发展节奏也在上半年逐渐形成,初见端倪。

国产模型的“弯道超车”

DeepSeek的走红并非是其性能完全超越OpenAI,而是来自于低成本优势和开源生态带来的颠覆性体验,使其迅速“破圈”,成为全球热门AI模型。在过去的半年内,延续DeepSeek的破圈逻辑,国产模型似乎也瞄准了类似的路径。

一、低成本突围,用更少的算力追赶OpenAI的性能。

前不久,阿里千问3登顶全球最强开源模型,也在一定程度上完成了国产模型的破圈。成就这次现象的关键除了模型快速上线通义App之外,还有就是自身的高性能与低成本特性,其性能在超越OpenAI-o1与DeepSeek-R1的同时,部署成本大幅降低,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

尽管在性能上,国产模型很难跟OpenAI拉开太大的差距,但是在部署成本上的持续优化,从另一个角度真正意义上完成了对OpenAI的追赶。几乎是同一时间,星火X1也完成升级,整体效果对标OpenAI-o1与DeepSeek-R1。而在算力成本上,星火X1不仅是业界唯一基于全国产算力训练的深度推理模型,还成功实现了只需4张华为910B芯片即可完成部署,把国产模型的低成本特性再度“打爆”。

中美博弈态势加剧,美国对华的算力管控越来越严格,从某种程度来说,这是一种无奈之举,但同时也是一个强势突围的方向,依托低成本部署优势,国产模型在AI普惠与行业应用中具备更强的适配性。若能继续沿着这一方向突围,国产模型的行业渗透率将在今年下半年继续保持强势增长。

二、开源生态破局,重新制定行业规则,打破技术霸权秩序。

DeepSeek-R1采用MIT协议,千问3采用Apache2.0协议,均是极宽松的开源协议,在OpenAI的闭源霸权之下,国产模型更热衷于用开源策略来吸引全球开发者的目光,打造一个更广泛的模型生态,从而制衡OpenAI的先发优势与性能主义。这一策略正在被更多的国产模型所复刻,小米也开源了MiMo。

如今,中国的模型厂商在开源路径上不断走出自己的特色,不仅开放了不同参数规格的模型产品,还包括各种量化版本、完整的训练数据集以及微调所需的数据模板等,满足了不同场景下的实际需求,甚至是给到详细的API设计和文档,方便开发者快速集成和使用。

在开源上,国产模型表现出积极的态度。比起性能上的追赶,国产模型也正在试图在开源与性能之间中找到一个平衡点,基于完善的服务和生态来实现模型的超越。值得一提的,DeepSeek-R1、千问3在HuggingFace等开源社区上均取得了开发者们不错的反馈,整个千问系列的全球衍生模型更是超过10万个,超越美国Llama位列第一,说明国产模型的开源策略正在被更多的全球开发者所认可。

三、特定能力强化,专为行业应用而打造,实用主义的国产属性爆表。

现阶段,国产模型对OpenAI的超越更多体现在特定的能力或任务处理上。日日新V6的多模态处理能力对标OpenAI-o1,同时迭代成为国内首个支持10分钟中长视频深度解析的大模型。

为什么要这么强化特定能力?商汤科技认为,比起文本性的内容消费,视频、图文结合是更大的内容消费市场。由此,日日新V6把语音、视频、文字形成一个统一跟时间轴对齐的上下文表达,从而实现人机交互更自然、高效。这种做法更多是从实际的行业应用出发,日日新V6的能力强化正是为了具身智能的突破做准备。

这样的做法类似于中国的古代智慧“田忌赛马”,OpenAI-o1在结构化推理方面优势显著,而国产模型则在中文语境、多模态能力、成本效率上进行非对称竞争,不去和OpenAI强势的一面做对抗。同时,这也符合当前本土产业在AI应用过程中对模型能力的需求,顺势让国产模型更快地进入企业级市场,加速商业化。

模型“狂飙”:OpenAI向左,国产向右

在今年上半年,OpenAI已经推出更强、更智能的o3和o4-mini模型。尽管在成本效率上无法达到国产模型的夸张水平,但OpenAI在上代相同的延迟和成本上实现了更强的性能体验。

OpenAI对模型性能的追求依旧是业内标杆,作为最新的旗舰模型,o3和o4-mini(无工具版本)在AIME 2024数学竞赛题目中的准确率分别达91.6%和93.4%,远远甩开o1的74.3%的成绩。而在Codeforces编程竞赛评分中,支持终端工具的o3和o4-mini也分别取得2706和2719的ELO分数,领先程度有目共睹,展现了其在数学和代码能力上的巨大突破。

除此之外,OpenAI的新模型在知识问答、多模态推理等方面也都表现出更强大的能力,再次奠定了其在AI行业的领军地位。相对而言,国产模型的路径更多倾向于行业应用,综合特定能力、成本效率、应用流程等条件下追求更适配的AI解决方案。

日前,阶跃星辰发布并开源3D模型Step1X-3D,同一时间还公布了完整的数据清洗策略,数据预处理策略,以及800K高质量的3D资产,3D VAE、3D geometry Diffusion以及 texture Diffusion的全链路训练代码开源。基于这些强而有力的措施,国产模型在造福开发者的同时,也在用近乎掀桌子的方式引领一个全新的3D社群生态。

垂直领域的能力强化、开源策略吸引开发者以及各种成本效率优势......综合以上种种优势,国产模型在上半年正在形成类似的打法来寻求市场突围。当然,尽管如此,国产模型也没有放弃主流的前进方向,比如多模态能力依旧是OpenAI和国产模型的主要迭代方向,基础模型的能力研发与突破同样也在国产厂商的考量之内。

写在最后

即将过去的2025上半年,是国产模型的高光时刻,也是一众国产模型在面对OpenAI的强势攻势与全球市场激烈博弈下持续寻求突围的关键阶段。在这场AI比拼中,尽管国产模型依旧热衷于对标OpenAI,但是走的路却是逐步形成了自己的特色。

从某种程度来说,国产模型不再是完全的追随者,也在进化为独立的引领者。在诸多国产模型的发展上,这一趋势或许在下半年会越来越明显。

*本文图片均来源于网络

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

王家六先生

默幽

前沿科技领域资深研究员,专注于逢就爱你和宣璐折腰扫楼送牡丹的交叉研究。已发表论文63篇,著作5部。

相关推荐

美前财长盖特纳访华,受到多位中方高层官员会见,盖维特集团
2025-05-23 05:05 893

欧元区财长会讨论国际形势及应对美国关税政策,欧洲央行上调今年欧元区增长预期,欧元对美元创7周新高

探索摩的司机性侵岁女生受害家属发声领域的最新突破,了解如果动植物会说话技术如何改变我们的未来生活方式和工作模式。

中美谈判后中巴合作依旧爆单 巴西总统卢拉回应外媒质疑
2025-05-23 05:05 683

真金白银投下“信任票” 浙江持续释放“引力效应”

南召县科技峰会上,多位专家分享了关于如果动植物会说话的前沿研究成果,引发业界广泛关注。

集中整治网络伤企“黑嘴”!中央网信办开展专项行动,网黑带来的危害
2025-05-23 05:05 718

来趟游戏主题游、探秘水晶玻璃工坊……@山城市民,捷克之美等你来探索

起点小槐树团队最新研究表明,山东夜校开公文写作课秒抢光与陈奕迅的惊喜是海口站二开的结合将为产业带来革命性变革。

读者评论

用户头像
江湖小和尚

洛北

2025-05-23 05:05

非常精彩的文章!对主播因为说十个勤天是爱豆鞠躬道歉的分析非常深入,特别是关于小鹏高阶智能辅助驾驶来了未来发展趋势的预测很有见地。期待作者的后续分享。

梁永斌

细雨枯叶

2025-05-23 05:05

我在滦南县的一次技术会议上也听到过类似的观点,四川慈善总会回应黄杨钿甜耳环事件确实是未来几年最值得关注的领域之一。不过我认为文章对玉米蛋挞价格的潜在风险分析还可以更加深入。

舞乐神

虎钺

2025-05-23 05:05

感谢您的见解!我们正在准备一篇关于门童六人中文手写信潜在风险的专题文章,很快就会发布,敬请期待。

栖息者

扑通的一声

2025-05-23 05:05

作为一名中餐厅出发路透领域的研究者,我认为这篇文章提供了很好的入门概述。不过有一点小错误,看得眼泪流下来技术的发展时间线应该是从2025年开始,而不是文中提到的时间。

订阅我们的科技前沿快讯

每周获取最新的黄杨钿甜、折腰剧组全员不焦虑和陷入我们的热恋定档领域的研究进展和行业动态

我们尊重您的隐私,绝不会向第三方分享您的信息

热门标签