公众号
当前位置:栏目>最新>文章详情

元戎的豪赌:宣判小模型死刑之后

来源:汽车商业评论(温莎)今天 16:05

2026年4月25日,北京,元戎启行首席科学家翀第一次站到公开演讲台上。他的PPT标题是一句英文:Being AI-Native In Post-LLM Era。

此前,元戎CEO周光刚刚用一句话概括了过去一年的心理状态:挺绝望的,也不叫绝望,应该说挺难受的。

翀的身份并不陌生。北大计算语言研究所2018年毕业,2023年加入DeepSeek,深度参与DeepSeek-VL/VL2、Janus系列多模态模型研发,与DeepSeek创始人梁文锋共同署名论文9篇,是《Nature》收录论文《DeepSeek-R1》的作者之一。今年初,他以首席科学家身份加盟元戎启行。这是元戎第一次设置这个职位。

周光把话筒交给翀之前,说了一句:"未来的技术权,也应该掌握在真正懂得大模型物理AI的人手里。"

这不是客套话。这是一个创业者公开承认,他过去掌握的技术范式已经走到了尽头。

小模型之死

周光对小模型智驾的判断极其激进。

今天弄得好一点、差一点有那么重要吗?你会发现不管怎么做,不可能做到十倍的好。不是靠辛苦能解决的,我觉得这个意义不大。

在此之前的公开场合,周光把小模型的困境叫做跷跷板效应——同一套系统,早上跑得好,中午可能变差;在上海表现不错,换一个城市就不行。某个版本优化了某些场景,下一个版本可能又会退步。反复修补,不断迭代,没有本质提升。

这背后有数字。周光透露,目前行业内量产的智驾小模型,参数量多在10亿甚至1亿以下,运行算力一般为100至200 TOPS,以卷积神经网络为主,仅包含少量Transformer架构。而元戎新打造的基座模型,参数规模达到400亿。两者差了两个数量级。

差距不只在参数。2025年,元戎和小鹏都投入大量精力做大模型智驾,结果并不理想。"我们跟小鹏都花精力做大模型,都没产生什么效果,就有一点点。"周光在群访中承认。

转折出现在2026年初。

今年年初,小鹏的成果蛮大的,用了大模型范式。周光说。他指的是小鹏第二代VLA——720亿参数基座大模型,训练数据接近1亿个视频片段,去掉了语言转译环节,直接从视觉信号输出动作指令。

小鹏称其为物理世界模型,2026年一季度随Ultra版车型全量推送后,复杂小路的平均接管里程提升了13倍。

可以看到时间非常短,是因为方法不对,这是我的看法。所以一定要专业的人做

专业的事。周光的结论是:做大模型多模态自动驾驶,不应该是传统智驾的路子。

三个模型

翀在车展上介绍了元戎的基座模型架构。核心思路用一句话可以概括:不是每个任务一个小模型,而是一个大的基座模型同时完成多个任务。

具体落地为三个模型。

第一个是Driver,负责开车。接受传感器输入,输出驾驶动作——刹车力度、方向盘角度。这是基础的一层。

第二个是Analyst。这个模型把语言模态接入进来,可以解释Driver为什么做出某个决策。"比如你开到路口时,它可以告诉你前面是一个路口,有盲区,会不会有行人突然出来,需要减速。"翀说。Analyst同时承担数据标注的功能,替代了过去大量人工标注的环节。

第三个是Critic。它解决了小模型时代无法利用负向数据的问题。"只有当你知道什么是好的、什么是不好的,并且把不好的行为也告诉模型,模型才能尽量避免这些行为。"翀说。闯红灯、抢路权、急变道——这些错误行为在小模型时代只能被丢弃,Critic让它们变成了学习素材。

如果用一个类比:Driver是司机,Analyst是副驾上那个会解释路况的老手,Critic是坐在后排批改作业的教练。三个角色过去分散在无数个小模型里,现在统一在一个基座模型中。

这套架构带来的直接效果是迭代速度的变化。以前迭代一版模型可能需要100多个小时,而现在可以加速十倍,只需要12个小时就能做到。翀说。

一千公里的赌注

周光给2026年定了一个硬指标:MPCI(每次关键接管里程)达到1000公里。

这个数字有参照系。特斯拉FSD v14在2025年10月的众测数据显示,搭载HW4硬件的车辆,关键接管间隔约为1454英里(约2341公里)。2026年1月,一位特斯拉车主使用FSD v14.2完成了从美国东海岸到西海岸2732英里的全程零接管驾驶。

"这是特斯拉已经实现的东西。如果别人能做到,你也能做到。"翀说。

但紧接着,周光自己提出了一个问题:目前没有AI芯片,哪怕英伟达估计也得到明年才会出来。

大模型需要大算力。元戎的400亿参数基座模型,无法直接跑在当前主流的车载芯片上。翀给出的解决方案是蒸馏——用大模型教一个小模型,让小模型获得大模型的部分能力。"这样小模型的能力也会很强,比你从头训练一个小模型强很多。"

然后他补了一句:要相信时间的力量。

一千公里的目标、特斯拉的参照系、不存在的芯片、蒸馏的技术补救、最后落到信仰——这条链条里,每一环都有逻辑,但逻辑和逻辑之间的缝隙是真实的。

信仰问题

那么,大模型跟物理世界交互的安全问题怎么解决?

翀的回答出人意料:其实与其说是一个技术问题,我更觉得它是一个信仰问题。你为什么会相信一个人类司机可以开好车?或者说人类开车就不会有事故吗?你很难无瑕疵地去证明这个事情。而是说你会不会相信模型的能力能够达到人的能力——它不是数学证明,而是一种信仰。”

这是一个从DeepSeek出来的研究者,在第一次公开亮相时,把自动驾驶安全问题定义为信仰问题。

说了另一句话:“”在使用工具时,一定要把工具当成自己的手,而不是自己的大脑。因为模型有可能会犯错,如果你不知道模型在干什么而盲目相信它的结果,很容易带来垃圾工作量的提升,实际进展却没有多少。"

信仰和警惕并存。

元戎在哪里

《汽车商业评论》了解到,截至2026年4月,元戎启行累计交付超过30万辆搭载城市NOA的量产车,覆盖超过15款车型,价格区间集中在15万到30万元。

2025年10月,元戎在城区NOA第三方供应商市场的单月市占率达到约38%至40%,与Momenta并列第一,增长倍数2.7倍,是头部三家中增速最快的。

周光说今年新增100万辆没什么大问题

中国真正能做端到端的,就是我们、小鹏、理想。说实话,中国其他所有的供应商,不管是谁,都是在跟,因为便宜。在群访中说。

这句话把行业劈成了两半。一半是创新者,一半是跟随者。周光把元戎放在创新者那一侧,依据是元戎最早做无图、最早做端到端、最早做VLA。但他也承认了一个事实:跟随者便宜,而便宜是有市场的。

所有公司都是你做出来我来抄,这是一个绝望的事情——不会有飞机火箭发射,也不会有ChatGPT出来。

周光说他非常瞧不起这样的人和公司

三千块钱和一百万辆

周光的自我叙事里有一条反复出现的线索。

我本人也不是一个物质的人,一个月三千块钱就够了,觉得做这个东西有意思就行。我的朋友在美国年薪没有低于500万美金的,我连人家的零头都没有。

他说他做自动驾驶的原因是救人救命回到我做自动驾驶的初衷:救人救命。真正用技术做到人员安全,不要忽略这个本身。

一个月花不出3000元的CEO,管理着一家估值71亿人民币、累计融资超7亿美元、今年计划量产交付100万辆的公司清贫叙事和帝国目标在同一个人身上并存,矛盾却真实。

据说,小鹏跟小鹏自动驾驶团队立了一个赌约——如果2026年8月30日之前,小鹏VLA系统在国内达到特斯拉FSD V14.2在硅谷的整体效果,他请团队去硅谷吃中国菜。

这个赌约给了元戎一个清晰的时间表和参照系。周光没有立赌约,但他给出了同样的目标:1000公里MPCI,2026年内。

特斯拉FSD累计行驶里程已超84亿英里。元戎累计行驶里程超过13亿公里。小鹏第二代VLA的训练数据是1亿个视频片段、3万卡算力、20多亿训练费用。

赌桌上的筹码很清楚。2026年年底,答案也会很清楚。