元戎的豪赌：宣判小模型死刑之后

当前位置：栏目>最新>文章详情

元戎的豪赌：宣判小模型死刑之后

来源：汽车商业评论（温莎）今天 16:05

2026年4月25日，北京，元戎启行首席科学家阮翀第一次站到公开演讲台上。他的PPT标题是一句英文：Being AI-Native In Post-LLM Era。

此前，元戎CEO周光刚刚用一句话概括了过去一年的心理状态：“挺绝望的，也不叫绝望，应该说挺难受的。”

阮翀的身份并不陌生。北大计算语言研究所2018年毕业，2023年加入DeepSeek，深度参与DeepSeek-VL/VL2、Janus系列多模态模型研发，与DeepSeek创始人梁文锋共同署名论文9篇，是《Nature》收录论文《DeepSeek-R1》的作者之一。今年初，他以首席科学家身份加盟元戎启行。这是元戎第一次设置这个职位。

周光把话筒交给阮翀之前，说了一句："未来的技术权，也应该掌握在真正懂得大模型物理AI的人手里。"

这不是客套话。这是一个创业者公开承认，他过去掌握的技术范式已经走到了尽头。

小模型之死

周光对小模型智驾的判断极其激进。

“今天弄得好一点、差一点有那么重要吗？你会发现不管怎么做，不可能做到十倍的好。不是靠辛苦能解决的，我觉得这个意义不大。”

在此之前的公开场合，周光把小模型的困境叫做“跷跷板效应”——同一套系统，早上跑得好，中午可能变差；在上海表现不错，换一个城市就不行。某个版本优化了某些场景，下一个版本可能又会退步。反复修补，不断迭代，没有本质提升。

这背后有数字。周光透露，目前行业内量产的智驾小模型，参数量多在10亿甚至1亿以下，运行算力一般为100至200 TOPS，以卷积神经网络为主，仅包含少量Transformer架构。而元戎新打造的基座模型，参数规模达到400亿。两者差了两个数量级。

差距不只在参数。2025年，元戎和小鹏都投入大量精力做大模型智驾，结果并不理想。"我们跟小鹏都花精力做大模型，都没产生什么效果，就有一点点。"周光在群访中承认。

转折出现在2026年初。

“今年年初，小鹏的成果蛮大的，用了大模型范式。”周光说。他指的是小鹏第二代VLA——720亿参数基座大模型，训练数据接近1亿个视频片段，去掉了语言转译环节，直接从视觉信号输出动作指令。

小鹏称其为“物理世界模型”，2026年一季度随Ultra版车型全量推送后，复杂小路的平均接管里程提升了13倍。

“可以看到时间非常短，是因为方法不对，这是我的看法。所以一定要专业的人做

专业的事。”周光的结论是：做大模型多模态自动驾驶，不应该是传统智驾的路子。

三个模型

阮翀在车展上介绍了元戎的基座模型架构。核心思路用一句话可以概括：不是每个任务一个小模型，而是一个大的基座模型同时完成多个任务。

具体落地为三个模型。

第一个是Driver，负责开车。接受传感器输入，输出驾驶动作——刹车力度、方向盘角度。这是最基础的一层。

第二个是Analyst。这个模型把语言模态接入进来，可以解释Driver为什么做出某个决策。"比如你开到路口时，它可以告诉你前面是一个路口，有盲区，会不会有行人突然出来，需要减速。"阮翀说。Analyst同时承担数据标注的功能，替代了过去大量人工标注的环节。

第三个是Critic。它解决了小模型时代无法利用负向数据的问题。"只有当你知道什么是好的、什么是不好的，并且把不好的行为也告诉模型，模型才能尽量避免这些行为。"阮翀说。闯红灯、抢路权、急变道——这些错误行为在小模型时代只能被丢弃，Critic让它们变成了学习素材。

如果用一个类比：Driver是司机，Analyst是副驾上那个会解释路况的老手，Critic是坐在后排批改作业的教练。三个角色过去分散在无数个小模型里，现在统一在一个基座模型中。

这套架构带来的直接效果是迭代速度的变化。“以前迭代一版模型可能需要100多个小时，而现在可以加速十倍，只需要12个小时就能做到。”阮翀说。

一千公里的赌注

周光给2026年定了一个硬指标：MPCI（每次关键接管里程）达到1000公里。

这个数字有参照系。特斯拉FSD v14在2025年10月的众测数据显示，搭载HW4硬件的车辆，关键接管间隔约为1454英里（约2341公里）。2026年1月，一位特斯拉车主使用FSD v14.2完成了从美国东海岸到西海岸2732英里的全程零接管驾驶。

"这是特斯拉已经实现的东西。如果别人能做到，你也能做到。"阮翀说。

但紧接着，周光自己提出了一个问题：“目前没有AI芯片，哪怕英伟达估计也得到明年才会出来。”

大模型需要大算力。元戎的400亿参数基座模型，无法直接跑在当前主流的车载芯片上。阮翀给出的解决方案是蒸馏——用大模型教一个小模型，让小模型获得大模型的部分能力。"这样小模型的能力也会很强，比你从头训练一个小模型强很多。"

然后他补了一句：“要相信时间的力量。”

一千公里的目标、特斯拉的参照系、不存在的芯片、蒸馏的技术补救、最后落到信仰——这条链条里，每一环都有逻辑，但逻辑和逻辑之间的缝隙是真实的。

信仰问题

那么，大模型跟物理世界交互的安全问题怎么解决？

阮翀的回答出人意料：“其实与其说是一个技术问题，我更觉得它是一个信仰问题。你为什么会相信一个人类司机可以开好车？或者说人类开车就不会有事故吗？你很难无瑕疵地去证明这个事情。而是说你会不会相信模型的能力能够达到人的能力——它不是数学证明，而是一种信仰。”

这是一个从DeepSeek出来的研究者，在第一次公开亮相时，把自动驾驶安全问题定义为信仰问题。

阮翀则说了另一句话：“”在使用工具时，一定要把工具当成自己的手，而不是自己的大脑。因为模型有可能会犯错，如果你不知道模型在干什么而盲目相信它的结果，很容易带来垃圾工作量的提升，实际进展却没有多少。"

信仰和警惕并存。

元戎在哪里

《汽车商业评论》了解到，截至2026年4月，元戎启行累计交付超过30万辆搭载城市NOA的量产车，覆盖超过15款车型，价格区间集中在15万到30万元。

2025年10月，元戎在城区NOA第三方供应商市场的单月市占率达到约38%至40%，与Momenta并列第一，增长倍数2.7倍，是头部三家中增速最快的。

周光说今年新增100万辆“没什么大问题”。

“中国真正能做端到端的，就是我们、小鹏、理想。说实话，中国其他所有的供应商，不管是谁，都是在跟，因为便宜。”他在群访中说。

这句话把行业劈成了两半。一半是创新者，一半是跟随者。周光把元戎放在创新者那一侧，依据是元戎最早做无图、最早做端到端、最早做VLA。但他也承认了一个事实：跟随者便宜，而便宜是有市场的。

“所有公司都是你做出来我来抄，这是一个绝望的事情——不会有飞机火箭发射，也不会有ChatGPT出来。”

周光说他“非常瞧不起这样的人和公司”。

三千块钱和一百万辆

周光的自我叙事里有一条反复出现的线索。

“我本人也不是一个物质的人，一个月三千块钱就够了，觉得做这个东西有意思就行。我的朋友在美国年薪没有低于500万美金的，我连人家的零头都没有。”

他说他做自动驾驶的原因是“救人救命”。“回到我做自动驾驶的初衷：救人救命。真正用技术做到人员安全，不要忽略这个本身。”

一个月花不出3000元的CEO，管理着一家估值71亿人民币、累计融资超7亿美元、今年计划量产交付100万辆的公司，清贫叙事和帝国目标在同一个人身上并存，矛盾却真实。

据说，何小鹏跟小鹏自动驾驶团队立了一个赌约——如果2026年8月30日之前，小鹏VLA系统在国内达到特斯拉FSD V14.2在硅谷的整体效果，他请团队去硅谷吃中国菜。

这个赌约给了元戎一个清晰的时间表和参照系。周光没有立赌约，但他给出了同样的目标：1000公里MPCI，2026年内。

特斯拉FSD累计行驶里程已超84亿英里。元戎累计行驶里程超过13亿公里。小鹏第二代VLA的训练数据是1亿个视频片段、3万卡算力、20多亿训练费用。

赌桌上的筹码很清楚。2026年年底，答案也会很清楚。