具身大模型向何处去?智平方以“类人脑”架构开辟机器人大脑新路径

人看过

2026-06-19

智平方在2026年6月的北京智源大会上,为行业带来了一款全新、也更强的大模型——全球首个类脑式具身智能系统NeuroVLA。它不仅以世界模型与VLA的融合终结了持续多年的路线之争;更重要的是,其“大脑皮层—小脑—脊髓”三层架构为机器人带来了质的飞跃——让机器人的大脑真正开始“像人”。而智平方的这一实质性突破,更树立了类脑架构即将成为机器人大模型未来演进的重要方向。

当前机器人大模型方向正是具身智能最热门的技术赛道之一。一方面,2026年开始,大量资金正加速向“机器人大脑”方向汇聚;另一方面,机器人的硬件正走向成熟,而关乎机器人能否更智能化的大模型便成为行业突破的关键方向。在这一道路上,机器人大模型的“大小脑分离”架构凭借任务泛化与工程落地能力成为近几年大模型的主流方向。但业内部分方案中的“小脑”功能涵盖较广,在实际应用中存在不少问题。同时,机器人的落地部署也在逐渐深化,一个亟待解决的大模型优化命题正在显现。

对此,智平方在2026年6月的北京智源大会上,为行业带来了一款全新、也更强的大模型——全球首个类脑式具身智能系统NeuroVLA。它不仅以世界模型与VLA的融合终结了持续多年的路线之争;更重要的是,其“大脑皮层—小脑—脊髓”三层架构为机器人带来了质的飞跃——让机器人的大脑真正开始“像人”。而智平方的这一实质性突破,更树立了类脑架构即将成为机器人大模型未来演进的重要方向。

图片
图片

“小脑”装下太多任务,双层架构将面临三道坎

 

近几年,大小脑分层架构设计在机器人大模型研发中被广泛采用。大脑负责语义理解、任务规划与高层推理——即“该做什么”;小脑负责运动协调、实时反馈与动作生成——即“怎么去做”。一个定战略,一个控战术,机器人的基本行动闭环由此成形。

但在部分双层架构中,小脑这一单一模块实际上包含了多个不同性质的子任务。如,英伟达基础模型GR00T N1中的系统1(小脑)承担从推理规划输出到连续动作执行的全程任务,Figure AI的HelixVLA模型的小脑则以200Hz的高频负责所有动作输出。

图片

但小脑负责的运动协调、执行与安全响应等任务对计算资源的需求各不相同。而眼下,它们全被压缩进小脑这一快系统的“动作执行者”中打包处理,就导致在大规模真实场景部署中,机器人实际操作的三大局限正在显化:

其一,灵巧控制的精度折损。小脑将协调与执行耦合在同一个层级中串行处理,导致机器人作业连续性被打断,抖动与顿挫感成为不可避免的局限精细作业的可靠性大打折扣。

安全响应的致命滞后。发生碰撞时,机器人的安全响应走完“感知→大脑推理→生成指令→执行”的全链路。其中,推理环节构成了不可压缩的时间瓶颈当模型还在“思考”时,机器人已经身处危险之中。对比生物“本能反应”,其能达到不必等待“大脑”的最快反应,而这也是当前机器人大模型架构所缺失的本能级安全响应机制

其三,层级间耦合过紧容错能力不足。当某一环节出问题时(如大模型推理卡顿),整个行动链可能面临中断,同时更无法实现局部降级或并行兜底。这种“一损俱损”的设计,使机器人在复杂动态环境中极易因局部故障而整体失效。

图片

这三道坎共同指向了机器人在任务中更深层的核心问题:当前“大脑+小脑”的两层架构虽然区分了“思考”与“行动”,却未能在“行动”内部再做进一步解构。机器人大模型的分层粒度,仍然不够细。

图片

“像”到“更像”,智平方走出类脑大模型创新路径

业内都在追求“机器人像人”,而智平方的创始人兼CEO郭彦东却一句话点醒了行业,他在智源大会上说得很直接:“大家做人形机器人,天天想着如何长得像人,但没有人想如何让脑子更像人。”

事实上,人脑的思考与响应,天生就是多层次的。层级越高,想得越深;层级越低,动得越快。但当前行业主流的“大脑+小脑”双层架构,只复现了前两个层级。它缺少了最底层、也最关键的脊髓级本能反射。这正是能够解决机器人动作抖动、安全响应滞后、系统脆弱等问题的根源。

这次在智源大会上成为大模型领域焦点的智平方其实早已不是新手。自2023年4月成立以来,智平方便聚焦物理世界大模型研发。从2024年6月推出首个VLA模型,到2025年先后发布快慢系统深度融合的Fast-in-Slow(FiS-VLA)架构,以及融合世界模型的Video2Act。前者通过“快系统嵌入慢系统”的架构设计,使高频率控制和推理能力得到大幅提升,机器人在真实环境下的整体任务成功率也提升11%;后者更被全球权威世界模型综述列为‘世界模型+VLA融合路线’的代表性成果

图片

而本次在智源大会上,智平方更带来它在2026年的“得意之作”——全球首个类脑式具身智能系统NeuroVLA。它参照并复刻了了人脑的“皮层—小脑—脊髓”三级分工,让机器人大脑进一步层次化。

图片

其中,皮层负责秒级的语义理解与长程任务规划;小脑负责百毫秒级的高频运动协调与动态轨迹修正。更值得注意的是新加入的脊髓层,这是目前现有VLA架构中第一次出现的独立层级。在生物系统中,脊髓负责数十毫秒级的本能反射。智平方首次将这一机制移植到机器人系统中,机器人在碰撞或紧急情况发生时,脊髓层能直接触发反射性动作在20毫秒内完成安全响应,这一设计使机器人第一次拥有了类似生物体的“本能反射”。

搭载NeuroVLA的机器人操作演示

三层并行运转,各司其职,使得智平方的NeuroVLA系统在机器人实测中实现了动作jerk抖动降低75.6%的显著进阶,并具备20毫秒内的生物级安全反射响应,同时脊髓层平均功耗也仅有0.4瓦。这不是单点技术的优化,而是从架构层面让机器人的智能组织方式,无限逼近生物智能的天然分工——皮层负责“想清楚”,小脑负责“做得稳”,脊髓负责“来得及”。

三年三次跃迁,智平方在大模型领域保持着高强度的技术布局,并始终在回答同一个问题:让机器人的“大脑”更接近人脑。

图片

结语

当前机器人大脑的演进已经走过从“统一模型”到“大脑+小脑”的分层阶段;而智平方最新推出的类脑式具身智能系统NeuroVLA以“三层架构”的突破定位为机器人赋予了“更像人类大脑”的技术支持。同时,智平方也在持续推进整个具身智能的开源的生态建设,这意味着,“类脑”大模型在未来也并非某一家企业的差异化标榜,而是将成为整个具身大模型领域共同演进的方向标。

关键字:

产品测评

查看更多
下一篇
80%的钱流向20%的头部!大晓机器人天使+轮数亿美元,锁定决赛圈门票

80%的钱流向20%的头部!大晓机器人天使

热门品牌