灵初智能发布分层端到端VLA+强化学习算法模型Psi-R1

互联网
2025
04/28
13:46
分享
评论

近日,灵初智能发布的的分层端到端VLA+强化学习算法模型Psi-R1,已实现机器人在开放环境中的长程灵巧操作能力,达成了30分钟+持续CoAT超长任务时长,同时验证了三重复合交互能力(人-机交互、机-机交互、机-环境交互),体现出VLA的超强推理能力和RL超越人类上限的思考、操作能力。

理论上,只有具备L3(即基于Chain of Action Thought(CoAT)框架的自主推理系统的长程CoAT灵巧操作能力,才能理解世界,并将学到的知识迁移到新的环境中落地。灵初智能凭借其分层端到端VLA+强化学习算法模型Psi-R1,以麻将为场景,展现了机器人在开放环境中的长程灵巧操作能力,达成了30分钟+持续CoAT超长任务时长,同时验证了三重复合交互能力(人-机交互、机-机交互、机-环境交互),体现出VLA的超强推理能力和RL超越人类上限的思考、操作能力。

这项突破性成果标志着具身智能从单一动作执行向完成复杂物理世界感知、推理和执行闭环的关键跃迁,为具身智能真正进入商业场景提供了可落地的技术范式。

在24年成立之初,灵初智能率先提出分层端到端快慢脑架构技术路线,如今已成为行业共识;而此次发布的Psi-R1快慢脑架构,不仅可实现模态对齐,结合强化学习达到具身Aha Moment,更是回应了并一定程度解决了Nvidia机器人高级总监及华盛顿大学教授 Deiter Fox对快慢脑架构存在两个核心问题(即,如何连接快慢脑、实现慢脑规划和快脑操作的模态对齐;如何突破模仿学习的瓶、训练丰富技能)。

灵初R1模型已首度成功验证VLA Test-Time Scaling

灵初智能R1快慢脑系统具备L3能力,可在开放环境下自主推理决策,完成长程复杂操作,其技术得以广泛应用并已与制造业、商超零售、跨境物流等行业龙头企业展开合作,梯次布局高价值商业化场景,从泛工业向泛零售物流,再最终迈向家庭应用,并进一步探索具身智能的未知领域。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

相关推荐

1
3
Baidu
map