发布信息

具身智能真正‘涌现’是跨任务跨场景的,最好本体或在中国

作者:软荐小编      2025-05-31 15:01:07     188

具身智能的真正“涌现”特性体现在跨任务和跨场景的应用中,而最出色的本体形态,有望在中国这片土地上孕育而生。

5月29日,正值2025张江具身智能开发者大会“具身·无界:智能模型的范式创新与架构革命”论坛阶段,联汇科技(OmAI)的CEO兼首席科学家赵天成在接受澎湃新闻记者的采访时,发表了上述观点。

联汇科技赵天成:具身智能的真正“涌现”是跨任务跨场景,中国更有机会萌生最好的本体__联汇科技赵天成:具身智能的真正“涌现”是跨任务跨场景,中国更有机会萌生最好的本体

随着具身智能的潮流不断涌现,为了使机器人能够深刻洞察物理世界的本质,视觉语言模型(VLM)、视觉语言动作模型(VLA)等具有具身智能特性的大型模型便应运而生。目前,如何使具身智能具备与人类相似的规划与操作能力,已成为学术界和产业界共同面对的难题。

赵天成,毕业于卡耐基梅隆大学的计算机专业,对视觉语言模型领域进行了长达多年的潜心研究,并多次担任国际顶级会议的领域主席,同时,他还担任了国家重点研发计划(青年科学家)项目的负责人。其创立的OmAILab人工智能实验室于今年二月发布了VLM-R1开源视觉语言大模型,该模型运用了生成式奖励处理优化(GRPO)的强化学习技术,实现了DeepSeek R1方法从纯文本领域向视觉语言领域的成功迁移,目前该模型在GitHub上收获了近5000颗星。

当前的发展态势与2017年、2018年的大型语言模型颇为相似,众多技术路线竞相绽放,呈现出百花齐放的局面。然而,尽管方向明确,旨在构建‘世界模型’,赵天成指出,全球各实验室在实现这一目标上各有独到见解。目前,成熟的VLM模型在理解和生成功能上尚未实现统一。我们正开展研究,探索如何实现统一结构”。

赵天成表示,VLM-R1之所以受到广泛关注,起初的发布旨在提升模型对复杂物体的理解和视觉推理能力,而如今,基于其开放的框架,社区已经开发出了众多创新的应用。

终端用户迫切需求的是一个能够产出成果、执行任务的全面智能实体(Agent)。我们致力于研发那些能够真正部署在实体终端上的智能体,无论是机器狗、无人机抑或是摄像头,均有潜力转化为智能体。赵天成指出,智能终端所遭遇的挑战远超单一模型层面,实现具身智能并非单靠某一公司的力量就能实现,必然涉及到生态分层的商业模式。我国制造业实力雄厚,目前并非只有少数几家企业在进行硬件本体的研发,而是有十几家甚至上百家企业投身其中。我们致力于优化“大脑”功能(即AI能力),并与专注于“小脑”研发、即运动控制领域的企业建立合作关系,这种模式能显著提高工作效率,并助力机器人行业步入良性发展的轨道。

赵天成指出,我国在具身智能这一领域拥有显著的优势,特别是在供应链制造业以及数据领域。他以小脑系统为例,阐述道:“小脑与硬件的高度匹配,使得我国更有可能孕育出最优秀的本体。我个人认为,这无疑是一个极具确定性的判断。”

赵天成还向记者透露,他所在的团队即将推出一款机器人大脑平台。这一平台的目标是,通过与众多硬件制造商的紧密合作,让智能硬件不再局限于硬件本身,而是能够融入不同的应用场景,实现智能化。

赵天成指出,该机器人大脑集成了语言交流、三维空间感知、记忆存储以及决策执行控制等四大核心功能,并且能够根据不同的应用环境迅速完成功能定义。

联汇科技赵天成:具身智能的真正“涌现”是跨任务跨场景,中国更有机会萌生最好的本体__联汇科技赵天成:具身智能的真正“涌现”是跨任务跨场景,中国更有机会萌生最好的本体

在论坛当天,赵天成以移动机器人智能体为示范,具体呈现了其VLM在服务场景中实现多模态感知、长程记忆以及自适应决策的完整流程:机器狗通过地图和视觉导航,定位目标并执行相关任务,接着依靠记忆自行返回起点。

赵天成指出,物理终端智能体与一般智能体有一个明显的区别,那就是它们必须做到“迅速”,必须保证反应的及时性,不能出现我发出指令后,机器人却迟迟没有动作的情况,这种情况是任何人都难以容忍的。

赵天成指出,通过强化学习技术,可以使得规模更小的模型具备处理特定场景下复杂任务的能力,从而提升其响应速度。此外,通过优化模型结构,比如用一次性生成方案的方式替代GPT等自回归生成模式,可以在根本层面上实现加速。对于一些特别复杂的逻辑判断,目前普遍存在速度较慢的问题,预计还需要一到两年的时间进行持续优化。

赵天成指出,通用人工智能AGI的具身智能何时能够实现,他坚信这必须依赖于大量的某种学习方式,进而促使智能的涌现。他强调,这种智能的涌现应当是跨越不同任务和场景的,而不仅仅是局限于抓取物品、叠衣服等基础技能。

技术开源打破了“单一阵营”的界限,为机器人大脑平台带来了从理论模型到物理终端的转化工具,这种协同创新正在加速推动具身智能技术的更新迭代。

相关内容 查看全部