上海热线讯:2025年7月27日,在“大爱无疆·模塑未来”WAIC 2025大模型论坛上,商汤科技重磅发布"悟能"具身智能平台。这一平台以商汤具身世界模型为核心引擎,依托商汤大装置提供端侧和云侧算力支持,能为机器人和智能设备赋予感知、视觉导航及多模态交互能力,推动智能终端向更高层次的自主化与智能化迈进。
商汤科技董事长兼CEO徐立在主题演讲中回顾了人工智能的发展历程,并分享了商汤在多模态技术及具身智能领域的最新探索。他表示,人工智能经历了感知时代、生成式AI时代,如今正迈向多模态世界模型和具身智能阶段,核心在于解决“智能从哪里来”的问题,以及如何让智能体与现实世界进行深度交互。
据介绍,"悟能"具身智能平台作为商汤具身智能技术的重要成果,通过商汤具身世界模型的支持,可实现对真实世界的理解、生成和编辑。平台能够构建面向人、物、场的4D真实世界,用户仅需输入简单自然语言指令,例如“在厨房区域的架子上找东西”或“进入娱乐室、向右转并打开通往院子的门”,系统便能自主生成位姿、动作骨架和指令执行流程。此外,该平台支持嵌入端侧芯片,具备强大的场景适配性,为机器人等终端设备提供广泛的应用可能性。
徐立在现场展示了搭载"悟能"具身世界引擎的人形机器人,通过幽默生动的讲解演示了机器人如何自主翻页PPT、回答问题并进行阶段性总结。徐立指出,商汤希望通过"悟能"具身智能平台,帮助更多具身智能企业实现与现实世界交互的梦想。他还提到,商汤的世界模型技术不仅可以生成多视角视频,还能够保持时间和空间的一致性,为机器人提供更精准的导航和交互能力。例如,商汤的技术已能够通过自然语言指令实时生成机器人在不同场景中的动作与视角,从而在虚拟场景中完成复杂任务。
此外,徐立还进一步阐述了商汤在多模态领域的探索,强调了多模态思维链的构造对于推动人工智能能力提升的重要性。他表示,商汤通过视觉与文本的结合以及多模态思维链的扩展,显著增强了AI模型的推理能力和对现实世界的感知能力。商汤最新推出的"日日新6.5"在多模态交互、推理性能和性价比等方面实现了显著突破,预训练吞吐量提升20%,推理成本降低至原来的30%,为企业和用户提供了更高效、更具性价比的技术支持。
商汤方面表示,"悟能"具身智能平台的发布标志着商汤在具身智能领域迈出了重要一步。未来,商汤将继续通过技术创新赋能机器人、智能设备等各类终端,助力实现人机交互的深度融合,为行业发展提供强大驱动力。