科技日报记者 陈曦 通讯员 梁绍楠

“把客厅收拾一下,再给客人做杯奶茶。”随着指令下达,机器人环顾四周,识别出散落的物品。机械臂精准抓取扫帚,沿着计算好的路径清扫地面;任务完成后,它转向操作台,取杯、加茶、加奶、搅拌、递送,动作行云流水,一气呵成。整个过程没有人工干预,仿佛一位训练有素的管家。

这是近日记者在天津大学深度强化学习实验室里看到的一幕。机器人的“聪明劲”来自天津大学具身团队自主研发的具身基座模型Embodied-R1.5。在这间实验室里,一群年轻人正用行动让人工智能从“会算”走向“会干”,让实验室里的创新成果加速落地转化。

“大脑决策,小脑控制”

该实验室青年骨干汤宏垚副研究员告诉记者,让机器人收拾房间、制作奶茶,听起来不稀奇,但这背后的技术突破,并非那么简单。

传统的机器人只能在固定环境里按固定程序干活——工厂流水线上的机械臂,换个位置就不会动了;家里的扫地机器人,遇到障碍物常常“卡壳”。要让机器人像人一样灵活应对真实世界的变化,必须给它换一套“大脑”。

汤宏垚打了个比方:“我们给机器人设计了‘大脑+小脑’的分工架构。大脑是一个多模态大模型,负责理解任务意图、感知环境、进行长时序推理和规划。比如‘取水杯’这个指令,大脑要拆解成多个步骤,判断哪个杯子能用、有没有障碍物、先拿杯子还是先走过去。”

“小脑则是基于强化学习的决策控制模块,负责具体动作的精准执行。”他解释道,机械臂用多大力气拿杯子、怎么拿才能稳当又不捏碎、移动过程中如何保持平衡——这些精细活,都是小脑在实时计算和调整。

该实验室副教授马亿补充道,团队近期的攻关重点,正是“大脑+小脑”的协同配合。“大脑决策,小脑控制,两者配合好了,机器人在真实的居家环境里,就能自己琢磨着把活干好。”

搭载了新模型的机器人,不仅能收拾客厅、制作奶茶,还能按照指令擦花瓶、给手机充电、为客人冲咖啡、打包礼物。更关键的是,面对从没见过的场景,它也能“零样本适应”——不用提前学习,直接上手干活。

“这正是目前具身智能领域的前沿方向,也是未来家庭管家的雏形。”马亿说。