机器人历来是预先编程的机器,只能严格执行指令。然而,随着Gemini Robotics 1.5与Gemini Robotics‑ER 1.5的推出,这一局面即将改变。Google DeepMind正在迈出关键一步,致力于打造能够推理、学习,甚至解决现实问题的更具适应性的机器人,开启全新时代。
科技巨头们不断通过引入更先进的AI模型和解决方案来挖掘技术潜力。虽然机器人过去主要用于在受控环境下执行搬运箱子、组装汽车零部件等重复性任务,但Google DeepMind决心让其最新模型能够处理更复杂的任务,甚至在需要时自行上网查询信息。
在近期的机器人发展更新中,Google推出了两款全新AI模型——Gemini Robotics 1.5与Gemini Robotics‑ER 1.5。ER模型侧重于通过网络获取信息来进行推理和任务拆解,而机器人模型则负责执行具体动作。Google DeepMind机器人部门负责人CarolinaParada详细阐述了这一思路,并解释说,正是由于两者的协同,机器人能够前瞻多步思考,而不局限于单一步骤。
因此,借助升级后的Gemini Robotics模型,你甚至可以让机器人帮你打包旅行行李、挑选装箱方案、查询天气,全面提升出行规划。双模型系统的运作方式类似人类的“先计划后行动”。最重要的升级在于知识迁移——在一台机器人上培养的技能可以迁移到另一台,即使两者的硬件或设计截然不同。
这款搭载Gemini技术的机器人潜力巨大,尤其在医疗领域,辅助机器人可根据不同患者需求提供帮助。即使用于个人生活,也能成为得力助理。不过,技术的飞跃也伴随挑战,AI模型快速迭代同样会带来各种问题。数据隐私、可靠性与安全性等疑问亟待解决,Google必须进行严格测试,方能实现大规模部署。
有一点是毋庸置疑的Google DeepMind决心让机器人从单纯的工具转变为能够与人类并肩工作的助手,通过教会它们思考与行动来实现这一目标。