专为机器人行业而设计!谷歌推出两款新型AI模型

   日期:2025-03-30     作者:rmr8m       评论:0    移动:http://nu1ol.zybear.com/mobile/news/650.html
核心提示:财联社3月13日讯(编辑 牛占林)当地时间周三,谷歌宣布推出两款基于Gemini 2.0的新型人工智能(AI)模型,旨在开发更灵活、可互动

财联社3月13日讯(编辑 牛占林)当地时间周三,谷歌宣布推出两款基于Gemini 2.0的新型人工智能(AI)模型,旨在开发更灵活、可互动的机器人,有望推动机器人在更多场景中的应用和普及。

谷歌表示,最新的AI模型是为各种形状的机器人设计的,包括人形机器人和工厂、仓库中使用的其他类型的机器人。

图片

据谷歌介绍,其中一款名为Gemini Robotics,是一款视觉-语言-行动模型,能够通过物理动作输出结果,使机器人可以理解自然语言指令并执行复杂任务。更简单的说,Gemini Robotics可以听懂人类的语言,然后执行相应的命令。

另一款名为Gemini Robotics-ER,是一个专注于空间推理的视觉-语言模型,能够帮助机器人更好地理解周围环境,并支持开发者利用其推理能力运行自己的程序。

谷歌DeepMind工程师Kanishka Rao表示,谷歌将Gemini模型应用于机器人,正在推动机器人技术向更智能、更通用的方向发展。“我们的世界非常复杂、动态且丰富,我认为通用智能机器人需要能够应对这种复杂性。”

与此同时,包括Meta、特斯拉和OpenAI等巨头均加大了在机器人领域的研发工作,许多初创公司也在机器人领域崭露头角,例如,Figure AI和Skild AI等,它们的估值都达到了数十亿美元。

在预先录制的演示视频中,谷歌研究人员展示了运行其技术的机器人如何响应简单指令。其中一台机器人站在一堆字母拼图前,在训练员要求它拼出一个单词时,它拼出了“Ace”。

工程师们还在实验室里搭建了一个迷你玩具篮球场,另一台机器人在被要求完成扣篮动作时,将一个小塑料球按进了篮筐。

Rao声称:“当我们第一次看到机器人扣篮时,整个团队都非常兴奋。这是因为机器人从来没有见过任何与篮球有关的东西。它是通过Gemini理解了篮网的外观以及‘扣篮’这个词的含义,并能把它们联系起来,然后在现实世界中完成这项任务。”

不过,谷歌强调这项工作仍处于“早期探索”阶段。DeepMind研究员Vikas Sindhwani表示,Gemini模型是在对物理环境中的“常识性安全”有深刻理解的基础上开发的。

 
特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

举报收藏 0打赏 0评论 0
 
更多>同类最新资讯
0相关评论

相关文章
最新文章
推荐文章
推荐图文
最新资讯
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号