分享好友 最新资讯首页 最新资讯分类 切换频道
「让通用机器人成为现实」,谷歌RT-2、PaLM-E作者离职创业
2025-03-23 22:25

机器之心报道

编辑:蛋酱

又一位 DeepMind 高级研究科学家离开了谷歌,创建了自己的初创公司。

在近日召开的英伟达 GTC 的一个小组讨论会上,谷歌 DeepMind 高级研究科学家、RT-2 作者 Pete Florence 以 Generalist AI 联合创始人兼首席执行官的身份出席。

图片

人工智能浪潮的来临让英伟达这家公司获得了巨大的财务成功,与此同时,NVentures 也成为一家格外活跃的风险投资公司。但目前我们无从得知 Pete Florence 的公司获得了多少来自英伟达的投资。

「我们基本上仍处于隐秘状态,」Pete Florence 在 GTC 讨论会上表示,暂时无法具体说明自己的初创公司在做什么。但答案也很明显了,公司将专注于机器人技术。

因为他在回答「如果他的初创公司获得巨大成功,世界会变成什么样子」问题时,是这么说的:

「我们的目标是制造能做任何事情的机器人。想象一下,在这个世界上,体力劳动的边际成本将趋于 0。」

「让通用机器人成为现实」

Florence 表示,自己创办这家公司的使命是「让通用机器人成为现实」。

根据其领英个人资料,Florence 一年前离开了 DeepMind。他加入了 DeepMind 前同事的行列 —— 选择一条喜欢的赛道,创办自己的公司。

图片

在加入谷歌之前,他在麻省理工学院获得了计算机科学博士学位,师从 Russ Tedrake。Tedrake 教授在机器人学领域有着显著的成就和广泛的影响力,研究领域包括机器人动力学分析、控制器设计和仿真等。

4 年多的谷歌 DeepMind 生涯中,Pete Florence 参与了很多项具备里程碑意义的机器人和大模型研究,其中最具代表性的有 PaLM-E、RT-2。

图片

随着 GPT-4 等大型语言模型与机器人研究的结合愈发紧密,人工智能正在越来越多地走向现实世界,因此相关的研究也正受到越来越多的关注。在这一领域,谷歌始终处于比较前沿的位置。(参考内容:《大模型正在重构机器人,谷歌 Deepmind 这样定义具身智能的未来》)

PaLM-E 是一种多模态具身视觉语言模型(VLM),2023 年 3 月发布。该模型集成了参数量 540B 的 PaLM 和参数量 22B 的视觉 Transformer(ViT),使用文本和来自机器人传感器的多模态数据(比如图像、机器人状态、场景环境信息等)作为输入,输出以文本形式表示的机器人运动指令,进行端到端的训练。PaLM-E 实现了对具身任务的决策方案预测,不涉及机器人动作的实际控制,需要依赖低级别的现成策略或规划器来将决策方案「翻译」为机器人动作。

RT-2 是全球第一个控制机器人的视觉 - 语言 - 动作(VLA)模型。这个模型让机器人不仅能解读人类的复杂指令,还能看懂眼前的物体(即使这个物体之前从未见过),并按照指令采取动作。比如,你让机器人拿起桌上「已灭绝的动物」。它会抓起眼前的恐龙玩偶。RT-2 被认为是机器人制造和编程方式的重大飞跃。

图片

只需要像对话一样下达命令,它就能在一堆图片中辨认出霉霉,并送给她一罐可乐。

图片

这些研究让谷歌 DeepMind 机器人团队始终保持着技术领先性,本月,团队有发布了用于控制机器人的新模型,这些模型的论文中还 4 次引用了 Florence 的成果。

核心团队来自 OpenAI、波士顿动力、DeepMind

在 Pete Florence 之外,这家公司的其他核心成员都来自知名科技公司。

同为谷歌 DeepMind 机器人团队前成员的 Kamyar Ghasemipour,也加入了 Generalist AI 成为创始成员。

图片

OpenAI 前工程负责人 Evan Morikawa,曾领导过 ChatGPT、GPT-4、DALL・E 和 API 上线,从 OpenAI 离职后加入了这家初创公司。

图片

团队成员还有前波士顿动力高级机器人科学家 Andrew Barry 和 Deep Mind 研究科学家 Andy Zeng。Andrew Barry 的个人主页显示,他担任的职位是联合创始人和 CTO。Andy Zeng 的社交媒体则没有透露更多信息。

图片

参考链接:

最新文章
Galaxy AI智能体验 小屏旗舰新选择:三星 Galaxy S24三星智能手机「Galaxy AI智能体验 小屏旗舰新选择:三星 Galaxy S24」
前言又到一年一度的活动前夕,相信不少小伙伴们都开始摩拳擦掌关注心仪的数码好物,这里跟大家推荐一款综合性能很高的。更为惊喜
JDK15(Java SE Development Kit 15) 15.0.2 官方正式版 Win64位java下载手机版「JDK15(Java SE Development Kit 15) 15.
Java Development Kit 15简称JDK15,是Java必备的一款开发工具包,包含Java运行环境、Java开发工具和Java基础类库源代码,JDK/Ja
三星首款三折叠屏手机曝光:10英寸 AMOLED 屏、内折叠设计引关注三折叠手机「三星首款三折叠屏手机曝光:10英寸 AMOLED 屏、内折叠设计引关注」
近日,有媒体曝光了三星即将推出的首款三折叠屏手机的细节,称其将采用10英寸的AMOLED屏幕,设计理念为内折叠,预计将在2026年面
iphone11像素多少苹果手机像素「iphone11像素多少」
“僻不当道者”的“当”指面对,动词。出自清代姚鼐的《登泰山记》。原文节选:亭西有岱祠,又有碧霞元君祠。皇帝行宫在碧霞元君
HMD 2024回顾hmd手机「HMD 2024回顾」
今年作为HMD而言是一场特殊的一年,HMD在今年的MWC上正式宣告了自有品牌HMD的诞生,不仅更换了全新的品牌logo,还有全新的产品研
谷歌澄清:“安卓手机连续锁定三天自动重启”功能尚未推出
IT之家 4 月 17 日消息,谷歌公司更新支持文档,明确“手机连续锁定三天自动重启”功能尚未正式推出,且未来将作为可选设置推广
新一轮医保基金监管拉开帷幕,这些变化值得关注
近期,国家医保局发布《2024年医疗保障事业发展统计快报》(以下简称《统计快报》),公布了参保情况、异地就医、生育保险、药耗
马来西亚姑娘定制成都“串门攻略”:欢迎来我“第二故乡”
  中新网成都4月16日电 题:马来西亚姑娘定制成都“串门攻略”:欢迎来我“第二故乡”  中新网记者 贺劭清  “去年我有四
【通知】关于做好健康体重管理门诊设置与管理工作的通知(附解读)
各省、自治区、直辖市及新疆生产建设兵团卫生健康委、中医药局:为深入贯彻落实党的二十大和二十届二中、三中全会精神,按照国家
上海“初夏”体验感上线!气温直冲30℃,出行游玩做好防晒
今天早晨上海的气温17℃起步,早间气温起步比昨天同期高了约1—2度,升温依旧,白天太阳公公勤勤恳恳,是舒舒服服的春日体感。午
推荐文章