万维读者网 > 数码科技 > 正文  

给机器人配AI大脑!谷歌发布视觉语言行动模型

www.creaders.net | 2023-07-29 09:17:28  华尔街见闻 | 0条评论 | 查看/发表评论

给机器人配AI大脑!谷歌发布视觉语言行动模型

谷歌正在把先进的人工智能(AI)模型植入机器人,给机器人配一个AI大脑。

美东时间7月28日周五,谷歌公司宣布推出应用于机器人领域的新产品——名为Robotics Transformer 2(RT-2)的AI模型。它是一种全新的“视觉-语言-行动”(VLA)模型,可以帮助训练机器人理解扔垃圾等任务。

谷歌介绍,RT-2基于Transformer模型,根据互联网上的文本和图像进行训练,直接指示机器人执行动作。就像用语言模型通过网络文本训练AI学习人类社会的思想和概念一样,RT-2也可以通过网络数据,将相关知识告知机器人,指导机器人的行为。

谷歌举例称,如果我们要让以前的机器人系统做出扔垃圾的动作,就必须明确训练机器人懂得区分何为垃圾,以及捡起垃圾、扔掉它这些动作。而RT-2能将网上的相关知识传给机器人,让机器人无需明确的训练,就懂得垃圾是什么,甚至即便从未受过如何扔垃圾的训练,也知道怎么扔垃圾。

谷歌表示,RT-2具有将信息转化动作的能力,借助它,机器人有望更快适应全新的情形和环境。

因为在6000多次测试RT-2 模型的机器人试验后,谷歌的团队发现,面对训练数据中已有的任务、或者说“见过”的任务,RT-2和它的前代RT-1一样发挥功能,没有差别。而在新颖的、之前从未见过的任务情形中,RT-2的性能几乎提高一倍,成功率达到62%,远超RT-1的32%。

换句话说,通过RT-2,机器人能像人类一样学习更多内容,将学到的概念应用于全新的情境中。

谷歌称,RT-2显示出超越其所接触机器人数据的推广应用能力和语义、视觉理解能力,包括解释新的命令,并通过基本的推理响应用户的指令,比如关于物体的类别和高层次描述的推理。

谷歌的研究还表明,通过结合思维链的推理,RT-2能执行多阶段的语义推理,比如判断哪种物体可以临时用作锤子,哪一类饮料最适合疲劳的人。

有媒体周五称,谷歌目前没有立即计划大规模发布或者出售应用RT-2的机器人,但最终,这些机器人可能用在仓库或者用作家庭助理。

   0


24小时新闻排行榜 更多>>
1 信号越来越危险 天真的要塌了
2 遭断然拒绝!华为和中兴再传噩耗
3 太子党绝地反击 血雨腥风即将上演?
4 一直在做最坏准备 所有人都被习骗了?
5 后果难料:上海、深圳出现的四大怪象

48小时新闻排行榜 更多>>
1 7月1日后入境中国 或会被检查手机电脑
2 中国人因这种“调味料”导致的死亡率居全球
3 5万中国申请人凉凉 这类签证申请全部无理由
4 深圳女子激烈同房大出血 男伴袒露身份 网友
5 信号越来越危险 天真的要塌了
6 快讯:布林肯警告后 美宣布制裁20多家中国
7 三中全会迟迟不开,可能因为彭丽媛问题
8 遭断然拒绝!华为和中兴再传噩耗
9 太子党绝地反击 血雨腥风即将上演?
10 一直在做最坏准备 所有人都被习骗了?
热门专题
1
以哈战争
6
中共两会
11
秦刚失踪
2
中美冷战
7
台湾大选
12
火箭军悬案
3
乌克兰战争
8
李克强猝逝
13
台海风云
4
万维专栏
9
中国爆雷
14
战狼外交
5
美国大选
10
李尚福出事
15
普里戈津
一周博客排行 更多>>
1 蔡奇执掌中枢 却是一只无牙老 胡亥
2 灭掉胡锦涛团派 邓江习一脉相 胡亥
3 曾华
4 冥冥善恶终有报——回顾世纪审 流岛
5 犹太人和华裔教育孩子的特点和 汪翔
6 吕洪来:中共二十届三中全会的 老陆
7 “都是我的好学生!” Winston Sm
8 误入美帝歧途的海华有救了/人 体育老师
9 1944年,飞虎队员拍摄的彩色昆 弓长贝占郎
10 突破“茧房”还是自我“觉醒” 寂静之声
一周博文回复排行榜 更多>>
1 误入美帝歧途的海华有救了/人 体育老师
2 妙趣横生看台湾圆山大饭店 花蜜蜂
3 二战后,但凡涉及大国的战争, 随意生活
4 抗俄援乌:美国史上最划算一场 马黑
5 灭掉胡锦涛团派 邓江习一脉相 胡亥
6 印度裔和华裔在孩子教育上的差 汪翔
7 中共这次该倒大霉了! 山蛟龙
8 军工复合体之出处 随意生活
9 是“划算”还是缺德? 老農民
10 天下乌鸦一般黑? 南来客
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2024. CyberMedia Network/Creaders.NET. All Rights Reserved.