AI资讯

英伟达新研究:机器人自己学会找活干,还能看论文反思

智能摘要

预算,并设定了一个简单目标:尽可能快速地完成任务,让机器人保持忙碌但确保安全,不要浪费宝贵的计算资源。表示,机器人可以整夜不间断自我改进,而研究人员只需要在早上看训练报告就可以了。表示将开源这一技术,科技爱好者也可以在家托管自己的自动运行机器人实验室。

机器人学会自主进化

6月17日, 英伟达GEAR实验室联合负责人Jim Fan发布了一段视频, 宣布他们的机器人首次在物理世界中达成了完全自主运作。这表明机器人不再需要人类逐个动作手把手地教导, 而是能够如同人类一样自主性地去观察、去思考、去尝试以及去进步。团队给机器人设定了一个简单目标: 以尽可能快的速度来完成任务, 维持忙碌状态但要确保安全, 不造成计算资源的浪费。

仅仅是研究人员给机器人提供了一个通向物理世界的API接口, 而其余的所有都是AI自行进行探索发现的, 机器人进而开始学会寻觅视觉线索, 开始学会重置操作场景还开始练习新技能, 甚至还能在线阅读论文并且相互辩论, 这种具备自主进化的能力, 致使机器人能够一整夜都不间断地进行自我改进。

英伟达新研究:机器人自己学会找活干,还能看论文反思

八个智能体分工协作

此次实验启用了8个, 彼Codex智能体, 每个智能体皆配备了机器人硬件, 以及GPU计算资源, 还有充足的Token预算, 这些智能体并非各自为战, 而是构成了一个完整的工作团队, 有的负责观察环境, 有的负责执行动作, 还有的负责分析结果和提出改进提案。

实验在这种团队协作模式之下变得更为高效, 一旦有一个智能体碰到了遭遇阻碍的情况, 它就会自主转向别的任务, 或者与别的智能体展开探讨, 去寻觅解决办法。科研人员宣称, 机器人的学习速度在这种分工协作机制下比传统办法快了好多倍。

高精度任务轻松完成

新型框架给予助力后, 机器人已然具备独立完成高精度任务的能力, 像系扎带这般需要精准把控力度和位置的操作, 即需要精确控制力度和位置乃系扎带的该种操作, 机器人得以反复练达致臻之境, 于整理钉子这类看似简易实则需精细视觉识别的任务上, 机器人同样能够精准达成。

更让人意想不到的是, 机器人学会了把显卡插入电脑主板, 这一操作对人类而言都需特定技巧, 可是机器人依凭自主学习掌握了恰当的插入角度与力度, 这些成果显示, 机器人在精细操作层面已然达到实用水准。

夜间自我改进不停歇

Jim Fan着重指出, 机器人能够一整个夜晚都持续不断地自行改进, 而研究人员仅仅只需在早晨查看那个训练报告就行。这表明机器人实验室能够达成24小时未曾有人值守的运转, 极大地提升了研发效率。机器人它会在夜间持续不断地尝试新的操作方式, 记录下失败的缘由, 并且自动去调整参数。

让机器人能力于短时间内得以快速提升的是这种自主训练模式, 研究人员发现, 机器人在夜间训练期间常常能够发觉白天被忽视的优化方案, 一位团队成员称, 早上查看训练报告之际, 常会被机器人的创新方法给惊奇到。

开源技术触手可及

Jim Fan称, 英伟达会把这个技术框架进行开源, 这表明科技爱好者在家也能够托管自身的自动运行机器人实验室, 在开源以后, 普通开发者能够借助该框架搭建自己的机器人训练系统, 而不需要昂贵的专业设备。

包含齐整代码、文档以及使用指南的开源版本会存在。仅需准备好基本的机器人硬件, 还有一台配备了GPU的电脑的用户, 便能够着手训练自身的机器人。英伟达怀着借助开源去推进机器人技术普及的期望, 要让更多的人投身至这一领域展开研究当中。

论文成果已经公开

已经发布相关研究论文的英伟达GEAR实验室, 详细介绍了那个编码智能体框架的技术细节, 论文里阐述了怎样把现实世界的机器人学习转化为可控的优化过程, 以及怎样让多个智能体协同工作, 感兴趣的读者能够通过附带的链接下载查阅。

通过该项研究, 为机器人自主学习开拓出一类全新途径, 传统的机器人训练需大量人工介入干涉, 然而如今使得机器人能够如同人类一般经由持续反复试运行来自我提升, 研究人员觉得, 这样的自主学习模式会加快 robot 在工业生产制造、住宅家庭服务等范畴领域的运用。

机器人自行掌握系扎带、插显卡的技能, 你认为未来什么样的工作最易于被机器人替代呢? 欢迎于评论区交流你的见解, 点赞并转发以使更多人瞧见这个突破。

相关文章