行业新闻

TR35|SergeyLevine：提高机器人任务能力的关键，就是让它成为“自学小能手”|新智造

2023-11-27 03:41 阅读次数：

本文摘要：美国时间8月23日，《麻省理工科技评论》发布了第16届TR35榜单，即全球35名35岁以下青年创新者榜单。各路精英在创造力、毅力、管理能力方面都可谓翘楚，他们的创意领域牵涉到医疗、能源、计算机和先进设备电子器件；他们的事业舞台涵括初创公司、研发机构和企业巨头。他们是各自领域的领军人物。而加州大学伯克利分校机器人学专家Sergey Levine乃是其中的一员。

吉祥手机官网登录

美国时间8月23日，《麻省理工科技评论》发布了第16届TR35榜单，即全球35名35岁以下青年创新者榜单。各路精英在创造力、毅力、管理能力方面都可谓翘楚，他们的创意领域牵涉到医疗、能源、计算机和先进设备电子器件；他们的事业舞台涵括初创公司、研发机构和企业巨头。

他们是各自领域的领军人物。而加州大学伯克利分校机器人学专家Sergey Levine乃是其中的一员。在今年三月的棋士人机大战中，谷歌人工智能AlphaGO击败了世界最杰出的棋士运动员李世石，让人们深深感慨当今人工智能的强劲力量。

当时，Sergey Levine正在谷歌公司工作。在这九个月的工作时间中，他亲眼目睹了人工智能的胜利，在敬佩AlphaGo在机器学习领域所获得的成就的同时，他找到了这个强劲的棋士游戏算法中不存在的一个显著缺点。

他大笑称之为：纵使它们（程序）需要战胜世界最篮的棋士运动员，但它们未曾特地拿起过一枚棋子。众所周知，机器人具有强劲的大脑，它们充足聪慧，运算速度超快，需要已完成人类无法已完成的工作。然而，它们也不存在一个劣势：一些在人类显然最少见最简单的动作（比如甩桌子、捉杯子等），它们做到一起十分艰难。

因此，它们要成功地已完成这些任务，自学能力非常最重要。而Sergey Levine在做到的，就是教会机器人自学。让机器人吸取经验、自学成才在谷歌研究所中，14只机器人手臂放在一起，倒数数月地拾起有所不同的物品，轻的、重的、施明德的、大的、小的、软的、硬的、还有半透明的。而这正是Sergey Levine团队正在展开的项目。

日复一日地拾起物品听得一起有点傻，但Sergey Levine实在这种方法独一无二、意义根本性。要教会机器人已完成一个动作，传统的方法首先要让机器人去辨识、辨别有所不同的物体，然后要通过重复的训练，最后才能实现目标。这种方法在教会机器人已完成非常简单的任务（比如拧上瓶盖）时还算数凑效，但这个训练过程漫长而无色。另外，在面临简单的任务时，这种方法的效果并不显著。

而Sergey Levine团队的方法却与传统方法截然不同，它的关键之处在于将早已十分出众的图像识别分类算法用作机械臂，让机器人能从先前的成功经验中自学。首先，Levine给机械臂原作一些手头上很更容易解决问题的目标(比如拧上瓶盖)，已完成之后机械臂就可以总结之前的顺利案例，并借此自学经验，便利已完成今后的任务。同时，机器人不会观测视觉系统数据如何同构到机械臂的电机信号，从而正确地已完成任务。此外，机器人还不会监督自己的自学过程。

而之所以要让这14只机械臂日复一日地拾起有所不同的物品，就是为了让它们需要自学有所不同物品的有所不同经验，从而将经验中用其他的物品之上。Levine回应：这是对机器自身不道德的逆向工程。

这样，它就可以将自学到的科学知识应用于到随后的涉及任务中，这样机器人就不会更加聪慧。用卷积神经网络“调教”机器人只不过，要教会机器人拾起有所不同的物体非常复杂，因为传感器数据和实际行动之间没显著的必然联系，特别是在是当大量传感器数据一下子黄泥来时。为了解决这一点，Sergey Levine团队让机械臂杂乱地用于单目视觉控制器、深度卷积神经网络来拾起目标物（如杯子、胶带座和玩具海豚），从而预测捕捉的结果。

机器人的度卷积神经网络不会大大展开自我再行训练（最初有许多次告终，但慢慢不会开始恶化）。最开始，团队所运用的机械臂并没那么多，后来为了减缓这一进程，团队分段投放了 14 只机械臂来研究这一问题。这一系列过程是几乎自律的，人类所必须做到的就是把箱子填充然后关上电源等着机器人主动已完成任务才可。

经过一年训练后，手臂需要自己捕捉并拾起小物体。但是，机械臂的编程信息一般来说是用来辨识物体并按照预计的程序作出反应，无法像人类一样根据周围的环境作出转变。那么问题就来了：对于可预测的物体和环境，机械臂可以精彩应付，但是它们可以捕捉根本没见过的物体吗？为了探究这一点，Sergey Levine让机器人手臂伸进随机装进物体的盒子里，让它们凭藉运气随机捕捉物体。

在一天之后，他搜集机器人尝试捕捉物体的数据，然后用这些数据训练神经网络，让捕捉物体的结果更为理想。在80 万次（相等于 3000 小时的机器人训练）捕捉行动之后，机械臂就可以自动缺失自己的行动了。迅速，他们就可以更为成功地捕捉物体了，甚至不会使用某种策略，如冲出一个物体去捕捉另外一个物体，或者去捕捉坚硬的物体而不是柔软的物体等。

在机械臂已完成所有这些任务的过程中，没程序员撰写系统告诉他他们该怎么捕捉物体，但它们可以从自己的经验中自学。此外，它们还能用于对系统环路，将捕捉物体的失败率减少到18%。

现在，Sergey Levine研究的机器人早已剑法了“抓物绝学”，不过，要想要从实验室回头到真实世界，并能精彩应付变化多端的环境、有所不同的目标物、有所不同的光照条件及有所不同程度的磨损，这些机械臂还必须很长一段时间的“调教期”。目前，Sergey Levine想将他们的研究扩展到更加长的领域中，然后在实验室之外的其他多种现实环境中展开尝试。我们期望这些机器人需要“学有所成“，沦为更为聪慧、更加有“灵魂”的机器人。

新的智造为(公众号：)旗下专心于机器人的公众号，我们注目机器人的现状与未来，以及与机器人融合的涉及产业。感兴趣的朋友可加到微信号AIRobotics，或是必要扫瞄下方二维码展开注目！原创文章，予以许可禁令刊登。

下文闻刊登须知。

本文关键词：TR35,SergeyLevine,提高,机器人,任务,能力,的,关键,吉祥手机官网登录

本文来源：吉祥手机官网登录-www.detective-belarus.com

Menu

TR35|SergeyLevine：提高机器人任务能力的关键，就是让它成为“自学小能手”|新智造