DaoAI World在线虚拟世界数据标注和训练平台，人工智能以新方式学习

2024-01-04 09:34

信息化观察网

刘艺

如今，强人工智能机器人的工作包括任何可以探测和改变自身环境的代理。虽然在机器人技术中，人工智能代理始终生活在机器人体内，但现实模拟中的现代代理可能拥有虚拟身体，或者它们可能通过移动摄像机的有利位置来感知世界，而该摄像机仍然可以与周围环境进行交互。

"智能生物通过与世界互动来学习。人工智能研究人员采用了类似的策略来教授他们的虚拟代理新技能。

人工智能通过敲打东西进行实验，最终找到一个有用的工具——一条通往目标的坡道。

2009年，当时普林斯顿大学的计算机科学家李飞飞发明了一个将改变人工智能历史的数据集。该数据集被称为ImageNet，包含数百万张标记图像，可以训练复杂的机器学习模型来识别图片中的某些内容。2015年，这些机器的识别能力超过了人类。不久之后，李开始寻找她所说的另一颗“北极星”，这将为人工智能向真正的智能提供不同的推动力。

李飞飞："当我在休产假时，我曾经仔细考虑如何才能真正帮助这一代人的发展。我把它视为自己努力的方向。我和我的一名博士生Olga Russakovsky发起了一个实验项目，斯坦福人工智能实验室。"

Olga Russakovsky后来成为普林斯顿大学的副教授,培养了zhiwei deng这样的人工智能博士。

她通过回顾5.3亿年前的寒武纪大爆发找到了灵感，当时许多动物物种首次出现。一个有影响力的理论认为，新物种的爆发部分是由于能够第一次看到周围世界的眼睛的出现所驱动的。李意识到，动物的视觉从来不会单独产生，而是“深深地嵌入到一个整体的身体中，需要在快速变化的环境中移动、导航、生存、操纵和改变，”她说。“这就是为什么我很自然地转向更积极的愿景（人工智能）。”

如今，李的工作重点是人工智能代理，它们不仅可以接受数据集中的静态图像，还可以在三维虚拟世界的模拟中四处移动并与环境交互。

这是“强人工智能机器人”这一新领域的宏伟目标，而李并不是唯一一个拥抱这一目标的人。它与机器人技术重叠，因为机器人可以在物理上等同于现实世界中的具体人工智能代理，而强化学习则始终训练交互式代理使用长期奖励作为激励来学习。但李和其他人认为，实体人工智能可以推动机器从学习简单的能力（例如识别图像）到学习如何通过多个步骤执行复杂的类人任务（例如制作煎蛋卷）的重大转变。

“自然，我们变得更加雄心勃勃，我们说，‘好吧，构建一个具身智能怎么样？’到那时，你就会想到强人工智能机器人，”DaoAI Robotics首席技术官Xiaochuan Chen说。

以下视频来源于国际机器视觉研究

如今，强人工智能机器人的工作包括任何可以探测和改变自身环境的代理。虽然在机器人技术中，人工智能代理始终生活在机器人体内，但现实模拟中的现代代理可能拥有虚拟身体，或者它们可能通过移动摄像机的有利位置来感知世界，而该摄像机仍然可以与周围环境进行交互。“体现的意义不是身体本身，而是与环境互动和做事的整体需求和功能，”李说。

这种交互性为智能体提供了一种全新的——而且在许多情况下，更好的——了解世界的方式。这是观察两个物体之间可能的关系与亲自实验并导致这种关系发生之间的区别。人们认为，有了这种新的认识，更大的智慧就会随之而来。随着一套新的虚拟世界的启动和运行，具体的人工智能代理已经开始发挥这一潜力，在新环境中取得重大进展。

德国奥斯纳布吕克大学的实体人工智能研究员维维安·克莱(Viviane Clay)表示：“目前，我们没有任何证据证明智能的存在不是通过与世界互动来学习的。”

迈向完美模拟

虽然研究人员长期以来一直希望创建真实的虚拟世界供人工智能代理探索，但直到过去五年左右他们才开始构建它们。这种能力来自于电影和视频游戏行业推动的图形改进。2017年，人工智能代理可以在第一个虚拟世界中如鱼得水，真实地描绘室内空间——字面意义上的（尽管是虚拟的）家庭。由艾伦人工智能研究所的计算机科学家开发的名为AI2-Thor的模拟器可以让特工在自然的厨房、浴室、客厅和卧室中漫步。特工可以研究随着他们移动而变化的三维视图，当他们决定仔细观察时会暴露出新的角度。

这样的新世界也让智能体有机会推理新维度的变化：时间。“这是很大的区别，”西蒙·弗雷泽大学计算机图形学研究员马诺利斯·萨瓦(Manolis Savva)说，他构建了多个虚拟世界。“在具体的人工智能环境中……你拥有这种时间上连贯的信息流，并且你可以控制它。”

这些模拟世界现在足以训练智能体完成全新的任务。他们不仅可以识别一个物体，还可以与它交互、拿起它并在它周围导航——看似很小的步骤，但对于任何智能体了解其环境来说都是必不可少的。到2020年，虚拟代理超越了视觉，能够听到虚拟物体发出的声音，提供了另一种了解物体及其在世界中如何工作的方式。

可以在虚拟世界（例如此处所示的DaoAI World环境）中运行的具体AI代理以不同的方式学习，并且可能更适合更复杂的类人任务。

由DaoAI Robotics提供

这并不是说工作已经完成。普林斯顿大学人工智能博士后研究员邓志伟(Zhi Wei Deng)表示：“即使是最好的模拟器，它也比现实世界更不真实。”Deng师从李飞飞的得意门生Olga Russakovsky，现在是DaoAI Robotics的首席科学家。重点研究人工智能在虚拟世界中模仿现实生活中的物理现象，例如某些物体如何在一个区域是刚性的而在其他区域是柔软的。

“这确实很难做到，尤其计算机视觉还要应对各种环境光的干扰”Deng说。“这是一个巨大的研究挑战。”

尽管如此，人工智能代理以新的方式开始学习就足够了。

比较神经网络

到目前为止，衡量实体人工智能进展的一种简单方法是将实体代理的性能与在更简单的静态图像任务上训练的算法进行比较。研究人员指出，这些比较并不完美，但早期结果确实表明，具体的人工智能代理的学习方式与它们的祖先不同，有时甚至更好。

在最近的一篇论文中，研究人员发现，具体的AI代理在检测指定对象方面更加准确，比传统方法提高了近12%。艾伦人工智能研究所的合著者、计算机科学家Roozbeh Mottaghi表示：“目标检测社区花了三年多的时间才达到了这一水平的改进。”“仅仅通过与世界的互动，我们就取得了很大的进步，”他说。

其他论文表明，当您将传统训练的算法放入具体形式并允许它们探索虚拟空间一次，或者当您让它们四处移动以收集对象的多个视图时，对象检测会在传统训练的算法中得到改进。

研究人员还发现，实体算法和传统算法的学习方式根本不同。作为证据，请考虑神经网络——每个具体算法和许多非具体算法的学习能力背后的基本要素。神经网络是一种具有多层人工神经元连接节点的算法，大致模仿人脑网络。在两篇独立的论文中，一篇由克莱领导，另一篇由纽约大学即将上任的教授格蕾丝·林赛(Grace Lindsay)领导，研究人员发现，实体代理中的神经网络对视觉信息做出活跃反应的神经元较少，这意味着每个神经元的响应能力更强。对它会做出反应的内容有选择性。非实体网络的效率要低得多，并且需要更多的神经元在大部分时间处于活动状态。Lindsay的团队甚至将实体和非实体神经网络与活体大脑（小鼠视觉皮层）中的神经元活动进行了比较，发现实体版本是最接近的匹配。

Lindsay很快指出，这并不一定意味着具体版本更好——它们只是不同而已。与物体检测论文不同，Clay和Lindsay的工作比较了相同神经网络中的潜在差异，让代理执行完全不同的任务-因此他们可能需要工作方式不同的神经网络来实现他们的目标。

但是，虽然将具身神经网络与非具身神经网络进行比较是衡量进步的一种标准，但研究人员对提高具身代理在当前任务上的表现并不真正感兴趣；该工作线将使用传统训练的人工智能单独继续进行。真正的目标是学习更复杂的、类似人类的任务，这就是研究人员最兴奋地看到令人印象深刻的进展迹象的地方，特别是在导航任务方面。在这里，智能体必须记住目的地的长期目标，同时制定计划以确保到达目的地时不会迷路或撞到物体。

在短短几年内，由Meta AI研究总监、佐治亚理工学院计算机科学家Dhruv Batra领导的团队迅速提高了一种称为点目标导航的特定类型导航任务的性能。在这里，代理被放置在一个全新的环境中，并且必须在没有地图的情况下导航到相对于起始位置的目标坐标（“前往北边5米、东边10米的点”）。通过为代理提供GPS和指南针，并在Meta的虚拟世界（称为AI Habitat）中对其进行训练，“我们能够在标准数据集上获得超过99.9%的准确度，”Batra说。本月，他们成功地将结果扩展到更困难、更现实的场景，其中代理没有GPS或指南针。该代理纯粹通过根据移动时看到的像素流来估计其位置，准确率达到了94%。

“这是一个了不起的进步，”莫塔吉说。“然而，这并不意味着导航是一项已解决的任务。”在某种程度上，这是因为许多其他类型的导航任务使用更复杂的语言指令，例如“经过厨房去取卧室床头柜上的眼镜”，准确率仍然只有30%到40%左右。

但导航仍然是嵌入式人工智能中最简单的任务之一，因为代理在环境中移动而不操纵环境中的任何东西。到目前为止，实体人工智能代理还远未掌握任何与物体相关的任务。部分挑战在于，当代理与新对象交互时，有很多方法可能会出错，而且错误可能会堆积起来。目前，大多数研究人员通过选择只需几个步骤的任务来解决这个问题，但大多数类似人类的活动，例如烘焙或洗碗，都需要对多个对象进行长序列的操作。为了实现这一目标，人工智能代理需要更大的推动力.

DaoAI Robotics的团队创建了名为DaoAI World的虚拟世界。他们希望提高模拟速度，直到具体的AI代理能够在短短20分钟的时间内达到20年的模拟经验。由DaoAI Robotics提供

在这方面，DaoAI Robotics可能走在了最前沿，DaoAI Robotics开发了一个数据集，该数据集能够为体现人工智能做出贡献，这是一个标准化的模拟数据集，其中包含100个类人活动的工业场景，4000万张真实和虚拟的工业场景数据,供代理完成，可以在任何虚拟世界中进行测试。通过创建将执行这些任务的代理与人类执行相同任务的真实视频进行比较的指标，新数据集将使Robotics能够更好地评估虚拟人工智能代理的进度。

一旦智能体成功完成这些复杂的任务，模拟的目的视为终极可操纵空间：现实世界的训练。

DaoAI World虚拟世界是机器人研究中最重要和最令人兴奋的领域之一。

新的机器人前沿

机器人本质上是具体化的智能体。通过居住在现实世界中的某种物理身体，它们代表了最极端形式的具体人工智能代理。但许多研究人员现在发现，即使是这些智能体也可以从虚拟世界的训练中受益。

“（机器人领域）最先进的算法，例如强化学习和此类算法，通常需要数百万次迭代才能学习有意义的东西，”莫塔吉说。因此，训练真正的机器人执行困难任务可能需要数年时间。

但首先在虚拟世界中训练它们提供了比实时训练更快的机会，并且数千个代理可以在数千个略有不同的房间中同时训练。此外，虚拟训练对于机器人和其路径上任何附近的人类来说也更安全。

2018年，许多机器人专家开始更加认真地对待模拟器，当时OpenAI的研究人员证明了将技能从模拟转移到现实世界是可能的。他们训练了一只机械手来操纵一个它只在模拟中见过的立方体。最近的成功使飞行无人机能够学习如何避免空中碰撞，自动驾驶汽车能够在两个不同大陆的城市环境中部署，四足狗形机器人能够同时在瑞士阿尔卑斯山完成一小时的徒步旅行这需要人类。

未来，研究人员还可能通过虚拟现实耳机将人类送入虚拟空间，从而缩小模拟与现实世界之间的差距。NVIDIA机器人研究高级总监、华盛顿大学教授Dieter Fox指出，机器人研究的一个关键目标是制造对现实世界中的人类有帮助的机器人。但要做到这一点，他们必须首先接触人类并学习如何与人类互动。

福克斯说：“利用虚拟现实让人类进入这些模拟环境，让他们能够展示事物并与机器人互动，这将非常强大。”

无论它们存在于模拟还是现实世界中，具体的人工智能代理都在像我们一样学习，处理与我们日常执行的任务更相似的任务。该领域正在各个方面同时取得进展——新世界、新任务和新学习算法。

“我看到了深度学习、机器人学习、视觉甚至语言的融合，”李说。“现在我认为，通过这个面向具体人工智能的登月计划或北极星计划，我们将学习智能或人工智能的基础技术，这确实可以带来重大突破。”

资料来源于网络,小编按中文语境进行修改,版权属于原文和提供方公司。

THEEND

本文系信息化观察网原创文章，转载请注明出处、作者和本文链接。若违规转载使用，本网站将保留追究的权利。

本月热门

精选文章

热点资讯

市场规模接近全球六成，我国平板显示掩膜版产业仍存短板

DaoAI World在线虚拟世界数据标注和训练平台，人工智能以新方式学习

2026 信息化观察网

长按扫描二维码阅读原文