首页 > 资讯列表 > 游戏 >> 游戏资讯

经过7万小时训练,OpenAI宣布做出了最强的《我的世界》AI

游戏资讯 2022-11-29 01:36:48 转载来源: 游研社

视频是种潜力巨大的培训资源。OpenAI最近公布了一项他们在人工智能领域的最新成果——最擅长玩《我的世界》的AI


视频是种潜力巨大的培训资源。

Open AI最近公布了一项他们在人工智能领域的最新成果——最擅长玩《我的世界》的AI。

厉害到什么程度?无论是建造地堡、金字塔这些复杂的建筑,跟游戏里的恶龙战斗,亦或是“白手起家”,制造出稀有的钻石工具都不在话下,这些任务即使是交给熟练的人类玩家来做,往往也需要数十分钟的流程以及上万个点击操作。


AI学会自己建造传送门

而该AI在经过训练后,则可以在没有任何外力辅助的情况下自主完成这一系列事件,这是此前其他AI都无法做到的。根据Open AI的介绍,能够实现这一成果,依靠的是在模仿学习(imitation learning)技术上的新突破。

在这项技术中,AI会被训练成通过观察并模仿人类的行为来完成相应的任务,此前很多效果都运用到了类似的原理,比如控制机械手臂或者驾驶汽车。

既然AI需要观察模仿,那么就势必需要一定量的素材,而单就“熟练操作《我的世界》”而言,各大视频网站上的学习素材其实已经非常多,完全能够满足AI的学习需要。


但问题是,还需要另一项额外的工作,即“让AI准确理解视频里的内容”。

《我的世界》是一款没有明确目标的游戏,虽然网上素材繁多,可并不能直接拿来当作学习资料,因为视频里的每个动作和操作,其实都需要人类为其贴上“标签”,也就是做出相应的注释,才能AI明白操作的含义。

如果每个动作都需要人工注释,那效率自然会降低,为了解决这个问题,研究人员想出了一项新方法——训练能够自动为视频操作贴标签的AI。

他们先是召集了一批志愿者玩家来操作游戏,并保留了玩家们的按键记录,在得到2000个小时的游戏数据后,研究人员训练了一个新的模型,并人工将按键操作与游戏里的效果一一对应,比如在什么情况下点击鼠标会让人物挥动斧头。

下一步便是用这个模型来处理网上海量的《我的世界》视频,为他们贴上让AI能够理解的标签。根据公布的数据,为了得到理想的效果,科研人员提供的视频素材长达70000个小时。

而这确实也获得了一定的成果,比如像开头说的那样,AI已经学会了如何自己制作钻石工具。而Open AI的负责人Bowen Baker表示:“我们觉得《我的世界》是一个很好的研究领域。”

由于《我的世界》没有明确的输赢且自由度极高,所以研究人员可以训练AI执行更多复杂的任务,而他们认为这些工作最终可以反哺到现实——如果AI能在游戏里设计一张桌子,那么在现实里没准也行。

标签: 经过 7万 小时 训练 OpenAI 宣布 出了 强的 我的世界


声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持