AlphaGo背后的DeepMind最近有了新动向,它与哈佛大学的研究人员合作研发出了一套可以读懂唇语的软件。在哈佛大学最新发表的论文中,他们研发的这个唇语阅读软件LipNet准确率高达93.4%
AlphaGo背后的DeepMind最近有了新动向,它与哈佛大学的研究人员合作研发出了一套可以读懂唇语的软件。
在哈佛大学最新发表的论文中,他们研发的这个唇语阅读软件LipNet准确率高达93.4%。这个准确率远高于此前研发出来的其他唇语设备。
哈佛大学的研究人员称,这是因为他们采用了不同的方法来训练LipNet的算法。为了让它能更准确的理解唇语,他们给计算机输入了近3万个带有情境的视频片段,每个片段有3秒时长,然后训练算法去匹配每个片段中每条句子对应的唇形和发音,而不是让其匹配每个单词的唇形和发音。
通过这个训练,他们的算法就能根据上下文情境,从单个单词的提示就能预测出整个句子。
但论文中提到如此高的准确率也遭受了质疑。因为在该研究中,他们用来训练算法使用的视频片段是经过精心挑选的。
这些视频中的人脸必须面向屏幕,说话时唇形要很明显,而使用的句法必须是标准的。但在真实的语言环境下,人们说话时所使用的句法并不是完全标准的。
Open AI的人工智能方面的专家Jack Clark称,如果要想将这项技术应用到实际情境中,至少还需要在三个方面进行改进,包括增加人们实际对话场景的视频片段,实现多个角度识别唇语以及让算法能预测更多的短语组合或句式。
他还提到称,如果能在实际情境下应用,它会很有用,比如用到助听器中,或者被用来提高人工智能识别语音的准确度和反应速度上。
也有批评认为,它的应用也对公民的言论自由造成了威胁。
不过目前来看,这一切现在看起来还有点远。
标签: DeepMind 最近 做了 个新 软件 它能 读懂 唇语
声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!