人工智能将替代许多基础劳动已是不争的事实,人工翻译就被认为是一个会被AI影响的行业。实际上,人工智能在神经网络机器翻译领域早就有了诸多应用
人工智能将替代许多基础劳动已是不争的事实,人工翻译就被认为是一个会被AI影响的行业。实际上,人工智能在神经网络机器翻译领域早就有了诸多应用。例如,网易“有道翻译官”app中的语音对讲翻译和拍照翻译功能,就解决了语音和图像识别领域的翻译场景需求。
同为网易旗下产品,网易人工智能事业部近期推出的“网易见外”更进一步,把翻译应用场景拓展到了视频即时翻译领域。而在目前,网易是国内率先实现该技术并进行商业化探索的公司。
视频即时翻译能做什么?比方说,你肯定有犯愁找不到外国电影或者视频字幕的时候,特别是中文。但在“网易见外”网站(sight.netease.com),机器能对视频进行语音识别并自动翻译,生成双语字幕,大大增强了用户的观看体验。
所以,用“网易见外”能做什么?
结合了视频听翻技术的“网易见外”,可以说既是一个聚合海外短视频的资讯平台,也可以作为一款智能视频字幕制作的轻量工具来使用。
在“网易见外”的视频模块,你能够自由浏览和下载抓取自Youtube和Facebook热门频道的短视频,机器听写英文,同步翻译成中文,并自动切分好相应的时间轴,使视频自动带上双语翻译字幕,你再也不会因为英文不好而放弃去看国外有意思的短视频。
(网易见外人工智能技术为视频配上的双语字幕)
除了“网易见外”平台已有的视频素材,你也可以自己上传短视频进行翻译。一般等上三四分钟,机器就能把一段20分钟左右时长的视频翻译完成。
(在网易见外上传短视频进行翻译)
如果你还想把视频下载到本地另作他用,也可以在见外平台上将机器翻译的版本上进行一些人工校对。无论如何,也比传统人工视频翻译的效率高多了。
(网易见外的视频字幕校对页面)
目前,网易见外的视频翻译主打的还是英译中功能,后续也即将推出中译英视频翻译。据悉,中译英的语音识别与翻译的准确性将会变得更高。
“网易见外”视频翻译背后的三大技术
为了实现这个“almost黑科技”的视频听翻功能,网易见外集成了三大国际前沿人工智能技术:1、NMT神经网络机器翻译2、智能语音识别转写文字3、自动解析语音并即时切分时间轴。
在这三大技术加持下,网易见外最终实现了视频的高精度语音识别和即时翻译功能,能够一键生成双语字幕,并自动压制在视频中。
“神经网络机器翻译 ”,相比于短句翻译,NMT可以利用云语言与目标语言所有信息,使整个翻译决策过程连续化全局化,使得译文更流畅和可读。
“语音识别转文字”, 见外可根据后台的海量语料和场景模型,智能识别解析用户语音,具备强大纠错能力和智能推理能力。
“自动语音切轴”,通过判断讲话者语气来短句,智能切分时间轴,为字幕组听翻人员等需要制作输出字幕的用户群体极大地提高工作效率。
早在年初,网易见外的NMT技术就已在有道词典、有道翻译官等全线产品上线,成功地经过了超过6亿用户的每日验证。
据悉,网易见外的视频听翻中译英识别准确性已高于95%、翻译准确率高于85%;英译中识别准确率已高于80%、翻译准确率高于70%。随着人工智能的不断学习,其翻译准确率还将不断提升。
并非取代人工,更为提高效率和体验
采用这些人工智能技术的“网易见外”,并非为了取代人工翻译而生。
以传统字幕制作的流程而言,需要经过人工听写英文字幕、翻译、切分时间轴、校对、特效制作以及压制等一系列步骤。“网易见外”能完成其中语音听写、翻译、切分时间轴等相对固定的工作流程,字幕制作者只需要专注于进行后期校对和特效制作便可,节省出更多时间来发挥创造。
作为网易人工智能旗下产品,“网易见外”的愿景,首先是通过技术降低内容翻译的成本,提高翻译行业的生产效率。
更进一步,“网易见外”还志在打破跨文化交流边界,使国内外优质资源传播不再受语言不通的限制。把国外优质文化内容引进来,让中国优秀文化产品和最新的发展变化走出去,打造一个中国看世界、世界看中国的双向交流窗口。
随着AI技术落地的推进,网易人工智能还将提供更多好用的产品,催生创新商业模式,应用到更多行业场景,更关注内容和体验服务。
声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!