在当今的移动互联网领域,语音服务已经变得越来越重要,在移动端,语音输入由于具有相对于敲字键入的便捷与高效性,无疑已经成为趋势。而在不少创业者和投资人眼中,传统的搜索已成为过去时,基于语音、语义的搜索和应用服务才是未来。
前言
在当今的移动互联网领域,语音服务已经变得越来越重要,在移动端,语音输入由于具有相对于敲字键入的便捷与高效性,无疑已经成为趋势。而在不少创业者和投资人眼中,传统的搜索已成为过去时,基于语音、语义的搜索和应用服务才是未来。
近日国内知名企业搜狗,对于语音服务技术支持的选择也成为业内的焦点话题,其推出的“搜狗语音助手”首先选择了一家新兴企业——“云知声”,随后又植入第二家公司——“科大讯飞”作为支持,笔者将会在下文中对二者的表现做一些简单的对比测试,让大家能够深入了解其性能。
国内语音输入服务日渐成熟
随着Siri的“横空出世”,国内移动互联网行业便意识到了语音服务的重要性,在搜索引擎操作和社交移动服务领域内,利用语音的高效准确输入,受到大家的一致推崇。微信、QQ、米聊、陌陌我们都接触并使用过,大家是否发现这些社交软件的基本功能都大同小异,除了发信息、传图片也就没有什么了。
作为普通受众,我们从最开始的好奇,到后来的运用,只是单纯判断新服务的实用性,对于其后方的技术支持并没有给予更多关注。但站在行业领域,着重点更多在于语音服务的技术支持,而面对Siri不可避免的局限性,也是激发国内尖端技术人员为受众提供更全面的语音服务的原因之一。
目前在国内,这类专注于智能语音和语言处理技术的研究、开发和应用的移动互联网公司并不多见,实力却不容小觑。业内名声最大的可算1999年成立的科大讯飞公司,独立产品及合作机制双管齐下,具备良好的技术支持,在业内也有了很好的成绩,与多家大型企业合作,可算是“大公司大品牌”。
图1、安徽科大讯飞信息科技股份有限公司 图2、北京云知声信息技术有限公司
近日笔者在业内发现杀出一匹黑马,一家开放共赢的新兴企业,有一个诗情画意的名字——云知声。这家在2012年6月成立的公司,并没有“国企范儿”,而是秉承开放的心态,作为技术服务提供商,提供根植于移动互联网的专业语音识别服务。
主流语音识别对比小测试
日前,国内知名企业搜狗与科大讯飞、云知声合作,推出“搜狗语音助手”插件。据有关人士透露,搜狗也曾在两家公司之间难于选择,毕竟云知声作为一家成立只有半年多的创业公司,在业内还未得到足够的重视,相较于发展10余年的科大讯飞,云知声的成绩还是鲜为人知。但两家公司在技术实力方面旗鼓相当,在同款“搜狗语音助手”上的表现也不相上下。最终的结果是,搜狗在2012年11月首发时是选择了云知声,数月后才又加上了科大讯飞。
接下来,笔者将两家公司对于同款产品“搜狗语音助手”的技术服务支持做一个对比小测试,看一家从2009年开始从事语音识别技术的老牌企业——科大讯飞,与一家容纳国内10年实验室技术团队的新锐企业——云知声,在反应速度、识别能力和译字准确率方面的表现如何。
在本次的测试中,笔者的全部语音是使用相同循环录音进行输入,以保证对比的公平性和准确性。
【测试1】首先我们来看看在“搜狗语音助手”中,二者的集成方式有何区别。具体显示结果如图3、图4:
图3、科大讯飞语音输入界面 图4、云知声语音输入界面
测试1结果:从上图中我们可以清晰地看到,科大讯飞采用了传统语音输入的模式,弹出独立对话框进行语音输入。而云知声则是可定制的界面,在搜狗语音助手中是完全嵌入式语音输入,在同一界面中即可完成输入。当然,这样集成方式上的区别,就见仁见智了,笔者还是更倾向于嵌入式的音频显示,看起来更加清晰明了,不会覆盖前面的对话内容。
【测试2】专业词汇。词汇类别:软件开发。测试语句为:“软件设计包括设计软件的功能和实现的算法和方法、软件的总体结构设计和模块设计(普通话)”,得到以下测试结果,如图5、图6:
图5、科大讯飞专业词汇测试结果 图6、云知声专业词汇测试结果
测试2结果:通过专业词汇测试看出,二者对于中文普通话的识别率比较高,只要发音够标准,云知声的语音识别准确率几乎可达100%,另外对于整句话的逻辑性和条理性也非常清晰,专业词句也能够准确识别,并没有出现任何错别字。但科大讯飞在这轮的比拼中却略显劣势,逻辑性欠佳,并有错别字出现。
另外在测试中,笔者可以感受到云知声的反应速度是很快的,而科大讯飞可能要稍逊一筹。
【测试3】循环演说。测试内容为:“在微博网友中流传着一种‘黄金鸡蛋‘做法,让不少人跃跃欲试。疯狂地晃动你手中的生鸡蛋,将蛋黄和蛋清混合,带壳煮熟后,你就得到了一个’黄金鸡蛋‘!这种蛋儿童更易使用,不会把蛋黄末弄得到处都是。但是经过不少网友实践,似乎很难将蛋黄蛋清摇匀!求专家解答!你试过吗?(普通话连续说两遍)”,这样大段的内容陈述,看看结果如何,如图7、图8:
图7、科大讯飞循环演说测试结果 图8、云知声循环演说测试结果
测试3结果:从测试结果上来看,科大讯飞的输入时间是有一些限制的,对于大段文字的输入,讯飞可能还要扩充一下输入时间的限制范围。另外,在识别准确度上,云知声变现的更为突出,几乎没有错别字的出现。细心的朋友可能还会发现,用云知声输入的内容,有很好的“断句”,不会有冗长的句式出现。
【测试4】方言测试。方言语种为武汉话,测试语句为“搜狗语音输入插件”。测试结果如图9、图10:
图9、科大讯飞武汉方言测试结果 图10、云知声武汉方言测试结果
测试4结果:通过方言测试看出,两款插件对方言的识别情况欠佳,识别出来的语句基本没有任何调理和逻辑性。这也不奇怪,就算在现实沟通中,一个北方人到南方,也会经常有一些听不懂南方地区方言的情况出现。
【测试5】中英文混淆测试。测试内容为:“ipad mini真好看,I want to buy it”,这样大段的内容陈述,看看结果如何,如图11、图12:
图11、科大讯飞中英文测试结果 图12、云知声中英文测试结果
测试5结果: 从中英文混淆输入的测试结果中我们可以看到,科大讯飞能够准确辨别中英文,做出正确的判断及输出。而新生的云知声在对于中英文混合的识别准确率还有待提升。相比之下,科大讯飞不愧是有着数年的积累,云知声还应该继续努力,积累完善自己的技术。
总结
通过以上几个小测试,相信大家对科大讯飞与云知声语音识别输入技术有了一定的了解,二者相比各有特点,笔者认为在同款“搜狗语音插件”的表现上,科大讯飞与云知声的对比各有特色、势均力敌。相对而言,云知声作为一家新锐企业,依托其专业的技术团队和贴心的服务理念,在与搜狗的合作上,产品具有更好的准确性、更高的识别率、以及更快的反应速度等优势,而老牌科大讯飞在中英文辨别方面的表现更为突出。
在近日,热点话题人物老罗推出的锤子ROM系统中,语音识别技术也成为众人瞩目的焦点。“云知声”再次扮演黑马的角色,与“科大讯飞”同时入围了锤子科技的语音解决方案。由此来看,长久以来语音识别行业的垄断格局将被逐渐打破,整个行业也将迎来新一轮的迅猛发展,对于“云知声”和“科大讯飞”在未来的表现,我们也将拭目以待。
标签: 搜狗 语音 助手 选择 知声 对比 科大 讯飞 评测
声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!