首页 > 资讯列表 >  本页面生成语音设备专题报道,语音设备滚动新闻,语音设备业界评论等相关报道!
  • 奇富科技机器人团队语音论文入选INTERSPEECH2023

    奇富科技机器人团队语音论文入选INTERSPEECH2023

    6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...

    业界动态 2023-06-01 12:40:34
  • Meta头显设备首次亮相,或成苹果最大竞争对手

    Meta头显设备首次亮相,或成苹果最大竞争对手

    Apple Inc.头显的推出无疑将成为今年混合现实领域的最大新闻。但苹果不会独占市场。Meta Platforms Inc...

    手机互联 2023-05-30 11:43:58
  • 终于来了,OpenAI发布iOS版ChatGPT,支持语音提问

    终于来了,OpenAI发布iOS版ChatGPT,支持语音提问

    5月19日消息,当地时间周四,OpenAI发布iOS版ChatGPT应用,美国的iPhone用户可以通过苹果应用商店免费下载安装。OpenAI承诺,未来还计划将ChatGPT应用登陆Android设备...

    业界动态 2023-05-19 07:31:13
  • 谷歌升级FindMyDevice:扩展类别、数亿台安卓设备构建追踪网络

    谷歌升级FindMyDevice:扩展类别、数亿台安卓设备构建追踪网络

    IT之家5月11日消息,谷歌效仿苹果和Tile的定位追踪解决方案,在I/O2023开发者大会上宣布升级FindMyDevice平台。谷歌的SameerSamat宣布,FindMyDevice平台在“未来几个月内”支持追踪耳机、平板电脑和其他产品类别...

    手机互联 2023-05-11 10:12:21
  • AI语音诈骗日益猖獗:实现95%模拟人声、77%接通者遭经济损失

    AI语音诈骗日益猖獗:实现95%模拟人声、77%接通者遭经济损失

    IT之家5月6日消息,根据McAfee公布的最新报告,基于人工智能(AI)的语音诈骗日益猖獗,在接到诈骗电话的群体中,77%的人会导致经济损失。报告中提及了两个真实案例,其中一个通过AI模拟受害者亲人,表示因某些事情急需要钱;另一个通过AI模拟女儿,向其母亲勒索赎金,但事实上她的女儿并未被绑架...

    智能设备 2023-05-07 12:43:16
  • 三星GalaxyS22Ultra手机创造历史:完成首个卫星语音通话

    三星GalaxyS22Ultra手机创造历史:完成首个卫星语音通话

    IT之家4月26日消息,三星GalaxyS22Ultra近日创造了新的历史:成为全球首款可拨打卫星语音电话的智能手机。美国电信运营商AT&T和ASTSpaceMobile公司合作,使用未经修改的标准手机,实现美国得克萨斯州和日本之间的卫星通话...

    手机互联 2023-04-27 14:56:05
  • 苹果即将推出首款AR/VR头显设备,采用双接口

    苹果即将推出首款AR/VR头显设备,采用双接口

    4月23日,有消息称苹果即将推出首款AR/VR头显设备,毕竟是首次推出,此消息一出备受关注。那么这款头显可以起到怎样的作用呢?据悉,这款头显包含诸多功能,包括iPad应用程序、冥想应用程序、虚拟现实直播和新闻观看、第三方游戏适配以及适用于虚拟会议室的工作应用程序等...

    手机互联 2023-04-26 09:07:48
  • 高德地图上线甄嬛导航语音包

    高德地图上线甄嬛导航语音包

    4月25日消息,近日,高德地图宣布与《甄嬛传》官方达成合作,共同推出了高德地图钮祜禄·甄嬛导航语音包。据高德方面介绍,即日起用户在高德地图APP中搜索“甄嬛”就能下载体验,出门导航的同时,还能够听到基于《甄嬛传》经典台词演绎而来的语音指引,梦回碎玉轩...

    互联网 2023-04-25 10:42:22
  • 烦人!用户抱怨苹果设备出现大Bug:不断要求输入AppleID密码

    烦人!用户抱怨苹果设备出现大Bug:不断要求输入AppleID密码

    近日,苹果在线服务频频出现故障,用户反映出现了一个新问题——无法登录AppleID。多位用户表示,即使输入正确的密码,系统也会提示登录失败,甚至导致AppleID被注销...

    手机互联 2023-04-18 08:18:56
  • Android将支持超宽带语音,蓝牙通话更清晰

    Android将支持超宽带语音,蓝牙通话更清晰

    IT之家4月17日消息,Android的蓝牙通话即将迎来质的飞跃,超宽带语音技术将让你的声音更清晰、更真实。目前,即使你使用最好的无线耳机,你的声音在传输到对方耳朵时也只能达到一般水平,如果你在开车时打电话,效果就更差了...

    手机互联 2023-04-18 08:18:23
  • 7款设备升级鸿蒙HarmonyOS3正式版

    7款设备升级鸿蒙HarmonyOS3正式版

    IT之家4月7日消息,华为鸿蒙官方发布了HarmonyOS3升级新进展。即日起,HUAWEInova10SE等7款设备开启正式版升级,新一批HarmonyOS3的升级机型预计4月中旬正式开启花粉招募...

    手机互联 2023-04-08 11:00:14
  • Intel用上美国自研的光刻机曝光设备:省事一半、成本大降

    Intel用上美国自研的光刻机曝光设备:省事一半、成本大降

    Intel当前的12代、13代酷睿使用的是Intel7工艺,今年底的14代酷睿MeteorLake还会首发Intel4工艺,这也是Intel首次大规模使用EUV光刻机。EUV光刻机虽然先进,但是成本也高,而且高端工艺甚至需要双重光刻,也就是用EUV光刻机曝光两次,生产工序就需要重复两次,比如蚀刻、清洗、沉积、去胶等等,无疑会增加成本...

    手机互联 2023-04-07 10:15:12

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持