-
《博德之门3》旁白语音有17种风格不同角色不同情绪
近日《博德之门3》在EGX 2023中举行访谈节目,负责旁白语音的Amelia Tyler透露,《博德之门3》光是旁白就有17种不同风格台词。她和团队为旁白台词创造了不同的语调和变化,以适应所有可玩角色,更好地讲述他们特定故事的内心独白...
游戏资讯 2023-10-19 02:35:58 -
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
终于来了,OpenAI发布iOS版ChatGPT,支持语音提问
5月19日消息,当地时间周四,OpenAI发布iOS版ChatGPT应用,美国的iPhone用户可以通过苹果应用商店免费下载安装。OpenAI承诺,未来还计划将ChatGPT应用登陆Android设备...
业界动态 2023-05-19 07:31:13 -
AI语音诈骗日益猖獗:实现95%模拟人声、77%接通者遭经济损失
IT之家5月6日消息,根据McAfee公布的最新报告,基于人工智能(AI)的语音诈骗日益猖獗,在接到诈骗电话的群体中,77%的人会导致经济损失。报告中提及了两个真实案例,其中一个通过AI模拟受害者亲人,表示因某些事情急需要钱;另一个通过AI模拟女儿,向其母亲勒索赎金,但事实上她的女儿并未被绑架...
智能设备 2023-05-07 12:43:16 -
三星GalaxyS22Ultra手机创造历史:完成首个卫星语音通话
IT之家4月26日消息,三星GalaxyS22Ultra近日创造了新的历史:成为全球首款可拨打卫星语音电话的智能手机。美国电信运营商AT&T和ASTSpaceMobile公司合作,使用未经修改的标准手机,实现美国得克萨斯州和日本之间的卫星通话...
手机互联 2023-04-27 14:56:05 -
高德地图上线甄嬛导航语音包
4月25日消息,近日,高德地图宣布与《甄嬛传》官方达成合作,共同推出了高德地图钮祜禄·甄嬛导航语音包。据高德方面介绍,即日起用户在高德地图APP中搜索“甄嬛”就能下载体验,出门导航的同时,还能够听到基于《甄嬛传》经典台词演绎而来的语音指引,梦回碎玉轩...
互联网 2023-04-25 10:42:22 -
Android将支持超宽带语音,蓝牙通话更清晰
IT之家4月17日消息,Android的蓝牙通话即将迎来质的飞跃,超宽带语音技术将让你的声音更清晰、更真实。目前,即使你使用最好的无线耳机,你的声音在传输到对方耳朵时也只能达到一般水平,如果你在开车时打电话,效果就更差了...
手机互联 2023-04-18 08:18:23 -
《辐射4》的语音AIMOD可以自己生成对白了
AI如今所展现的作用已经不可小觑,但如何更好利用AI来满足各领域的不同需求,暂时还需要依靠来自人类的想象力。比如,现在AI已经基本实现了与人类的流畅对话,但多数人能够想到的用法是利用它来生成文案、与人陪聊,以及处理其他的文字工作...
游戏资讯 2023-03-30 00:45:09 -
iOS16.4正式版发布:蜂窝网络通话的“语音突显”到来
今天,苹果发布了iOS16.4正式版。本更新包括以下增强功能和错误修复:表情符号键盘中新增21个表情符号,其中包括动物、手势和物体添加到主屏幕上的网页App现支持通知适用于蜂窝网络通话的“语音突显”会优先突出你的声音并隔绝周围的环境噪声“照片”中的重复项目相簿进一步支持检测iCloud共享照片图库中的重复照片和视频“旁白”支持“天气”App中的地图辅助功能设置可在检测到闪光或频闪效果时自动调暗视频修复了子女的“购买前询问”请求可能不会显示在父母设备上的问题解决了兼容Matter的恒温器在与Apple家庭配对后可能无响应的问题iPhone14和iPhone14Pro机型的车祸检测实现优化以下是iPadOS16.4更新本更新包括以下增强功能和错误修复:表情符号键盘中新增21个表情符号,其中包括动物、手势和物体ApplePencil悬停增加了倾斜角和方位角支持,方便你在“备忘录”和受支持的App中进行标记前从任何角度预览,适用于11英寸iPadPro(第4代)和12.9英寸iPadPro(第6代)添加到主屏幕上的网页App现支持通知“照片”中的重复项目相簿进一步支持检测iCloud共享照片图...
手机互联 2023-03-28 08:43:36 -
苹果iOS16.4RC预览版新增iPhone手机通话语音隔离功能
IT之家3月22日消息,苹果今日向iPhone用户推送了iOS16.4/iPadOS16.4RC预览版及公测版更新(内部版本号:20E246),RC候选预览版标志着将在不久的将来面向公众提供软件的最终版本。IT之家从苹果官方日志说明中获悉,iOS16.4更新将包括蜂窝电话的语音隔离功能...
手机互联 2023-03-24 11:07:11 -
真·听歌闭麦1v9?iNSaNia表示Nisha队内语音闭麦15分钟
去年一路从外卡杀入TI11决赛日的TeamLiquid在本赛季迎来了巨星Nisha的加盟,这无疑让这支原本就磨合良好的团队在硬实力上又上升了一个台阶:他们在DPC联赛中轻松拿下7-0的战绩,并以西欧一号种子的身份进入LimaMajor。在本次LimaMajor他们的表现依旧没有让粉丝失望,淘汰赛未尝一败杀入胜者组决赛,但天公不作美,4号位Boxi的身体临时突发状况使得他们不得不使用随行人员替补参赛,他们也在随后的胜决不敌GG战队掉入败者组,好在在败者组决赛中,他们成功2:0Talon杀回总决赛...
游戏资讯 2023-03-06 16:40:00 -
vivo“手语翻译官”功能发布可识别1200个手语词汇
3月3日消息,“OriginOS国际爱耳日特别活动”在vivo总部成功举办。活动现场,vivo首次对外发布了“手语翻译官”功能——通过该APP,可以将健听人士的语音和文字,实时转变成为手语,还可以用文字、语音播报听障人士的手语动作...
电信通讯 2023-03-03 15:15:47