-
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
任天堂Switch模拟器YuzuEmulator登陆安卓平台
IT之家 5 月 31 日消息,近日 Yuzu 开发团队宣布,他们的任天堂 Switch 模拟器已经正式支持安卓平台。Yuzu 是目前 PC 上最受欢迎的 Switch 模拟器之一,能够让用户在更强大的硬件上玩自己喜爱的 Switch 游戏,现在其终于登陆了安卓平台...
智能设备 2023-05-31 10:53:51 -
不锈钢材质,苹果早期AppleWatch原型曝光
IT之家 5 月 31 日消息,原型收藏家 Kosutami 在分享 MagSafe 磁吸充电器原型的时候,还分享了一款不锈钢材质的 Apple Watch 手表金属外壳。他在推文中表示,这款 Apple Watch 是早期“头脑风暴”开发过程中的产物,其尺寸并非 38mm 或者 42mm,而是介于两者之间...
手机互联 2023-05-31 07:54:43 -
骁龙778G+神U加持!vivoS17现身Geekbench网站
vivo即将于5月31日发布S17系列手机,其中包括S17、S17 Pro两款机型。最新曝光的型号为V2283A的vivo S17已经跑上了Geekbench,并显示单核分数817,多核分数2607。预计该机搭载骁龙778G+芯片,内存容量为12GB,运行Android 13操作系统。此外,vivo S17系列手机将搭载智慧柔光环、超感知光谱传感器、前置5000万广角柔光、专业长焦人像镜头等多项高端配置。全系标配6.78英寸1...
手机互联 2023-05-30 00:54:09 -
摩托罗拉Razr40手机亮相Geekbench,确认搭载高通骁龙7Gen1
IT之家 5 月 28 日消息,摩托罗拉新一代折叠屏手机将于 6 月 1 日正式面向全球发布,预计是摩托罗拉 Razr 2023 机型,预计将包括摩托罗拉 Razr 40 和 Razr 40 Ultra。IT之家发现,摩托罗拉 Razr 40 已经出现在了 Geekbench 跑分数据库中,并且还通过了国家 3C 质量认真...
手机互联 2023-05-28 11:08:25 -
这个比ChatGPT情商还高的AI,我可以和它聊三天三夜
狂拿考试高分让学生瑟瑟发抖,加入联网功能叫传统搜索战战兢兢,升级工作全家桶搞得打工人又悲又喜....
智能设备 2023-05-27 16:02:52 -
腾讯任天堂Switch推出延长保修计划限时优惠,售109元
IT之家 5 月 27 日消息,腾讯发文宣布,自 6 月 1 日-30 日,腾讯任天堂 Switch 延长保修计划推出限时优惠,原价 159 元 / 年的延长保修服务计划只需 109 元。IT之家注:腾讯任天堂 Switch 延长保修计划首次发布于 2022 年 12 月下旬,该计划适用于新购机或目前仍然在保修期内的“任天堂 Switch”、“任天堂 Switch(OLED 版)”,用户可付费参与计划延长 1 年的保修时间...
手机互联 2023-05-27 15:23:29 -
已在40多个国家和地区上线,OpenAI在更多市场推出官方版ChatGPT
IT之家 5 月 26 日消息,OpenAI 宣布已经在 40 多个国家和地区,推出了适用于 iPhone 和 iPad 的官方 ChatGPT 应用程序。官方版 ChatGPT 于上周率先在美国市场推出,OpenAI 承诺未来几周内会继续扩展到更多国家和地区...
智能设备 2023-05-26 11:18:38 -
Mudra表带开启预订,一个响指手势搞定AppleWatch交互
IT之家 5 月 26 日消息,Wearable Devices Ltd.(WLDS)今天宣布,适用于 Apple Watch 的 Mudra 表带开启预订,售价 249 美元,限时优惠售价为 199 美元(IT之家备注:当前约 1409 元人民币)。这款 Mudra 表带最大的亮点在于满足生活场景中,不利于双手操作 Apple Watch 的情况下,通过一个响指手势,实现切换曲目、调整音量、接听来电、关闭闹钟、拍照等各种操作。其工作原理是获得专利的 SNC(表面神经传导)传感器,通过将皮肤表面的离子电活动转换为电压(离子交换)来感知手腕发出的生物电势。当移动手指时,Mudra Band 中的电极会捕捉到从你的大脑发出的神经信号,通过手腕传给你的手指。实时准确地通过 SNC 传感器捕捉神经信号,以及深度学习 AI 算法破译信号模式,对正在移动的手指进行分类。 ...
智能设备 2023-05-26 11:18:31 -
谷歌开源RustCrate审查结果:便于Rust开发者验证源码安全
IT之家 5 月 25 日消息,谷歌的许多开源项目都使用 Rust,这是一种现代系统语言,旨在构建可靠高效的软件。日前谷歌在 GitHub 上开源了对 Rust Crate 的审查结果,开发者可在自己的项目中导入这些审核结果,以证明所使用的 Rust Crate 的属性。▲图源 谷歌开源博客Rust 社区中存在可用于供开发者发布自己所开发的 Crate 的名为 Crates.io 的服务,开发者利用 Crates...
智能设备 2023-05-25 11:03:30 -
研究揭示ChatGPT美国用户人群画像:年轻、富裕、受过良好教育
5月25日消息,美国皮尤研究中心(Pew Research Center)最近开展的一项调查发现,58%的美国成年人熟悉ChatGPT,那些年轻富裕、受过良好教育的美国人更了解ChatGPT。调查显示,拥有研究生学位的高收入人士更熟悉ChatGPT...
业界动态 2023-05-25 08:08:16 -
ChatGPT重塑Windows!操作系统全面接入,Bing也能用插件了
金磊 丰色 西风 发自 凹非寺量子位 | 公众号 QbitAI一夜之间,微软彻底重新定义了PC交互。因为这一次,它把Bing和ChatGPT插件的能力,注入到了整个Windows系统!这就是在刚刚结束的Build 2023中,微软重磅推出的Windows Copilot。有了它,想让自己的PC变得更适合工作,就只需要一个简单的动作——问:如何调整我的系统,(以便更好地)来完成工作?然后Windows Copilot“啪的一下”就会给你2个建议:开启Focus Sessions功能(Windows11利于专注工作的新功能)。把系统变成深色模式。此时,若是你觉得建议有用,只需点击一下“yes”,一键就可以让系统变成你想要的样子。把桌面上的PDF“喂”给Windows Copilot,总结文档内容,也就是点下鼠标的事情了。不仅如此,Windows Copilot还可以跟你电脑里所有的App来一个联动。例如问它:什么音乐比较适合工作的时候听?它会立即在Spotify中给你推荐几个音乐播放列表,而我们所要做的,依旧是一个点击的动作而已。并且在各种插件的加持之下,像做logo这样的工作,就变成傻瓜式的“问”、“点击”、“拖拽”。微软在现场也直接道出了此举背后的目的:Make every user a power user.让每个用户都是高级用户。而且对于开发者来说,或许Windows Copilot的玩法会变得更有意思。因为它允许Bing或ChatGPT插件对它进行扩展。如此一番“大秀”之下,引得网友直呼“AI将无处不在”:不过Windows Copilot,也仅仅是微软Build 2023中“上新”的一隅。Bing,引入到ChatGPT了从现在起,不止是Bing里有GPT-4,ChatGPT里也有Bing了。这个模式叫做“使用必应进行搜索(Browsing with Bing)”,和不久前刚刚上线的插件功能在一个列表中。这个功能已经对plus用户开启,免费版的很快也将上线。勾选上该模式之后,你就可以进行一些基于必应的实时查询了。比如问ChatGPT:本周的Build大会,关于...
智能设备 2023-05-24 10:50:10