-
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
马斯克深夜到访特斯拉上海超级工厂,消息称Model3改款将亮相
IT之家 6 月 1 日消息,特斯拉 CEO 马斯克的私人飞机北京时间 5 月 31 日 21 时 26 分落地上海虹桥机场,3 小时后的 6 月 1 日凌晨 0 时 28 分,特斯拉全球副总裁陶琳微博发布两张马斯克和员工的大合影,配文“感谢所有的支持! 收获满满的一天! ”,位置显示为特斯拉上海超级工厂。继 2020 年初造访上海超级工厂后,马斯克时隔 3 年再次到访中国...
智能设备 2023-06-01 10:45:23 -
特斯拉又玩活,Model3全身大改!自动驾驶硬件升级...售价不到20万
新款Model 3真要来了!作为特斯拉的入门级产品,Model 3自2016年发布以来,已经卖了六年多时间,消费者对其新鲜感所剩无几。并且从国内市场来看,Model 3的销量也出现了颓势,落后于Model Y。再加上竞品增多,Moo lel 3确实有必要在外观带来肉眼可见的新鲜感,从而提升竞争力。今年年初开始,就时有关于新款Model 3的消息传来,其外观谍照也公之于众,引发热烈讨论。还有汽车博主@SugarDesign 根据实车谍照绘制了新车图。对比现款Model 3,新车豪华感更浓了,一度让网友激动不已,表示“出了必买”。这不,好消息来了!最新消息显示,新款Model 3的量产似乎已箭在弦上。近日,一位网友用无人机拍摄了特斯拉中国上海超级工厂的现状。视频显示该工厂很繁忙,但大部分活动都集中在Model Y生产区域,而Model 3厂区十分安静,生产线似乎已暂停运作。是不是越看越不对劲?没记错的话,前不久有外媒透露,特斯拉上海工厂正在为改版Model 3的试生产做最后阶段准备。为了适应新车型的生产线的调整,Model3的生产线可能在5月底停工几天。甚至还有知情人士透露,本月开始特斯拉上海工厂的一些生产员工,需要将手机放在生产线外面专用的储物柜中,以防止改版Model 3的照片泄露。事出反常必有妖,当时消息一出就有不少人猜测“将有大事发生”,而这会网友的工厂实拍进一步证实,新款特斯拉Model 3不久将会到来!外观细节调整,内饰Model S化按照特斯拉之前对X和S的改款方式,这次新款Model 3将会是一款中期改款车型,外观上变化不大,仅是细节的小幅优化,主要针对前后杠、灯组以及内饰的细节调整。流传出来的伪装图对车头、车尾进行了重点覆盖具体来看,前脸标志性的弧形状线条消失,改为了更圆润的曲线,整体造型修更为细扁,凌厉,看起来有一种凶狠的既视感。再往下看,新车拥有全新样式的前保险杠设计,并且取消了现款保险杠两侧的进气口,预计能为新车带来更出色的空气动力,从而提升续航表现。大灯组内部也作出相应调整,底部有一条LED灯带,同时内部也集成了黄色转向灯。此外,新车大灯位置还隐约看见增加有一个全新摄像头,特斯拉自动辅助驾驶走的是纯视觉方案,新增摄像头将进一步提高车辆的“视觉”能力。车身侧面和现款车型接近,线条基本没有改动,隐藏式门把手、一体式玻璃车顶、铝合金轮毂依旧熟悉。不过,这个全新7辐Y式轮毂样式,看着倒与上一代车型大为不同。来到车尾,最大的改动还是车灯部分。新车将搭载全新尾灯模组,尾灯具体呈“倒L”形状,造型将比现款设计更纤细。车尾还将加入扰流板设计,来改善车尾的视觉效果。仔细看,车尾疑似进行了加长处理,后排空间表现或将得到优化。整体来看,全新Model 3外观有改动,但幅度有限,反倒内饰调整变化更大,摆脱了所谓的“毛坏风”。目前多方爆料指向,新车将拥有全新方向盘和升级的中控大屏。内饰风格也有一定变化,尤其惯用的木纹饰条或将更换为织物或Alcantara材质,从而提升车厢质感。重点提下,新款Model 3还向Model S靠拢,取消原有的怀档设计,在屏幕的最左方设置了一个换挡区域,变成直接在屏幕上滑动换挡。(参考Model S ,在换挡区域中上划为前进档,下划为倒车档,顶部则是驻车挡位)怎么说呢,这个改动确实算很大,但实际上手的话,估计很多车主会用不习惯。但这还不是最大的亮点....
智能设备 2023-05-31 10:54:32 -
摩托罗拉MotoGStylus5G(2023)发布,搭载骁龙6Gen1芯片
IT之家 5 月 31 日消息,摩托罗拉推出了其第三代 Moto G Stylus 5G 手机,是首批采用高通骁龙 6 Gen 1 芯片组的设备之一。该设备保留了位于充电端口旁边的标志性手写笔,但不支持三星 Galaxy S23 Ultra 的 S Pen 那样的蓝牙或压感功能。Moto G Stylus 5G (2023) 采用 6.6 英寸 FHD + 分辨率的 IPS LCD 屏幕,刷新率为 120Hz。屏幕上有一个小小的孔洞,用于放置 1600 万像素的前置摄像头。今年的 Moto G Stylus 在后面增加了一颗 5000 万像素的主摄像头(f / 1...
手机互联 2023-05-31 07:54:45 -
刷新率高达165Hz!摩托罗拉正式发布MotoEdge+
近日,摩托罗拉在美国市场推出了一款新的机型——Moto Edge + 2023款,这款手机的亮点在于其搭载了一块儿6.67英寸的AMOLED屏幕,分辨率为1080x2400,支持自适应165Hz刷新率、HDR10 + 和杜比视界技术。165Hz刷新率的屏幕在目前手机市场上并不多见,大多数旗舰机型还是采用120Hz刷新率的屏幕。设计方面,该机正面采用居中打孔设计,并且使用了曲面屏幕,边框控制很优秀,正面观感不错;背面采用左上方形三摄模块,机身正中间是摩托罗拉的LOGO。性能方面,Moto Edge+ 2023款搭载了来自高通的骁龙8 Gen 2处理器,并配备了8GB的运行内存,提供256GB和512GB的存储空间。高通骁龙8 Gen 2这颗芯片大家一定不陌生,它采用4纳米工艺制造,拥有1+4+3八核架构的CPU,最高主频达到3...
手机互联 2023-05-30 11:44:09 -
RedmiNote12TPro买到赚到!卢伟冰:恐怕再难有了
快科技5月29日消息,小米集团卢伟冰发文表示,Redmi Note 12T Pro这样顶级的LCD屏手机恐怕再难有了,希望Note 12T Pro成为LCD真爱粉们的心头好。那Redmi为什么还要坚持做LCD手机?卢伟冰表示,因为我们的用户需要...
手机互联 2023-05-29 11:08:18 -
RedmiNote12TPro官宣:搭载联发科天玑8200-Ultra,LCD屏
IT之家 5 月 29 日消息,今日 Redmi 官方公布了 Redmi Note 12T Pro 手机,该机搭载联发科天玑 8200-Ultra 移动处理平台,上代同款旗舰 LCD 屏幕,将于明天 10 点预售。Redmi Note 12T Pro 此前已入网,入网信息显示,该机支持5G 异网漫游、67W 快充、12GB 内存,其他具体信息有待官方进一步揭晓...
手机互联 2023-05-29 11:08:14 -
小米RedmiNote12TPro手机跑分曝光:天玑8200-Ultra处理器
IT之家 5 月 29 日消息,根据小米 Redmi 红米手机官方消息,新款 LCD 屏 Redmi 手机将于今日(5 月 29 日)9 点公布。根据此前爆料和入网信息,这款新机将是Redmi Note 12T Pro。Redmi Note 12T Pro 手机入网型号为23054RA19C,IT之家发现该机已出现在 Geekbench 跑分中,单核 1224,多核 3921,根据 1 + 3 + 4 核心最高 3.1GHz 规格来看,与小米 Civi 3 手机搭载的联发科天玑 8200-Ultra 处理器信息相同。入网信息还显示,Redmi Note 12T Pro 手机支持 5G 异网漫游、67W 快充、12GB 内存,其他具体信息有待官方进一步揭晓,大家可以期待一下新机在 618 期间能否进一步拉低市场价格。 ...
智能设备 2023-05-29 10:15:51 -
特斯拉开始交付搭载HW4硬件的ModelY,摄像头更加强大
IT之家 5 月 28 日消息,特斯拉已经开始交付其加州弗里蒙特工厂生产的部分 Model Y 车型,这些车型安装有 Hardware 4 (HW4),这是其最新版本的自动驾驶计算机。特斯拉一直在开发 HW4,今年早些时候该计算机的第一批图片就被曝光...
智能设备 2023-05-29 10:15:41 -
以核心技术驱动成本与效率升级京东小家打造IoT智能生态
近日,京东消费及产业发展研究院联合京东家电家居联合推出《智能互联家居及“京东小家”市场研究报告》(以下简称报告),对智能家居、家用IoT的市场和产品进行了梳理。 报告指出,2022年各品类智能家居设备市场均经历了不同程度的产品结构调整和功能升级,为市场后续发展奠定了基础...
智能设备 2023-05-27 17:11:48 -
佳能推出VR社交平台Kokomo,进入消费级市场第一步
IT之家 5 月 27 日消息,据 Road to VR 消息,佳能近日推出 VR 社交平台 Kokomo by Canon,支持 Meta Quest 2 头戴显示设备,目前已在美区 Google Play 上架。▲ 图源:佳能Road to VR 指出,相较于 Magic Leap 向视网膜直接投射整个数字光场,以产生电影级的现实;Kokomo 则是更关注使用其社交属性,通过合理利用使用者的手机镜头,呈现用户的虚拟形象。Road to VR 进一步解释道,用户只需要 VR 设备和手机,就能享受 Kokomo App 所提供沉浸式视频通话体验。Kokomo App 可以捕捉用户的全身 3D 形象,让双方的互动更真实,并提供 Mirror 模式,实时分享通话者手机中的文件、照片等数据。IT之家在佳能公开资料中获悉,佳能目前的虚拟现实设备主要聚焦于企业应用。此前佳能曾在 CES 2023 上展示了最新的 Mreal MR X1 3D 头戴显示器,售价为 350 万日元(IT之家备注:当前约 17.6 万元人民币)。 ...
手机互联 2023-05-27 15:23:13 -
百度何俊杰:全线拥抱AI,百度移动生态要为十亿用户打造“PersonalAI”
5月25日消息,2023万象·百度移动生态大会上,百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰提出,要以AI原生思维重构百度移动生态,全面“刷新”百度搜索、百度APP、百度文库、百度电商等产品与服务的用户体验,推动人机交互、内容生产、营销与商业三重变革。他表示,之前文心一言、ChatGPT等大语言模型是在让AI变“大”,移动生态的这次重构,就是要致力于让AI变“小”,变得更具体,变得人人可用。百度集团副总裁、搜索平台负责人肖阳提出基于“语义检索技术+大语言模型”的双重能力,引领搜索代际变革体验。百度搜索基于大模型创新打造的极致满足、“AI伙伴”、“AI BOT”等功能目前也正在内测中。搜索体验变革主要体现在三方面。在用户需求满足上,百度基于大语言模型和AI技术积累,让更多、更复杂的问题在第一条搜索结果中得到全面满足;在用户表达上,“AI伙伴”可以实现智能对话、多轮交互,极大降低了用户的输入表达门槛和成本;在信息边界的突破上,AI BOT为创作者、商家、机构、品牌等领域的内容、服务提供者们制作虚拟的AI分身,助力生态伙伴提升创作和服务效率。在过去一年,百度APP月活已达到6.57亿。百度信息分发平台总经理李小婉表示,百度APP今年将推出智能首页模式“一人一世界”,用户可以根据自己心意和习惯选择默认首页、大图首页、视频首页、小说首页等,满足更多元的个性化需求。 同时,她还首次展示了内测产品NEW APP,用新概念、新功能,以及一人一模型的未来远景。 目前产品的核心使用场景是对话,提问、聊天、发送指令等,用户还可指定不同“人设”的私人助理,了解用户的喜好和需求,随时对话交流,还可以给予有效建议,处理大小事务。此外,百度输入法也创新打造了AI“高情商沟通助手”,根据不同社交场景给出高情商聊天建议,为用户带来更加智能、高效的社交体验。2022年万象大会上,百度推出“创作者AI助理团”,至今已有45万创作者使用,产出超700万篇内容,累计分发量超过200亿。而在今年万象大会上,百度移动生态事业群组内容生态平台副总经理宋健介绍了全新升级的百度内容生态AIGC创作工具,AI笔记、AI成片、AI作画、AI BOT等功能将面向创作者开启内测体验,更多AI写作、AI数字人功能也即将上线,为创作者提供一站式AI创作方案,推动生产方式根本性变革。截止目前,超过600万创作者在百度创作与分享,创作者多元收入规模同比增长397%,商单收入、电商收入、付费订单量等多元业务均呈现高速增长态势。对创作者,百家号升级为“百度AI创作经营平台”,帮助创作者在AI提效、内容分发、多元变现、影响力建设等多个维度实现跨越性的突破。同时,百度推出创作者成长扶持计划“AI共创计划”,计划扶持10万创作者收入超30亿。“未来,谁拥有最佳的跟客户沟通的方式,谁就会拥有这个客户”,何俊杰指出。营销行业是AIGC的“先行示范区”,有机构预测,2022年,大型组织的营销信息2%由AI生成,到2025年,这一数据将上升到30%。据悉,百度从2014年开始,就在尝试“AIGC文本创意”。到目前,单条创意耗时从30分钟降到4分钟,AI辅助创作的文本创意每天生产14亿条,近七成企业都用到这个功能,近三分之一的创意展现都有AIGC参与。对于商家,百度副总裁、百度电商总经理平晓黎表示同步推出智能电商新品牌“百度优选”,发布了包含AI导购助手、电商AI主播制作平台、商家经营能力模型、商家成长体系、智能经营平台等一系列创新技术和智能商家经营方案。为助力商家和合作伙伴成长,平晓黎还发布百度电商超级生态计划,将助力1000个千万GMV爆款商品,100个年销售额过亿的商家,以及15个GMV过亿的服务商合作伙伴,与百度电商共同实现更大的生意机会。(一橙) ...
业界动态 2023-05-25 13:06:05