-
只需15分钟,iPhone就能「复制」你的声音
史蒂芬·霍金的「机械电音」,也许是世界上其中一个最有辨识度的声音。但那并不是霍金自己的声音。在霍金因渐冻症(ALS)失去说话能力的年代,技术还不足以让他能生成自己声音。事实上,能用上语音合成器的人都屈指可数。到了今天,ALS 患者虽然有了更多语音合成的选择,但总体费用和时间门槛仍然不低,普及度也有限。最近,苹果公布了全新无障碍功能 Personal Voice(暂未上线),不仅让用户能免费「备份」自己的声音,同时还在安全地应用 AI 技术上,作出了一次有意思的尝试。只需 15 分钟「调教」,就能生成你的声音▲ 图自 Fastcompany在生成式 AI 可以模仿一切的时代里,用 AI 模仿一个人的声音听起来已经不算新奇,只是感觉有点安全隐患。我好奇的,更多是苹果要怎样安全和高效地实现 Personal Voice 这一功能。据介绍,iPhone、iPad 和 Mac 用户只需要根据提示录制 15 分钟的音频,苹果就会基于设备端的机器学习技术来生成和用户一样的声音。相比之下,为失语群体提供专业语音合成服务的公司,可能需要采用专业设备,录制几小时的语音素材,价格最低都要数百美元。另一项新无障碍功能 Live Speech,则支持用户打电话、FaceTime 或者是和他人面对面对话的时候,输入文字即可生成语音内容,为失语或不方便说话的用户提供另一种「发声」方式。结合 Personal Voice 和 Live Speech 两项功能,失语用户就能用接近自己原本声音的生成声音和他人沟通。用起来是方便了,但怎样避免有人用网上扒的语音素材来生成他人的声音?素材随机化。在录制 15 分钟语音素材的过程中,苹果将随机生成需要用户朗读的内容,减少他人猜中素材的可能性。物理距离屏障。在录制过程中,用户需要在距离设备 6-10 英寸(约 15- 25 厘米)的特定空间里完成录制。在生成过程中,所有数据都将通过苹果的 Neural Engine(神经引擎)在设备本地完成,不必要上传到云处理。语音合成后,第三方应用如果想使用 Personal Voice,都要获得用户明确授权。即便第三方应用获得授权使用时,苹果也会采用额外的背景保护,确保第三方应用无法获取 Personal Voice 以及用户之前所录制的语音素材。如果是苹果「全家桶」用户,生成自己的 Personal Voice 后还能通过 iCloud 同步到不同设备上,并以端对端的方式加密。自己的声音,失去了才懂多重要人是感性的生物,而声音是很强烈的情感触发器。有研究指出,当人在听到母亲的声音时,身体释放出催产素水平和跟妈妈拥抱时产生的程度很相似。另一个研究则指出,听到自己的声音,会增强一个人的自我能动性。这听起来有点抽象。但当我们失去它时,重要性就变得显而易见了。2021 年 3 月,Ruth Brunton 被确诊 ALS。那年圣诞,她就已经失语了。ALS 患者中,约有 25% 的人患的是「延髓起病型」肌萎缩侧索硬化症,主要表现是说话障碍或吞咽困难。这类病人说话会逐渐变得含糊、带有鼻音,甚至失语。Brunton 的行动很果断,确诊后马上找公司去做语音生成。来回花了一个月时间,录了 3000 多个句子的语料,但最后出来的结果并不理想。那家公司用的是一种名为「单元选择(unit selection)」技术。简单粗暴来说,它就是通过「拼接」来实现语音生成,把语料拆分为大量小的语音单元,然后按需把元素拼起来。▲单元选择技术下,「Bob」这一词语能被拆分成不同语音元素,图自《华盛顿邮报》这种技术生成的语音能听清,但会有点电音,听起来不太自然。结果就是,Brunton 录制的语料结合了微软一个名为「Heather」的声音,不但声音和自己毫不相似,甚至逼着这英国人「讲」起了美语口音。https://s3.ifanr...
智能设备 2023-06-05 10:26:14 -
郭明錤谈WWDC23:相比于苹果头显投资者对AI更感兴趣
6月5日消息,苹果将于北京时间周二凌晨举行本年度全球开发者大会(WWDC23),届时有望推出第一款混合现实头戴设备。知名苹果分析师郭明錤会前表示,投资者对苹果头戴设备的兴趣不如对人工智能服务的兴趣大...
电信通讯 2023-06-05 07:57:27 -
三星自家元器件仅占S23UltraBoM的约三分之一
集微网消息,近日市调机构 Counterpoint 公布了三星 Galaxy S23 Ultra 的元器件成本分析,其中高通是三星 Galaxy S23 Ultra 供应商中的最大赢家。三星 Galaxy S23 Ultra 8+256GB 版本(Sub-6GHz)成本约为469美元,其中处理器和蜂窝数据子系统占比最高占到35%,屏幕第二(18%),相机第三(14%)...
手机互联 2023-06-05 00:08:13 -
消息称苹果将在WWDC23上提供AR/VR头显现场体验机会
IT之家 6 月 4 日消息,据彭博社记者 Mark Gurman 报道,苹果公司计划在即将举行的 2023 年 WWDC 活动上,向部分开发者和参会者提供尝试新款 AR / VR 头显的机会,这款头显将在活动上正式发布。据报道,苹果公司在 Apple Park 内建造了一个新的“结构”,用于提供对头显的受控现场体验...
智能设备 2023-06-04 09:40:31 -
Gurman称苹果有望在WWDC23上宣布不再使用“嘿,Siri”唤醒词
IT之家 6 月 4 日消息,据彭博社记者马克・古尔曼(Mark Gurman)透露,苹果公司可能在下周的 WWDC23 大会上宣布一项重大改变,即取消目前唤醒语音助手 Siri 所需的“嘿,Siri”唤醒词,用户只需说“Siri”就可以激活语音助手。古尔曼在推特上重申了这一消息,并表示这项改变可能是下周大会上的重要公告之一...
手机互联 2023-06-04 09:03:41 -
水滴公司公布2023年Q1业绩:营收6.06亿元,净利润4973万
6月2日,水滴公司公布截至2023年3月31日的第一季度未经审计的财务业绩报告。数据显示,水滴公司净营业收入为6.06亿元,净利润4,973万元,连续5个季度保持盈利。一季度水滴公司完成首年保费16...
互联网 2023-06-02 19:41:39 -
苹果WWDC23即将召开,Meta抢先发布新款VR头戴式装置
《华尔街日报》6月2日消息,Meta首席执行官扎克伯格发布了该公司最新版的虚拟现实头戴式装置Meta Quest 3。产品采用高通新芯片,装置本身比前一代薄了40%,显示屏和分辨率也有所提升...
智能设备 2023-06-02 11:23:41 -
魏牌新摩卡DHT-PHEV售价23.18万元,WLTC综合续航超1100km
6月2日消息,魏牌大五座旗舰电动SUV新摩卡DHT-PHEV于北京上市。新车提供两驱长续航版车型,官方售价23.18万元,同时推出5重上市权益。魏牌CEO陈思英在发布会上表示:“新摩卡重新定义了大五座旗舰电动SUV,是一辆更超值的大五座SUV。”新摩卡启动预订7天时间,订单量已突破万辆。新摩卡4881*1960*1690mm车身尺寸,2915mm轴距,后排横向尺寸1450mm,可同时乘坐3人,后排乘坐人员和前排乘坐的水平方向距离943mm;510mm前排坐垫长度、500mm后排坐垫长度,可以提供更好的身体支撑。此外,新摩卡标配七大NVH静音技术、PM2...
业界动态 2023-06-02 11:03:54 -
三星S23Ultra物料成本曝光,高通成最大赢家
行业人士都知道每年新iPhone正式发布之后,总会有拆解公司进行拆解,然后根据所使用的元器件算出物料成本,对比售价成为众人热议的焦点。但拆解公司很少对安卓阵营的机型下手,因为安卓阵营的机型往往在利润率上与iPhone差很多。拆解公司不对安卓机型下手,但数据调研公司会下手。6月1日知名数据调研公司Counterpoint Research就公布了三星Galaxy S23 Ultra的BoM(物料清单)报行,他们是以8GB RAM+256GB ROM版本为例的。报告显示这个版本的三星Galaxy S23 Ultra的物料成本为469美元,约合人民币3335元。作为对比这个版本的机型在北美市场的售价为1199.99美元,在我们国内的售价为9499元。也就是讲三星Galaxy S23 Ultra的物料成本占其售价的比重为39%。PS:三星Galaxy S23 Ultra的物料成本与售价之比,甚至比iPhone还要低。不信大家可以自行查询一下。报告称三星Galaxy S23 Ultra物料成本最高的是处理器,占比为35%,屏幕排名第二,占比为18%,摄像头排名第三,占比为14%。当然了BoM成本仅是最原始的成本,是不包含一切研发、人工、运输等等成本在内的。而这些成本往往是拆解公司和数据调研公司无法计算出来的,所以大家看看就可。另外该分析公司同时分析了三星Galaxy S23 Ultra的元器件来源组成,他们讲这一次三星使用了大量来自高通的元器件,比如:处理器、指纹传感器、电池管理IC等等,让高通在元器件中占比达到34%。这应该是三星S系列史上高通元器件占比最多的一款机型,其实三星也没有办法啊!谁叫自己家的猎户座处理器不争气呢? ...
手机互联 2023-06-02 08:51:43 -
奇富科技机器人团队语音论文入选INTERSPEECH2023
6月1日消息,近日,奇富科技机器人团队论文《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》(Eden-TTS: A Simple and Efficient Parallel Text-to-speech Architecture with Collaborative Duration-alignment Learning)被全球语音与声学顶级会议INTERSPEECH 2023接收。据悉,INTERSPEECH是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议,是全球最大的综合性语音信号处理盛会,在国际上享有盛誉并具有广泛的学术影响力。奇富科技的论文研究成果为需要文本转语音的应用场景提供了创新的解决方案,提出了一种端到端可微的非自回归神经网络语音合成模型架构。基于文本音素时长与alignment的密切关系,论文提出了一种简单高效的alignment学习方式:首先采用一种新的energy-modulated注意力机制得到guided alignment,然后利用guided alignment计算音素的时长信息,最后通过音素的时长信息构建monotonic alignment。本方法无需外部的alignment信息,无需引入额外的alignment损失函数。对业务提效而言,这种端到端可微的方法使得各个模块可以方便地替换为各种类型的神经网络模块,从而具有良好的扩展性和稳定性。相比于主流的自回归模型,推理速度提升了10倍以上,能够满足实时语音合成的需求。根据进行的多人MOS评测,该方法的MOS分值达到了4.32分(满分为5分),合成语音的自然流畅程度接近于目前最优的自回归模型,显著优于同类型的非自回归模型。此外,与同类型方法相比,该方法可以节约50%以上的训练时间,显著提升模型训练效率。奇富科技在对话机器人领域一直坚持投入、坚持自研。就在两个月前,奇富科技另一篇音频论文《基于多粒度Transformer的多模态情绪识别》(Multilevel Transformer for Multimodal Emotion Recognition)被第48届IEEE声学、语音与信号处理国际会议(IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2023)接收。“我们很高兴在理解用户、优化表达方面取得了关键性的成果。随着奇富GPT对于公司各业务层的重构,我们已经极大提升了对于用户在文本上的理解能力,从语音到文本,再从文本回到语音,更好的识别是为了更好的表达和输出,我们将持续投入,用前沿技术重塑用户体验。”奇富科技首席算法科学家费浩峻表示。(一橙) ...
业界动态 2023-06-01 12:40:34 -
报告称三星GalaxyS23Ultra手机物料成本469美元,占比售价39%
IT之家 6 月 1 日消息,根据市场调查机构 Counterpoint Research 分享的最新物料清单(BoM)报告,认为三星生产一台 8GB 内存、256GB 存储、支持 Sub-6GHz 的 Galaxy S23 Ultra 手机,成本约为 469 美元(IT之家备注:当前约 3335 元人民币)。IT之家查询三星美国官网,相同配置的无锁版 Galaxy S23 Ultra 手机售价为 1199.99 美元(当前约 8532 元人民币),占比为 39%,相同配置在国内售价为 9499 元。占据 Galaxy S23 Ultra 手机物料成本大头的是高通处理器,占比为 35%,其次是屏幕(18%)和摄像头(14%)。由于 Galaxy S23 Ultra 手机使用了高通的指纹传感器 IC,关键电源管理 IC,音频编解码器,RF 功率放大器,Wi-Fi + 蓝牙,GPS 和 Sub-6GHz 收发器,让高通在元件供应商中的占比刷新历史,达到 34%。在相机方面,由三星(SEMCO)和索尼共同提供。三星提供 200MP 广角相机 (S5KHP2) 和 12MP 自拍相机 (S5K3LU),而索尼提供 12MP 超广角 (IMX564)、10MP 长焦和潜望镜长焦 (IMX754) 传感器。 ...
智能设备 2023-06-01 10:45:41 -
Win10极限精简版Tiny10x6423H1更新,支持64位系统
IT之家 6 月 1 日消息,今日 NTDEV(@NTDEV_)发布了轻量级 Windows 10 系统 Tiny10 的新版本,名为 tiny10 23H1 x64,支持 64 位系统,占用空间小,更新速度快,适合低端硬件运行。据悉,tiny10 23H1 x64 是在今年年初发布的 tiny10 2303 x86 的基础上开发的,后者只支持 32 位系统。tiny10 23H1 x64 基于 Windows 10 LTSC 21H2(版本号 19044.3031),保留了组件存储和远程桌面等功能,可以进行在线更新和语言安装。该版本还支持从旧版 tiny10 升级,无需重新安装。NTDEV 表示,tiny10 23H1 x64 是为那些想要体验核心 Windows 功能,同时具有必要功能又注重安全性的用户而设计的。他还指出,“23H1”只是一个命名惯例,表示该版本是在 2023 年上半年发布的,并不代表微软官方的 Windows 10 版本。目前,微软官方最新的 Windows 10 版本是 22H2,预计将于 2025 年 10 月停止支持。有兴趣的IT之家小伙伴可以从 Internet Archive 。不过需要注意的是,这类非官方的 Windows 修改版本仍然需要使用正版 Windows 密钥(7、8、8...
智能设备 2023-06-01 10:45:31