-
百度智能云:文心一言高性能模式推理性能提升50倍
6月6日消息,百度智能云在成都举行的文心大模型技术交流会上表示,自3月开始内测两个月以来,百度文心一言的推理性能已经提升10倍。同时,基于文心千帆大模型平台提供的完备的工具链,在企业应用的高频、核心场景中,文心一言的高性能模式“文心一言-Turbo”,其推理服务性能已经提升了50倍,这将极大提升客户的模型使用效果和效率...
互联网 2023-06-06 20:39:11 -
只需15分钟,iPhone就能「复制」你的声音
史蒂芬·霍金的「机械电音」,也许是世界上其中一个最有辨识度的声音。但那并不是霍金自己的声音。在霍金因渐冻症(ALS)失去说话能力的年代,技术还不足以让他能生成自己声音。事实上,能用上语音合成器的人都屈指可数。到了今天,ALS 患者虽然有了更多语音合成的选择,但总体费用和时间门槛仍然不低,普及度也有限。最近,苹果公布了全新无障碍功能 Personal Voice(暂未上线),不仅让用户能免费「备份」自己的声音,同时还在安全地应用 AI 技术上,作出了一次有意思的尝试。只需 15 分钟「调教」,就能生成你的声音▲ 图自 Fastcompany在生成式 AI 可以模仿一切的时代里,用 AI 模仿一个人的声音听起来已经不算新奇,只是感觉有点安全隐患。我好奇的,更多是苹果要怎样安全和高效地实现 Personal Voice 这一功能。据介绍,iPhone、iPad 和 Mac 用户只需要根据提示录制 15 分钟的音频,苹果就会基于设备端的机器学习技术来生成和用户一样的声音。相比之下,为失语群体提供专业语音合成服务的公司,可能需要采用专业设备,录制几小时的语音素材,价格最低都要数百美元。另一项新无障碍功能 Live Speech,则支持用户打电话、FaceTime 或者是和他人面对面对话的时候,输入文字即可生成语音内容,为失语或不方便说话的用户提供另一种「发声」方式。结合 Personal Voice 和 Live Speech 两项功能,失语用户就能用接近自己原本声音的生成声音和他人沟通。用起来是方便了,但怎样避免有人用网上扒的语音素材来生成他人的声音?素材随机化。在录制 15 分钟语音素材的过程中,苹果将随机生成需要用户朗读的内容,减少他人猜中素材的可能性。物理距离屏障。在录制过程中,用户需要在距离设备 6-10 英寸(约 15- 25 厘米)的特定空间里完成录制。在生成过程中,所有数据都将通过苹果的 Neural Engine(神经引擎)在设备本地完成,不必要上传到云处理。语音合成后,第三方应用如果想使用 Personal Voice,都要获得用户明确授权。即便第三方应用获得授权使用时,苹果也会采用额外的背景保护,确保第三方应用无法获取 Personal Voice 以及用户之前所录制的语音素材。如果是苹果「全家桶」用户,生成自己的 Personal Voice 后还能通过 iCloud 同步到不同设备上,并以端对端的方式加密。自己的声音,失去了才懂多重要人是感性的生物,而声音是很强烈的情感触发器。有研究指出,当人在听到母亲的声音时,身体释放出催产素水平和跟妈妈拥抱时产生的程度很相似。另一个研究则指出,听到自己的声音,会增强一个人的自我能动性。这听起来有点抽象。但当我们失去它时,重要性就变得显而易见了。2021 年 3 月,Ruth Brunton 被确诊 ALS。那年圣诞,她就已经失语了。ALS 患者中,约有 25% 的人患的是「延髓起病型」肌萎缩侧索硬化症,主要表现是说话障碍或吞咽困难。这类病人说话会逐渐变得含糊、带有鼻音,甚至失语。Brunton 的行动很果断,确诊后马上找公司去做语音生成。来回花了一个月时间,录了 3000 多个句子的语料,但最后出来的结果并不理想。那家公司用的是一种名为「单元选择(unit selection)」技术。简单粗暴来说,它就是通过「拼接」来实现语音生成,把语料拆分为大量小的语音单元,然后按需把元素拼起来。▲单元选择技术下,「Bob」这一词语能被拆分成不同语音元素,图自《华盛顿邮报》这种技术生成的语音能听清,但会有点电音,听起来不太自然。结果就是,Brunton 录制的语料结合了微软一个名为「Heather」的声音,不但声音和自己毫不相似,甚至逼着这英国人「讲」起了美语口音。https://s3.ifanr...
智能设备 2023-06-05 10:26:14 -
B站发布Q1财报:总营收达50.7亿元,净亏损6.3亿元同比收窄72%
6月1日消息,哔哩哔哩(NASDAQ:BILI,HKEX:9626;以下简称“B站”)公布了截至2023年3月31日的第一季度未经审计的财务报告。财报显示,第一季度B站总营收达50.7亿元人民币,日均活跃用户达9,370万,同比增长18%。一季度减亏成果显著,净亏损6...
互联网 2023-06-01 18:36:30 -
还要“去中国化”?戴尔在华出货量暴跌近50%,华为逆袭成第二
随着智能手机的流行,PC(个人电脑)市场正在逐渐萎缩,这个是全球现象。即便如此,全球各大厂之间依然竞争激烈。如今,继美国美光产品在华被禁售之后,又一家美企在华生意惨淡。据观察者网报道,根据市场调研机构发布的最新数据,今年第一季度,华为PC国内市场出货量同比增长34.1%,以10...
手机互联 2023-06-01 00:48:01 -
苹果首款头显屏幕规格曝光:1.41英寸4K屏幕,峰值亮度超5000尼特
IT之家 5 月 31 日消息,多方消息源表明苹果会在 6 月 6 日凌晨 1 点召开的 WWDC 2023 开发者大会上,宣布首款 AR / VR 头显。屏幕供应链咨询公司 DSCC 首席执行官罗斯・杨(Ross Young)今天发布推文,分享了关于头显屏幕的更多细节。罗斯・杨在推文中表示,苹果首款头显将配备 2 块 1.4 英寸的屏幕,材质为 Micro OLED(OLED on Silicon),亮度会超过 5000 尼特,像素密度为每英寸 4000 个像素点,每块屏幕的分辨率也达到了 4K。苹果的这款头显凭借着高于 5000 尼特的亮度,可以支持主流头显市场并不具备的 HDR 内容。IT之家根据罗斯・杨的推文,在此附上主流头显的亮度情况如下:Meta Quest 2 的最大亮度约为 100 尼特,不提供 HDR;HoloLens 2 提供 500 尼特的亮度;索尼的 PSVR 2 头显亮度大约 265 尼特,官方宣传支持 HDR。罗斯・杨表示,5000 尼特是屏幕的峰值亮度,在日常使用过程中,头显可能会降低亮度,提供比主流头显更高的对比度,更明亮的色彩和更好的呈现效果。 ...
智能设备 2023-05-31 10:53:55 -
美颜相机发布“AI写真”功能5分钟生成高级写真
5月30日消息,今天美图旗下美颜相机发布“AI写真”功能。该功能通过Few-shot Learning(少样本学习)个性化训练方案生成用户形象,AI基于用户形象模型,5分钟内即可快速生成场景妆造,为用户提供一套高级写真...
电信通讯 2023-05-30 15:29:33 -
中国科学院院士李静海:2022年中国数字经济规模达50.2万亿元,总量稳居世界第二
5月29日消息,近日中关村平行论坛“互联网3.0:未来互联网产业发展论坛”现场,中国科学院院士、北京市科学技术协会主席李静海发表主题演讲。他强调,2022年中国数字经济规模达50...
互联网 2023-05-29 16:34:32 -
阿里巴巴:网传裁员为谣言,今年预估新招15000人
5月25日消息,阿里巴巴集团官微宣布,2023年六大业务集团总计需新招15000人,其中校招超过3000人。阿里巴巴官微表示,“近日,关于淘宝天猫、阿里云、菜鸟、本地生活各个业务裁员谣言传得很厉害,但谣言就是谣言...
互联网 2023-05-25 20:51:49 -
网易2023Q1财报:营收250亿元,AI助力数字内容生产提效90%
5月25日,网易发布2023年第一季度财报。财报显示,网易一季度业绩保持稳健增长,净收入250亿元,非公认会计准则下归属于公司股东的净利润76亿元,超出市场预期。本季度,网易继续投入AI大模型等自研关键技术,Q1研发投入37亿元,研发投入占比营收达15%。同时,网易利用AI等自研技术,已实现数字内容生产关键环节提效90%,并通过AI工具及内容共创的新模式,全面激发年轻群体创意能力,形成精品内容创作生态,驱动业务可持续发展。一季度,网易专注精品打造与创新,游戏及相关增值服务净收入201亿元,同环比实现双增长。网易云音乐持续健康发展,通过不断创新商业合作模式,包括与中国移动视频彩铃达成合作、升级杜比全景声专区体验、覆盖更多IoT终端等,实现Q1净收入20亿元,毛利率大幅提升至22.4%,去年同期为12...
互联网 2023-05-25 16:41:09 -
微软发布Win1122621.1778更新KB5026446,支持蓝牙低功耗音频
IT之家 5 月 25 日消息,微软今天为 Win11 用户推送了 KB5026446 (操作系统内部版本 22621.1778) 非安全预览更新,也就是“Moment 3”更新,并且还向 DEV 渠道推送了 Build 23466 版本更新,我们现在先来看一下 22621...
智能设备 2023-05-25 11:03:26