-
演讲秒变卡拉OK,黄仁勋演示AI音乐创作!英伟达放大招,算力“杀器”来了,还“拉踩”了一波CPU
当地时间5月29日,COMPUTEX 2023上,英伟达(NVDA)掌门人黄仁勋向传统CPU服务器集群发起“挑战”,“CPU扩展的时代已结束,新计算时代引爆点已到来。”当日,黄仁勋在大会上宣布,“我们已到达生成式AI引爆点。从此,全世界的每个角落,都会有计算需求。”如今英伟达掌握着全球多家科技公司“算力命脉”,而在这场大会上,黄仁勋激情演讲2个小时,甩出了多项重磅新发布,包括算力“杀器”DGX GH200超级计算机、针对游戏的ACE代工服务、MGX服务器规范等内容。图片来源:NVIDIA主题演讲视频截图据澎湃新闻5月29日报道,在当天的大会上,黄仁勋现场演示AI音乐创作,随机输入歌词一键生成一首歌。他还带领现场观众跟着节拍演唱。图片来源:NVIDIA主题演讲视频截图上周,由于对处理AI任务的数据中心芯片的强烈需求,英伟达大幅提高了对本季度的业绩指引,比分析师的估计高出近40亿美元。业绩指引的提高使该股创下历史新高,并使英伟达的估值接近1万亿美元,这还是芯片业中首次有公司市值达到这一高度。黄仁勋演讲的主要内容来了1、英伟达面向游戏玩家的GForce RTX 4080 Ti GPU现已全面投产,并已经开始量产。2、黄仁勋宣布推出适用于游戏的英伟达Avatar Cloud Engine(ACE),这是一种可定制的AI模型代工服务,为游戏开发人员提供预训练模型。它将通过AI支持的语言交互赋予非玩家角色更多个性。3、英伟达Cuda计算模型现在服务于400万开发者和超过3000个应用程序。Cuda的下载量达到了4000万次,其中仅去年一年就达到了2500万次。4、GPU服务器HGX H100的全面量产已经开始,他补充说,这是世界上第一台装有变压器引擎的计算机。图片来源:NVIDIA主题演讲视频截图5、黄仁勋将英伟达2019年以69亿美元收购超级计算机芯片制造商Mellanox称为其有史以来做出的“最伟大的战略决策之一”。6、下一代Hopper GPU的生产将于2024年8月开始,也就是第一代开始生产两年后。7、英伟达的GH200 Grace Hopper现已全面投产。超级芯片提升了4 PetaFIOPS TE、72个通过芯片到芯片链路连接的Arm CPU、96GB HBM3和576 GPU内存。黄仁勋将其描述为世界上第一个具有巨大内存的加速计算处理器:“这是一台计算机,而不是芯片。”它专为高弹性数据中心应用而设计。8、如果Grace Hopper的内存不够用,英伟达有解决方案——DGX GH200。它是通过首先将8个Grace Hoppers与3个NVLINK交换机以900GB传输速度的Pod连接在一起,再将32个这样的组件连接在一起,再加上一层开关,连接总共256个Grace Hopper芯片。由此产生的ExaFLOPS Transformer Engine具有144 TB的GPU内存,可用作巨型GPU。黄仁勋说Grace Hopper速度非常快,可以在软件中运行5G堆栈。谷歌云、Meta和微软将是第一批获得DGX GH200访问权限的公司,并将对其功能进行研究。9、英伟达和软银已建立合作伙伴关系,将Grace Hopper超级芯片引入软银在日本的新分布式数据中心。这些将能够在多租户通用服务器平台中托管生成式人工智能和无线应用程序,从而降低成本和能源。10、软银和英伟达的合作伙伴关系将基于英伟达MGX参考架构,该架构目前正在与一些公司合作使用。它为系统制造商提供了一个模块化的参考架构,帮助他们构建100多个用于AI、加速计算和全方位用途的服务器变体。合作的公司包括ASRock Rack、Asus、Gigabyte、Pegatron、QCT和Supermicro。11、黄仁勋发布了Spectrum-X加速网络平台,以提高基于以太网的云的速度。它包括Spectrum 4交换机,它有128个端口,每秒400GB和每秒51.2TB的传输速度。黄仁勋说,该交换机旨在实现新型以太网,并设计为端到端以进行自适应路由、隔离性能和进行结构内计算。它还包括Bluefield 3 Smart Nic,它连接到Spectrum 4交换机以执行拥塞控制。12、世界上最大的广告公司WPP已与英伟达Nvidia合作开发基于英伟达Omniverse的内容引擎。它将能够制作用于广告的照片和视频内容。13、机器人平台英伟达Isaac ARM现在可供任何想要构建机器人的人使用,并且是全栈的,从芯片到传感器。Isaac ARM从名为Nova Orin的芯片开始,是第一个机器人全参考堆栈,Huang说。图片来源:NVIDIA主题演讲视频截图在本次大会上,黄仁勋还“拉踩”了一波CPU。他从功耗、处理数据量等方面,指出使用GPU胜过CPU。“买越多,省越多。”黄仁勋再次表示。同时,他也列出了数据中心成本公式:数据中心总持有成本=f[成本(芯片、系统、硬件生态系统)、吞吐量(GPU、Algo软件、网络、系统软件、软件生态系统)、使用率(Algo Lib,软件生态系统)、采购运营、生命周期最佳化、电力]。黄仁勋台大演讲:我曾经历三次失败在5月27日的台湾大学发表了毕业典礼演讲上,黄仁勋再次强调了掌握AI技术的重要性:很多人担心,AI会抢走自己的工作。但真正会抢走你饭碗的,是掌握了AI技术的人。他表示,从各方面来看,AI的兴盛是计算机产业的再生契机。在下个十年,我们的产业将使用新型AI电脑,取代价值万亿美元的传统电脑。据证券时报5月29日报道,5月27日,黄仁勋在台湾大学的演讲刷屏科技圈。AI,无疑是黄仁勋演讲的主题之一。他指出,所有人即将进入一个巨大变革的世界,就像个人电脑、晶片革命一样,当前正处于AI的起跑线上,每个行业都将被革命。AI为所有人带来了巨大的机遇,反应敏捷的企业将利用AI技术提升竞争力,而未能善用AI的企业将面临衰退。黄仁勋表示,AI将改变每一份工作,大幅提升工程师、设计师、艺术家等的工作表现。他预计,每家公司和大家都必须学会善用AI,尽管有些人担心AI可能会夺走他们的工作。现阶段正处于AI技术时代的开端,AI将从根本上重塑电脑,是电脑科技产业的再一次重生,也是中国台湾厂商的黄金机遇。“请借助人工智能,完成难以想象和不可思议的事情。”有些人担心AI可能会抢走工作机会,有些人担心AI发展出自我意志。对此,黄仁勋回应到,“我们正处于一个新领域的开始,就像个人电脑、网络、移动设备与云端技术一样。但是AI的影响更为根本,每个运算层面都会被重新改写。它改变了我们撰写软件的方式、执行软件的方式。从各方面来看,这是电脑产业的再生契机,对于企业而言更是一个黄金机遇。你们正是这个产业的重要基石。”据界面新闻28日报道,在演讲中,黄仁勋提及了英伟达创业时期的三个“失败故事”,公司一路磕磕绊绊,险些濒临倒闭。他说,“在英伟达,我经历了失败,极大的失败,所有的失败都令人羞愧和尴尬,几乎使我们走向了灭亡。”他以这3个“失败故事”勉励毕业生们认清错误,坚持意志,知时而变。黄仁勋总结称,撤退对所有人而言并不容易。然而,战略性撤退、牺牲、决定放弃什么才是成功的核心,并且非常关键。黄仁勋强调,以谦逊之心面对错误,并寻求帮助,拯救了英伟达。这些特质对聪明又成功的人来说,特别困难,一如在场的毕业生。每日经济新闻综合澎湃新闻、证券时报、界面新闻 ...
智能设备 2023-05-30 10:51:56 -
实时处理照片和视频等,英特尔演示MeteorLake上的VPU能力
IT之家 5 月 30 日消息,英特尔在近日召开的 Computex 2023 大会上,展示了 Meteor Lake 处理器原型,重点演示了该处理器中协处理器 VPU 的一些功能。Meteor Lake 处理器不再使用单片式设计(monolithic design),而是采用分散式设计,组合通过的 chiplets 来满足不同工作任务。Meteor Lake 中提供的多功能处理单元(VPU),主要技术来自于英特尔 2016 年收购的 Movidius 公司。英特尔通过引入 VPU,可以加速处理 AI 算法和机器学习模型相关的任务。Meteor Lake 中的 VPU 主要任务包括实时处理照片和视频、过滤应用、自动模糊背景、缩放应用、替换图像等等,此外 VPU 还具备实时识别用户眼球运动和手势的能力。IT之家此前报道,这颗处理器是在两周前完成的,拥有 16 核 22 个线程、1.6 MB 的 L1 缓存、18 MB 的 L2 缓存和 24 MB 的 L3 缓存。 ...
智能设备 2023-05-30 10:51:49 -
知乎发布最新智能应用"搜索聚合",面壁智能开源大模型CPM-Bee10b
5月29日消息,近日知乎联合面壁智能在“2023中国国际大数据产业博览会”上发布了最新的大语言模型成果。知乎合伙人、首席技术官李大海宣布,知乎模型应用“搜索聚合”即日开启内测,面壁智能研发的中文基座大模型CPM-Bee10b全面开源,并发布了对话类模型产品“面壁露卡”。李大海表示,知乎将携手面壁智能,让中文用户在大模型时代享受到最优质的服务。此次知乎站内的大模型应用功能“搜索聚合”,将大模型能力应用到了知乎搜索上,每当用户触发搜索时,系统就会从大量提问和回答中聚合观点,提高用户获取信息、形成决策的效率。发布会上,面壁智能联合OpenBMB社区,将自研CPM-Bee 10b模型开源。李大海介绍,该模型从零开始自主训练,基于Transformer架构,中英双语表现优秀,拥有百亿量级参数、万亿级高质量语料。在ZeroCLUE评测中,CPM-Bee 10b以总分78.18分登顶;在英文常识知识推理榜单上,CPM-Bee 10b得到了67分的平均分,媲美英文开源模型LLaMA。“CPM-Bee10b 将全面开源,并允许商用。”李大海称,面壁智能一直坚持开源路线,未来也会持续拥抱开源,促进大模型领域技术和生态的繁荣。发布会还带了面壁智能研发的对话类模型产品“露卡”(Luca)。该产品在开源基础模型上又有进一步性能提升,可以进行智能交互并支持多轮对话。演示中,“露卡”展示了多项能力,既能帮助人了解世界知识、处理数理逻辑、编写程序代码、激发创作灵感;还可以利用海量知识数据,帮助人更好地获取信息、做出规划、解决问题。此外,“露卡”还可以查找论文并生成摘要。李大海介绍,“露卡”目前已开启内测,面壁将不断完善功能,让更多用户体验到大模型带来的便利。 ...
互联网 2023-05-29 12:24:00 -
NoiseColorFitPulse3手表发布
IT之家 5 月 18 日消息,Noise ColorFit Pulse 3 智能手表已在印度推出,首发价 1599 印度卢比(IT之家备注:当前约 136 元人民币),带来了更大的显示屏、语音通话支持、额外运动模式、IP68 防护等级等,提供深黑色、复古棕色、银灰色、翡翠绿色和玫瑰粉色。Noise ColorFit Pulse 3 智能手表采用金属框架和 18 毫米硅胶表带,拥有 IP68 防护等级,这意味着可以在深达 1.5 米的淡水中防水达 30 分钟。与 ColorFit Pulse 2 相比,Noise ColorFit Pulse 3 显示屏可视区域扩大 14%,边框缩小 17%,采用 1...
手机互联 2023-05-18 10:06:01 -
干翻苹果A16!高通骁龙8Gen3跑分超过160万:GPU猛涨27%
据报道,2023年下半年,高通将推出新一代安卓旗舰处理器骁龙8 Gen3。该处理器采用1+5+2架构设计,即包括1颗超大核、5颗大核和2颗小核。超大核升级为更先进的Cortex-X4,频率最高可达3.7GHz,比骁龙8 Gen2的3...
手机互联 2023-05-16 07:10:13 -
英伟达部分GPU新订单12月才能交付AI芯片持续缺货涨价
①英伟达GPU之前拿货周期大约为一个月,现在基本都需要三个月或更长。甚至,部分新订单“可能要到12月才能交付”。 据集微网消息,有代理商透露,英伟达A100价格从去年12月开始上涨,截至今年4月上半月,其5个月价格累计涨幅达到37.5%;同期A800价格累计涨幅达20...
智能设备 2023-05-15 10:14:49 -
苹果正在测试M3Pro芯片:拥有12个CPU核心和18个GPU核心
自2020年苹果宣布推出M系列自研芯片,全面取代原有产品线的x86处理器后,对整个行业的发展产生了重大的影响。虽然此前有报道称,苹果因台积电生产方面的问题,不打算在今年发布M3芯片,要等到2024年,但引入3nm工艺让不少人对M3系列充满了期待。据相关媒体报道,苹果正在测试M3 Pro芯片,CPU部分配备了12个核心,包括6个性能核和6个能效核,GPU部分有18个核心,另外还会板载36GB内存。除了M3和M3 Pro以外,苹果未来还会带来M3 Max和M3Ultra,规格上显然也会更高。传闻M3 Max拥有14个CPU核心和40个GPU核心,M3Ultra则是28个CPU核心和80个GPU核心。据了解,开发人员正在对基于M3 Pro的系统进行测试,以保证第三方应用程序的兼容性。这也是过往苹果发布新款芯片前,最常见、最可靠的方法步骤之一。利用台积电的3nm工艺,可以让苹果在相同芯片尺寸下,加入更多晶体管,提供更多核心,另外频率也有可能提升,架构方面大概率也会有改进。有消息指出,第一批配备M3芯片的Mac产品会在2024年初上市,将出现在iMac、MacBook Pro和MacBook Air产品线上。近期苹果公布了2023财年第二财季的财报,显示MacBook产品线的收入为71.68亿美元,相比一年前下降了31%。M2系列芯片的表现并不如人意,苹果或许寄望于M3系列芯片及新款Mac产品提振销量。 ...
智能设备 2023-05-15 10:14:49 -
sql server 2016不能全部用到CPU的逻辑核心数的问题
最近在工作中遇到了,sql server 2016 不能把CPU 的核心全部用到的问题.通过分析工具看到 总共CPU核心有72核,但sql 只能用到40核心,想信也有很多人遇到这问题,那么今天这节就先说说这问题是怎么出现的。首先 介绍下服务器的环境 Windows 2008 R2 Enterprise Edition(X64) + Microsoft SQL Server 2012 (SP1)Enterprise Edition (64-bit) CPU 2路 18核 开启超线程后是72核心 如图:再看sql实例的属性 如图:sql server 其实已经认出了总的核心数 72 那么sql server 是不是代表就能全部使用上呢,通过系统视图可以看到 select * from sys...
数据库操作教程 2023-05-12 12:12:37 -
必应聊天开放测试后添加GPU速度赶不上使用量
IT之家5月9日消息,微软广告和网络服务负责人米哈伊尔・帕拉欣(MikhailParakhin)近日回复网友,针对必应聊天(BingChat)响应等待时间过长致歉,并表示GPU的添加速度赶不上用户使用量的增加。IT之家翻译Parakhin的推文内容如下:“很抱歉让你遇到了延迟问题...
智能设备 2023-05-09 12:36:08 -
中国特供CPU只1399起i5、i7立减220元起
兔年春节过后,Intel面向中国市场推出了两款特供处理器i5-13490F、i7-13790F,首发价分别为1599元、2999元。目前售价调整,分别来到1399元和2779元,优惠幅度高达220元,现在正是装机的高峰期,入手非常合适...
手机互联 2023-05-01 12:39:53 -
Meta人工智能开发失误,不用GPU导致落后对手
4月25日消息,一份内部备忘录显示,2022年夏末,Meta首席执行官马克·扎克伯格(MarkZuckerberg)召集公司高管团队,分析公司计算能力长达五个小时,特别是处理尖端人工智能的能力。备忘录指出,尽管Meta在人工智能研究方面进行了高调的投资、并且公司越来越依赖人工智能来支持其增长,但在主要业务采用昂贵的人工智能优化软硬件系统上,这家社交媒体巨头的速度比较缓慢,这妨碍了其在规模扩张中跟上创新步伐的能力...
业界动态 2023-04-25 22:55:38 -
APUS创始人李涛:“中国人工智能落后绝不是两个月,起码两年以上”
文/闫妍4月18日,APUS发布自研多模态人工智能大模型“AiLMe”。AiLMe参数已达千亿规模,具备对文本、图像、视频、音频的理解和生成能力,并推出“智能问答大师、简笔成画、墨染、DailyAstro、StarNight、KJVBibleNow、PicPik”等系列AI产品...
互联网 2023-04-20 21:02:37