2月27日消息,中国人工智能公司DeepSeek于1月发布的最新模型DeepSeek-R1迅速蹿红,短暂超越OpenAI的ChatGPT,成为苹果应用商店下载量第一的免费应用。这一事件引发了人工智能行业的地震,迫使许多公司重新评估人工智能模型开发所需的资源和成本,并对人工智能基础设施供应商,特别是英伟达,造成了显著冲击
2月27日消息,中国人工智能公司DeepSeek于1月发布的最新模型DeepSeek-R1迅速蹿红,短暂超越OpenAI的ChatGPT,成为苹果应用商店下载量第一的免费应用。这一事件引发了人工智能行业的地震,迫使许多公司重新评估人工智能模型开发所需的资源和成本,并对人工智能基础设施供应商,特别是英伟达,造成了显著冲击。DeepSeek-R1的成功证明,开发先进的人工智能模型不再需要依赖巨额的算力和资金投入,这直接导致英伟达股价单日跌幅超过15%。
DeepSeek-R1的低成本高效性,引发了业界对人工智能模型开发模式的广泛讨论。DeepSeek声称仅用600万美元就训练出了DeepSeek-R1模型,这一数字与谷歌Gemini的1.49亿美元(还不包括员工薪水)相比,显得微不足道。然而,这一成本数字也引发了争议。Vectara首席执行官艾姆尔·阿瓦达拉(Amr Awadallah)认为,DeepSeek的实际训练成本远高于600万美元,可能至少在5000万美元甚至更高,因为要获得一个有效的模型,通常需要进行多次训练。尽管存在争议,DeepSeek-R1的低成本开发依然对整个行业产生了巨大的影响。
DeepSeek-R1的成功,并非仅仅体现在低成本上,更重要的是它挑战了传统大模型开发对高性能硬件的依赖。该模型运行在英特尔的Xeon和Gaudi处理器上,这表明先进的人工智能模型可以在更低端的硬件上进行训练和运行。英特尔发言人表示,这些处理器“帮助客户以更低的成本获得强劲性能”,这为更多公司参与人工智能模型开发提供了机会。DeepSeek的这一突破,加速了人工智能模型的商品化进程,使得这项技术不再被少数拥有巨额资金和资源的大公司所垄断。
Kolena联合创始人兼首席执行官穆罕默德·埃尔根迪(Mohamed Elgendy)认为,DeepSeek-R1的出现标志着人工智能行业的一个转折点,未来将朝着更加民主化的方向发展。他指出,DeepSeek的方案证明,通过优化模型构建流程,可以大幅减少算力需求,这对于依赖高性能芯片的英伟达来说无疑是个坏消息。然而,这同时也意味着,更多公司将能够参与到基础模型的构建中,打破了大型科技公司对该领域的垄断。市场上已经出现了低至50美元的LLM(大语言模型),这进一步佐证了这一趋势。埃尔根迪强调:“DeepSeek问世前后的行业格局已截然不同。”
然而,DeepSeek-R1并非完美无缺。Vectara的测试显示,DeepSeek-R1的“幻觉”率高达14.3%,远高于OpenAI GPT-4的约2%,甚至高于其自身不具备推理能力的前代模型DeepSeek-V3。 此外,埃尔根迪也指出,在对比测试中,DeepSeek在多数对抗性攻击(如越狱型攻击)中表现脆弱。这些问题在几年前的GPT-3上也曾出现,但主流厂商现已基本解决。尽管存在这些缺陷,埃尔根迪仍然认为DeepSeek代表了一种更高效的大型模型训练方法,并且这种方法确实有效。他将DeepSeek比作未经雕琢的璞玉,认为随着时间的推移,其准确性和鲁棒性将得到逐步提升。
DeepSeek-R1的出现,也引发了业界对人工智能基础设施未来发展方向的思考。IntegralAI首席执行官贾德·塔里夫(Jad Tarifi)在其2024年著作《超级智能的崛起》中写道:“尽管许多研究人员专注于提高人工智能模型的计算和数据效率,但对强大基础设施的需求仍将至关重要。即便模型趋向轻量化,预期中的实际部署仍将确保对强大算力资源的需求持续增长。” 这与埃尔根迪对未来人工智能民主化的乐观预测形成对比。
阿瓦达拉则认为,DeepSeek的出现标志着人工智能模型构建者和大型人工智能基础设施提供商利润率压缩的开始。他将这一转变比作闪存驱动器的发展史:早期需要大量设计和开发,但如今已成为利润较低的普通商品。他认为DeepSeek能够在低端硬件上训练其模型,而无需依赖美国大公司使用的高端硬件,实质上加速了市场商品化进程。他预测,整个行业收入将继续增长,甚至大幅增长,但大型公司能够提取的利润将显著下降,这将给它们带来一定的压力。
近期关于微软缩减人工智能数据中心建设规模的报道,也加剧了投资者的担忧。尽管微软否认了这一说法,表示仍致力于实施其800亿美元的支出计划,但承认可能会“根据需要在某些基础设施领域进行战略性调整”。 这也从侧面反映了人工智能基础设施市场面临的挑战和不确定性。
英伟达首席执行官黄仁勋在最近的一次预录采访中表示:“市场对R1的反应是,‘天哪,人工智能开发已经完成了’,认为人工智能不再需要更多计算了。但事实恰恰相反。” 他的观点与DeepSeek所带来的乐观预期形成鲜明对比,他认为人工智能仍然需要强大的算力支持。
DeepSeek-R1的成功,以及其背后所代表的技术进步,将对整个AI行业产生深远的影响。它不仅降低了人工智能模型开发的门槛,也激化了人工智能基础设施提供商之间的竞争。未来,只有那些能够在利润率下降的情况下依然保持竞争力的公司,才能在这个快速变化的市场中立于不败之地。阿瓦达拉认为,人工智能基础设施提供商(如英伟达)之间的竞争将更加激烈。 DeepSeek的崛起,预示着人工智能领域的竞争将更加白热化,同时也为人工智能的未来发展带来了新的可能性和挑战。 而DeepSeek本身,在经历了最初的惊艳之后,还需要不断改进其模型的准确性和鲁棒性,才能在激烈的竞争中获得长久的成功。 这个“不完美”但极具潜力的模型,将继续推动着人工智能行业向前发展。 埃尔根迪对未来充满期待,他特别期待在医疗、研究、制药、会计、金融等特定领域出现更多基础模型,并认为测试和验证将成为最重要的部分,因为其他组件已经商品化。他相信市场竞争将起到监督作用,因为“市场现在就在充当监管者的角色”。 DeepSeek-R1的出现,无疑开启了人工智能发展的新篇章,其长远影响还有待时间的检验。
标签: DeepSeek-R1 崛起 人工智能 行业 成本 革命 未来 展望
声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!