Cerebras发布WSE-3:世界上最大的用于训练模型的人工智能芯片 🚀

单个半导体晶片的性能翻倍,使其能够高效处理具有数万亿参数的大型语言模型

“`html

AI初创公司Cerebras公布了用于生成式人工智能的最大芯片WSE-3。

更大更好的人工智能模型之争日趋激烈,与英伟达(Nvidia)齐名的Cerebras Systems刚刚公布了其最新作品——Wafer Scale Engine 3(WSE-3)。这款第三代人工智能芯片是世界上最大的半导体芯片,将彻底改变整个行业。

简介

对于更强大的人工智能模型的需求不断推动芯片技术的发展界限。以其在该领域创新著称的Cerebras Systems刚刚推出了WSE-3,这是全球最大的人工智能芯片。这款开创性的芯片专为训练人工智能模型而设计,优化神经权重以提升功能性。在本文中,我们将探讨WSE-3的特点,分析其对行业的影响,并讨论其未来前景。

强大的WSE-3

WSE-3具有令人瞩目的性能提升,为人工智能芯片设立了新的标准。指令吞吐量翻倍,从62.5 petaFLOPs增至惊人的125 petaFLOPs,这款芯片拥有强大的计算能力。其晶体管数量也得到了显著提升,达到4万亿个,而前一代产品只有2.6万亿个。采用5纳米技术制造的WSE-3利用了TSMC的制造专业知识,后者是全球领先的芯片制造商之一。

真正的摩尔定律跨越

Cerebras Systems的联合创始人兼首席执行官安德鲁·费尔德曼(Andrew Feldman)强调了WSE-3在摩尔定律方面的重要性。摩尔定律指出芯片电路大致每18个月翻倍一次。费尔德曼宣称,WSE-3代表了真实的摩尔定律跨越,性能翻倍的同时保持相同的功耗和售价。这一进步是该行业期待已久的突破。

尺寸重要

在芯片尺寸方面,WSE-3比其竞争对手(尤其是Nvidia的H100 GPU)都要大得多。费尔德曼对比了两者,突出了性能上的巨大差异。WSE-3比Nvidia的产品大57倍,拥有52倍更多的核心、800倍更多的片上内存和超过3,700倍更多的布线带宽。这些引人注目的数据为WSE-3出色的性能奠定了基础。

完美的平衡

Cerebras在WSE-3中平衡了计算与内存。通过略微增加内存容量和计算核心数量,他们创造了一款既优化计算又优化内存的芯片。费尔德曼表示,他们相信已经实现了计算和内存的理想结合,为人工智能训练提供最佳性能。

重新定义训练时间规则

WSE-3提供了巨大的计算能力,能够处理具有惊人240万亿参数的理论大型语言模型。这比OpenAI的GPT-4等顶级生成式人工智能工具的参数要高一个数量级,后者传闻仅有1万亿参数。Cerebras的设备允许在单个设备上执行整个240万亿参数。相比之下,GPU需要更复杂的编程和更多的代码行来实现类似的结果。

问答

问:WSE-3在尺寸方面如何与其他人工智能芯片相比?

答:WSE-3是目前最大的人工智能芯片,比竞争对手巨大。与Nvidia的H100 GPU相比,它体积大57倍,提供更多的核心、片上内存和布线带宽。

问:WSE-3增强的计算和内存能力具有何重要意义?

答:通过平衡计算和内存,WSE-3实现了人工智能训练的最佳性能。这确保模型可以更快、更高效地训练。

问:与GPU相比,WSE-3如何简化编程?

答:Cerebras的设备比GPU更易于编程。虽然GPU需要复杂的编程,但WSE-3减少了实现类似结果所需的代码行数,使其更易于使用且用户友好。

“““html

Q: WSE-3的性能如何与其他AI芯片相比?

A: WSE-3提供了无与伦比的性能,实现了每秒125拍千亿次的指令吞吐量。这种巨大的计算能力使其能够处理具有高达24万亿参数的大语言模型,使其在竞争对手中脱颖而出。

增强推理的伙伴关系

除了WSE-3令人瞩目的训练能力外,Cerebras还与芯片巨头高通合作,以提升推理过程。通过利用高通的AI 100处理器,Cerebras旨在降低生产中运行生成式AI模型的成本。通过稀疏性、投机解码和网络架构搜索等技术,Cerebras和高通已在推理性能方面取得了显著改进。

展望未来

WSE-3的推出标志着AI芯片发展的一个重要时刻。凭借其开创性的性能和效率,这款芯片为该行业设立了新的标准。随着AI模型的不断增长,以及复杂性的增加,像WSE-3这样的芯片将在推动该领域发展中发挥至关重要的作用。

结论

Cerebras的WSE-3证明了对更强大AI模型的不懈追求。凭借其空前的尺寸、性能以及针对训练的优化,WSE-3已准备革新该行业。这款芯片代表了一大步,提供了增强的计算能力,将推动AI研究和开发方面的进步。

记得分享这篇文章,并在下方评论区告诉我们你的想法!💬


参考资料:

  1. 中国的生成式视频竞赛加剧
  2. 获得Microsoft Project 2021和Visio 2021可享30%折扣
  3. AI防火墙如何保护您的新业务应用
  4. AlphaTheta(前Pioneer DJ Corp)推出首款无线DJ控制器和扬声器
  5. 中国的“Moonshot AI”飙升至250亿美元估值,为LLM重点长篇背景筹集10亿美元
  6. AI先锋Cerebras在混合AI计算领域继续“千载难逢的一年”
  7. airfocus获得7500万美元用于挑战项目管理软件
  8. 利用新型芯片使GenAI更高效

“`