在人工智能的热潮中,不断的有科技巨头投入AI的芯片开发。
谷歌正在制造基于ARM架构的定制CPU“Axion”,支持其数据中心的人工智能工作,让云计算变得更便宜。在美国当地时间的4月9日,谷歌官方在拉斯维加斯举行的Cloud Next大会上表示,新处理器将于2024年晚些时候上市。
根据外媒路透社报道,基于ARM架构的Axion CPU,性能比通用ARM芯片高30%,比英特尔和AMD生产的当前一代x86芯片高出50%。谷歌计划“很快”使用Axion来支持谷歌云上的YouTube广告等服务。
谷歌试图减少对英特尔和英伟达等的依赖,追赶亚马逊和微软等竞争对手。亚马逊在2018年推出了ARM芯片Graviton。就在谷歌宣布推出ARM处理器的几个月前,微软公布了为其云基础设施设计的定制芯片。微软已经开发了人工智能定制芯片来训练大模型,并为云和人工智能工作负载定制了基于ARM的CPU。
谷歌也在更新其TPU人工智能芯片,周二,谷歌TPU v5p芯片通过谷歌云服务上线。谷歌TPU芯片作为英伟达GPU的替代品用于人工智能加速任务,尽管开发者只能通过谷歌云平台访问它们而不能直接购买。
英特尔也公布了新的人工智能芯片细节,以对抗英伟达的统治地位。当地时间4月9日,Intel Vision 2024大会上,英特尔推出用于AI训练和推理的Gaudi 3加速器,采用5纳米工艺。Gaudi 3将带来4倍的BF16 AI计算能力提升和1.5倍的内存带宽提升,预计可大幅缩短70亿和130亿参数Llama2模型以及1750亿参数GPT-3模型的训练时间。
英特尔表示,Gaudi 3芯片比英伟达上一代H100 GPU训练特定大语言模型的速度快50%。在英特尔测试的一些模型上,它的推理速度比H100芯片更快。
英特尔在Meta开源的Llama模型和阿布扎比支持的Falcon模型上测试了该芯片。英特尔表示,Gaudi 3可以训练或部署大模型,包括文生图模型Stable Diffusion和Open AI旗下用于语音识别的Whisper模型等。这个芯片的功耗将更低。
路透社表示,Gaudi 3芯片预计今年第二季度向超微电脑(Supermicro)和惠普企业(Hewlett Packard Enterprise)等服务器制造商提供。
过去的一年中,英伟达凭借其GPU在人工智能芯片市场上占据约80%的份。今年3月,英伟达在其GTC大会上推出了H100的继任者,即用于运行人工智能模型的新一代人工智能芯片B200和GB200。
聚焦生成式AI、移动游戏创新,联发科天玑开发者大会MDDC将至