ASIC芯片：全球玩家及竞争格局_ACE阻尼器-轮廓_江南体育app下载

江南体育app下载 · ACE阻尼器-轮廓

ASIC芯片：全球玩家及竞争格局

产品描述：ASIC芯片：全球玩家及竞争格局

时间：2024-01-21 20:31:26 来源：江南体育app下载

在线订购

头部厂商纷纷切入 AI ASIC领域，看好ASIC在AI领域的长期成长性。

谷歌：谷歌为AI ASIC芯片的先驱，于15年发布第一代TPU（ASIC）产品，大幅度的提高AI推理的性能；17年发布TPU v2，在芯片设计层面，进行大规模架构更新，使其同时具备AI推理和AI训练的能力；谷歌TPU产品持续迭代升级，21年发布TPU v4，采用7nm工艺，峰值算力达275TFLOPS，性能表现全球领先。

英特尔：19年底收购以色列人工智能芯片公司Habana Labs，22年发布Gaudi 2 ASIC芯片。从架构来看，Gaudi架构拥有双计算引擎（MME和TPC），能轻松实现MME和TPC并行计算，大幅度的提高计算效率；同时，其将RDMA技术应用于芯片互联，大幅度的提高AI集群的并行解决能力；从性能来看，Gaudi 2在ResNET-50、BERT、BERT Phase-1、BERT Phase-2模型的训练吞吐量优于英伟达A100，性能表现优异。

头部厂商纷纷切入AI ASIC领域，技术路径不同。本文内容来自“GPT-5后NLP大模型逐步走向收敛，ASIC将大有可为”，详细的介绍谷歌——全球AI ASIC先驱，TPU产品持续迭代，以及英特尔——收购Habana Lab，Gaudi 2性能表现出色。

ASIC具有性能高、体积小、功率低等特点。AI芯片指专门用于运行AI算法且做了优化设计的芯片，为满足多种场景下的AI应用需求，AI芯片逐渐表现出专用性、多样性的特点。根据设计需求，AI芯片大致上可以分为中央处理器CPU）、图形处理器（GPU）、现场可编程逻辑门阵列（FPGA）、专用集成电路（ASIC）等，相比于其他AI芯片，ASIC具有性能高、体积小、功率低等特点。

1）CPU阶段：尚未出现突破性的AI算法，且能获取的数据较为有限，传统CPU可满足算力要求；

2）GPU阶段：2006年英伟达发布CUDA架构，第一次让GPU具备了可编程性，GPU开始大规模应用于AI领域；

3）ASIC阶段：2016年，Google发布TPU芯片（ASIC类），ASIC克服了GPU价格昂贵、功耗高的缺点，ASIC芯片开始慢慢地应用于AI领域，成为AI芯片的重要分支。

ASIC芯片在推理领域有着非常明显优势，有望在该领域率先出现爆品。根据CSET数据，ASIC芯片在推理领域优势显著，其效率和速度约为CPU的100-1000倍，相较于GPU和FPGA具备显著竞争力。尽管ASIC芯片一样能应用于训练领域（例如TPU v2、v3、v4），但我们大家都认为其将在推理领域率先出现爆品。

预计ASIC在AI芯片的占比将大幅度的提高。根据McKinsey Analysis数据，在数据中心侧，25年ASIC在推理/训练应用占比分别达到40%、50%；在边缘侧，25年ASIC在推理/训练应用占比分别达到70%、70%，ASIC在AI芯片的占比将大幅度的提高。

AMD利用自身技术积累，将CPU和GPU集成在一起，推出Instinct MI300芯片，预计23年H2上市。

头部厂商开始切入ASIC领域，Google为AI ASIC芯片的先驱，21年推出TPU v4，运算效能大幅提升；英特尔19年收购Habana Lab，22年推出Gaudi2 ASIC芯片；IBM、三星等头部厂商亦纷纷切入ASIC领域。

谷歌为全球AI ASIC先驱，TPU产品持续迭代。谷歌2015年发布TPU v1，与使用通用CPU和GPU的神经网络计算相比，TPU v1带来了15~30倍的性能提升和30~80倍的能效提升，其以较低成本支持谷歌的很多服务，仅可用于推理；17年发布TPU v2，用于加速大量的机器学习和人工智能工作负载，包括训练和推理；18年发布TPU v3，算力和功率大幅度增长，其采用了当时最新的液冷技术；20年和21年分别发布TPU v4i和v4，应用7nm工艺，晶体管数大幅度的提高，算力提升，功耗下降。

统一缓冲器（Unified Buffer）和矩阵乘法单元（MMU）占据53%的芯片总面积。TPU v1最重要的包含统一缓冲器（Unified Buffer）、矩阵乘法单元（MMU）、累加器（Accumulators）、激活流水线电路（ActivationPipeline）、DDAM等，其中统一缓冲器和矩阵乘法单元面积占比最高，合计达53%。

TPU v2内核数增加值2个。TPU v1仅有1个Tensor Core，导致管道更为冗长。TPU v2的内核数增加为2个，对编译器也更为友好。

MXU利用率提升。TPU v1的MXU包含256256个乘积累加运算器，由于部分卷积计算规模小于256256，导致单个大核的利用率相比来说较低；而TPU v2的单核MXU包含128128个乘积累加运算器，在某些特定的程度上，提升了MXU利用率。

谷歌TPU v3延续v2架构，性能提升。TPU V3在v2架构的基础上，矩阵乘法单元（MXU）数量提升翻倍，时钟频率加快30%，内存带宽加大30%，HBM容量翻倍，芯片间带宽扩大了30%，可连接的节点数为先前4倍，性能大幅提升。

采用液冷技术，TDP优化。TPU v3采用液冷技术，峰值算力为TPU v2的2.67倍，而TDP仅为TPU v2的1.61倍，TDP大幅优化。

谷歌的超级计算机构想：将44*4（64）个TPU v4芯片连接成1个立方体结构（Cube），再将444个立方体结构（Cube）连接成共有4096个TPU v4芯片的超级计算机，其中物理距离较近TPU v4芯片（即同一个Cube中的444个芯片）采用常规电互联方式，距离较远的TPU（例如Cube之间的互联）间用光互连。采用光互连技术能有很大成效避免“芯片等数据”的情形出现，进而提升计算效率。

可重配置光互连技术能进一步提升计算性能。谷歌TPU v4通过加入光路开关（OCS）的方式，能够准确的通过具体模型数据流来调整TPU之间的互联拓扑，实现最优性能，可重配置光互连技术能将性能提升至先前的1.2-2.3倍。

可重配置光互连技术提升计算机的稳定性。若计算机中部分芯片发生故障，能够最终靠该技术绕过故障芯片，进而不可能影响总系统的工作。

英特尔收购Habana Lab。Habana Labs成立于2016年，总部在以色列，是一家为数据中心提供可编程深度学习加速器厂商，2019年发布第一代Gaudi。英特尔于2019年底收购Habana Lab，旨在加快其在人工智能芯片领域的发展，2022年发布Gaudi 2。

Gaudi架构实现MME和TPC并行运算。Gaudi架构包含2个计算引擎，即矩阵乘法引擎（MME）和TPC（张量处理核心）；Gaudi架构使得MME和TPC计算时间重叠，进行并行运算，进而大幅度的提高计算效率。

Gaudi 2延续上一代架构，硬件配置大幅度的提高。Gaudi 2架构基本与上一代相同，TPC数量从8个提升至24个，HBM数量从4个提升至6个（总内存从32GB提升至96GB），SRAM存储器提升一倍，RDMA从10个提升至24个，同时集成了多媒体处理引擎，硬件配置大幅度的提高。

RDMA技术用于芯片互联，大幅提升并行解决能力。RDMA是一种远端内存直接访问技术，具有高速、超低延迟和极低CPU使用率的特点。Gaudi将RDMA集成在芯片上，用于实现芯片间互联，大幅度的提高AI集群的并行解决能力；同时，Gaudi支持通用以太网协议，客户能将Gaudi放入现有的数据中心，使用标准以太网构建AI集群。

文章出处：【微信号：架构师技术联盟，微信公众号：架构师技术联盟】欢迎添加关注！文章转载请注明出处。

FPGA从1984 年到今天，发展经历了30 多年时间。它可以替代其他 PLD 或者各种中小规模数字逻辑

类型，它们在设计上有一些相同点和不同点。本文将通过举例说明这些特点，以便更好地理解它们的设计差异和应用场景。

在未来的发展中更具有前途。然而，这取决于具体的应用场景和需求。在本文中，我们将探讨FPGA和

目前英伟达产品 DGX GH200 已发布，互连技术强大，算力进一步升级。5月 29 日，英伟达在其发布会上，正式对外发布最新的 GH200 Grace Hopper 超级

被认为是一种为专门目的而设计的集成电路，是指应特定用户要求和特定电子系统的需要而设计、制造的集成电路。

中的“特定应用”是啥意思？ /

冒险和毛刺问题，话不多说，上货。 FPGA从1984 年到今天，发展经历了30 多年时间。它可以替代其他 PLD 或者各种中小规模数字逻辑

相对稳定。由于连接器下游应用广泛，因此涉及到很多技术壁垒较高的细分产品和应用领域，部分历史悠远长久、规模庞大的海外企业在多个应用

被认为是一种为专门目的而设计的集成电路，是指应特定用户要求和特定电子系统的需要而设计、制造的集成电路。

目前，智能驾驶领域在处理深度学习AI算法方面， **主要是采用GPU、FPGA 等适合并行计算的通用

特性及对比 /

模块由外挂存储单元、电源管理器、音频画面处理器、网络电路等IP核拼凑而成。

上一篇: 欧赔基础知识连载(6)：解密博彩公司怎么运作下一篇: 埃夫特与阿里云协作背面考虑油压缓冲器的效果

相关产品

1楼业主打爆地库防水层电梯多次泡水邻居们太惨了

高层电梯出毛病怎么修理成难题

《新电梯网》早新闻今天是2024年３月14日二月初五星期四

压力分不一样科学辨认很重要

导航栏目

江南体育app+

ACE缓冲器-小型

ACE缓冲器-工业

江南体育app下载+

ACE阻尼器-轮廓

ACE阻尼器-安全型

江南体育app

君越-太平洋汽车2024-03-18

2011款宝马X3 35i 替换前减震器（电感2024-03-18

伴随汽车智能化应用场景智能网联汽车的安全问题呈扩大趋势2024-03-18

无人驾驶级别L1级2024-03-17

Oracle ACE普遍的问题有哪些2024-03-17

联系我们
CONTACT US
联系人：江南体育app下载

手机：86-25-52791167 52791168

邮箱：njxj888@163.com

公司：江南体育app下载_安卓通用版

地址：江苏南京市江宁区双龙大道1222号同曦国际广场1号楼8层