英伟达GB200、B200、H200、H100、A100、4090的参数对比

算力—大模型2024-11-07

以下是英伟达GB200、B200、H200、H100、A100、4090的参数对比：

型号

架构

制造工艺

晶体管数量

显存类型

显存容量

显存带宽

CUDA核心数

其他主要特性

GB200

Blackwell

未知

2个B200 GPU共4160亿

HBM3e

每颗B200 GPU 192GB（总384GB，组合后）

每颗B200 GPU 8TB/s（总16TB/s，组合后）

未知

由2个B200 GPU和1个Grace CPU组合而成，专为高性能AI应用设计

B200

Blackwell

4纳米

2080亿

HBM3e

192GB

8TB/s

未知

高性能AI芯片，FP16算力是H100的2倍以上，TDP为1000W

H200

Hopper

未知

未知

HBM3e

141GB

4.8TB/s

未知

升级了GPU显存，是H100的升级款产品

H100

Hopper

4纳米

800亿

HBM3

高达64GB（可能存在其他配置）

高达3TB/s

14592个

支持PCIe 5.0和NVLink 8.0技术，专为AI和高性能计算优化

A100

Ampere

7纳米

未知

HBM2e

提供40GB和80GB两种版本

高达2TB/s（80GB版本）

6912个

支持PCIe 4.0和第三代NVLink互连技术

RTX 4090

Ada Lovelace

未知

未知

GDDR6X

24GB

未知

16384个

配备GDDR6X显存，支持DirectX12 Ultimate，用于高端游戏和图形工作站

GB200：

是英伟达新一代的高性能AI加速卡，采用了Blackwell GPU架构，专为人工智能模型设计。

由两个B200 GPU和一个Grace CPU组成，形成了一个强大的AI加速平台。

与前代H100相比，GB200的算力有显著提升，能耗和成本也有所降低。

B200：

是英伟达新一代旗舰AI芯片，同样基于Blackwell架构。

拥有高达2080亿个晶体管，支持PCIe 6.0和HBM3e内存。

FP8性能可达20 petaflops，比A100提升10倍，非常适合各种AI应用。

H200：

是H100的升级款产品，主要升级了GPU显存。

采用了HBM3e显存技术，显存容量和带宽都有所提升。

H100：

采用了新一代的Hopper架构，是英伟达迄今为止推出的最为强大的一款GPU之一。

拥有高达1.8万亿次/秒的张量处理能力，专为AI和高性能计算优化。

支持PCIe 5.0和NVLink 8.0技术，提供了高速的数据传输能力。

A100：

基于Ampere架构，是英伟达的一款高性能GPU。

提供了高容量的HBM2e显存和高速的数据传输接口。

适用于深度学习、高性能计算和数据中心等场景。

RTX 4090：

是英伟达的一款高性能显卡，采用了Ada Lovelace架构。

配备了GDDR6X显存，提供了快速的数据传输速度。

引入了多项创新技术，如硬件光线追踪和可变速率着色，适用于高端游戏和图形工作站。

以下是英伟达GB200、B200、H200、H100、A100、4090的具体特点：

GB200

高性能AI加速：GB200是英伟达新一代的高性能AI加速卡，专为人工智能模型设计。通过组合两个B200 GPU和一个Grace CPU，形成了一个强大的AI加速平台。

先进封装工艺：英伟达Blackwell系列是第一个使用台积电CoWoS-L封装工艺的芯片，GB200作为该系列的一员，具有出色的性能和功耗表现。

灵活部署：GB200提供了多种外形尺寸和机柜选择，满足用户在不同场景下的部署需求。

B200

强大算力：B200是英伟达新一代旗舰AI芯片，拥有高达2080亿个晶体管，FP8性能可达20 petaflops，比A100提升10倍。

高效互连：B200采用了先进的NVLink-C2C互连技术和第五代NVLink技术，提升了通信速度和整体性能。

数据隐私保护：支持机密计算和压缩引擎，提高数据隐私保护和计算效率。

H200

高容量显存：H200是H100的升级款产品，主要升级了GPU显存。采用了HBM3e显存技术，显存容量和带宽都有所提升，为AI和高性能计算提供了更强的支持。

高性能计算：H200在高性能计算方面表现出色，能够实现高效的并行处理和数据处理能力。

H100

新一代Hopper架构：H100采用了新一代的Hopper架构，具有出色的AI训练和推理能力。

高效能耗比：H100在提供高性能的同时，还具有较低的能耗和成本，非常适合大规模部署。

多样化应用场景：H100适用于深度学习、高性能计算和数据中心等多种场景，满足用户的不同需求。

A100

Ampere架构：A100基于Ampere架构，具有出色的性能和功耗表现。

多精度计算：A100支持双精度（FP64）、单精度（FP32）、半精度（FP16）和整数（INT8）计算负载，满足不同应用场景的需求。

高性能存储：A100配备了高容量的HBM2e显存和高速的数据传输接口，提供了强大的存储和数据处理能力。

RTX 4090

高性能显卡：RTX 4090是英伟达的一款高性能显卡，适用于高端游戏和图形工作站。

先进架构：RTX 4090采用了Ada Lovelace架构，引入了多项创新技术，如硬件光线追踪和可变速率着色。

高容量显存：RTX 4090配备了GDDR6X显存，提供了快速的数据传输速度，满足高端游戏和图形处理的需求。

次阅读

评论

赞同

收藏

分享

算力—大模型

评论

赞同

收藏

分享

评论·0

提交评论

加载中…

热门资讯

© 2025 懂车帝 www.dongchedi.com 渝公网安备50010502503425号渝ICP备2023013619号-7 增值电信业务经营许可证（告渝B2-20230001）广播电视节目制作经营许可证

公司名称：重庆懂车帝科技有限公司中央网信办违法和不良信息举报中心违法和不良信息举报电话：400-140-2108

举报邮箱：jubao@mail.dongchedi.com

用户协议 | 隐私协议 | 营业执照

站点地图侵权投诉我要反馈加入我们广告投放懂车指数