科普教育篇導引

英偉達（NVIDIA） H100 Tensor Core GPU 性能詳解

瀏覽：1228 來源：通信人在線日期：2025-03-03

●文章摘要：

人工智能（AI）、高性能計算（HPC）以及數(shù)據(jù)分析的復雜性呈指數(shù)級增長，這要求科學家和工程師使用最先進的計算平臺。NVIDIA Hopper GPU 架構(gòu)能夠以低延遲提供最高性能計算，并集成了用于數(shù)據(jù)中心規(guī)模計算的全套功能。由 NVIDIA Hopper GPU 架構(gòu)驅(qū)動的 NVIDIA? H100 Tensor Core GPU 為 NVIDIA 的數(shù)據(jù)中心平臺帶來了加速計算性能的新一次巨大飛躍。H100 以安全的方式加速從小型企業(yè)工作負載到百億億次高性能計算（exascale HPC）再到萬億參數(shù)人工智能模型等各種工作負載。H100采用臺積電專為英偉達定制的 4N 工藝制造，包含 800 億個晶體管，并且具備眾多架構(gòu)上的革新，是迄今為止制造出來的最先進的芯片。該技術(shù)文檔摘編自英偉達（NVIDIA）相關(guān)技術(shù)人員對Hopper架構(gòu)H100 GPU技術(shù)性能的詳解。

欲更多了解英偉達（NVIDIA）相關(guān)GPU技術(shù)介紹的請進入。

●關(guān)鍵詞：

NVIDIA； H100；Tensor Core；GPU；性能詳解

●作者簡介：

Michael Andersch Michael： NVIDIA 的首席 GPU 架構(gòu)師和高級架構(gòu)經(jīng)理。

Greg Palmer Greg：NVIDIA GPU 架構(gòu)小組的杰出工程師。

Ronny Krashinsky Ronny：NVIDIA 杰出工程師，從事 GPU 架構(gòu)設(shè)計工作已有十多年。

還有：Nick Stam Nick、Vishal Mehta Vishal、Gonzalo Brito Gonzalo和Sridhar Ramaswamy Sridhar等。

●文章來源：

摘自NVIDIA網(wǎng)站（2022年3月）

●文章目錄：

一、緒論

二、NVIDIA H100 GPU 主要功能概述

三、NVIDIA H 100 GPU 縱深架構(gòu)

3.1 概述；3.2 GH 100 GPU；3.3 具有 PCIe Gen 5 板外形的 NVIDIA H100 GPU；3.4 制造工藝

四、H 100 SM 架構(gòu)

4.1 概述；4.2 H 100 SM 主要功能摘要

五、H 100 Tensor Core 架構(gòu)

六、NVIDIA Hopper FP8 數(shù)據(jù)格式

七、用于加速動態(tài)編程的新 DPX 指令

八、H100 計算性能摘要

九、H 100 GPU 層次結(jié)構(gòu)和異步改進

9.1 線程塊集群；9.2 分布式共享內(nèi)存；9.3 異步執(zhí)行；9.4 Tensor 內(nèi)存加速器；9.5 異步事務屏障

十、H100 HBM 和 L2 高速緩存架構(gòu)

10.1 H100 HBM3 和 HBM2e DRAM 子系統(tǒng)；10.2 H100 L2 緩存

十一、其它

11.1 Transformer 引擎；11.2 第四代 NVLink 和 NVLink 網(wǎng)絡；11.3 第三代 NVSwitch；11.4 新的 NVLink 交換系統(tǒng)；11.5 第 5 代PCIe

●文章內(nèi)容：

附件

英偉達（NVIDIA） H100 Tensor Core GPU 性能詳解

1.01MB

果冻传媒高清在线播放_黑人巨茎大战椎名由奈_女人毛片视频_高中生喷水喷浆 - 成人国产精品

英偉達（NVIDIA） H100 Tensor Core GPU 性能詳解