Hopper (микроархитектура)
Nvidia Hopper | |
---|---|
Кодовое имя | GH100 |
Дата выпуска | Март 2022 (NVIDIA H100) |
Производители | TSMC (4 нм) |
Тип памяти | HBM3 |
Hopper — микроархитектура профессиональных графических процессоров класса Server/Datacenter представленная в марте 2022 года, и разработанная корпорацией NVIDIA Corporation в качестве преемника микроархитектуры Ampere. Она названа в честь Грейс Мюррей Хоппер (англ. Grace Murray Hopper) — американской учёной в области информатики и контр-адмирала Военно-морских сил США, которая была одной из первых программистов компьютера Марк I.
Микроархитектура Hopper с тензорными ядрами была анонсирована в конце марта 2022 года и впервые появилась в ускорителе GPGPU-вычислений уровня дата-центра NVIDIA H100 с 80 Гбайт HBM3 памяти, который содержит порядка 80 млрд транзисторов. Ускорители NVIDIA H100 например используются в HPC-серверах Nvidia DGX H100 для машинного обучения систем искусственного интеллекта[1][2].
Не существует массовых видеокарт десктопного уровня серии GeForce на базе микроархитектуры Hopper. В сентябре же 2022 года были представлены графические ускорители десктопного уровня серии GeForce RTX 40 с упрощённой микроархитектурой Ada Lovelace, названной в честь математика Ады Лавлейс, которая также пришли на смену микроархитектуры Ampere[3].
Технические подробности
Архитектурные усовершенствования микроархитектуры Hopper включают следующее:
- CUDA Compute Capability 9.0
- Память с высокой пропускной способностью 3-го поколения (HBM3).
- NVLink 4.0: шина с высокой пропускной способностью между центральным процессором и графическим процессором, а также между несколькими графическими процессорами. Обеспечивает гораздо более высокие скорости передачи, чем те, которые достижимы при использовании PCI Express; обеспечивает скорость 50 Гбайт/с на один канал и до 900 Гбайт/с (18 × 50 Гбайт/с) на один GPU.
- Тензорные ядра: Тензорное ядро — это объект, который умножает две матрицы FP16 4×4, а затем добавляет к результату третью матрицу FP16 или FP32 с помощью операций умножения примесей и получает результат FP32, который при необходимости можно понизить до результатов FP16. Тензорные ядра предназначены для ускорения обучения нейронных сетей.
Спецификации
Сравнительная таблица GP100, GV100, GA100 и GH100[4][5]
GPU features | NVIDIA Tesla P100 | NVIDIA Tesla V100 | NVIDIA A100 | NVIDIA H100 |
---|---|---|---|---|
GPU codename | GP100 | GV100 | GA100 | GH100 |
GPU architecture | NVIDIA Pascal | NVIDIA Volta | NVIDIA Ampere | NVIDIA Hopper |
Compute capability | 6.0 | 7.0 | 8.0 | 9.0 |
Threads / warp | 32 | 32 | 32 | 32 |
Max warps / SM | 64 | 64 | 64 | 64 |
Max threads / SM | 2048 | 2048 | 2048 | 2048 |
Max thread blocks / SM | 32 | 32 | 32 | 32 |
Max Thread Blocks / Thread Block Clusters | N/A | N/A | N/A | 16 |
Max 32-bit registers / SM | 65536 | 65536 | 65536 | 65536 |
Max registers / block | 65536 | 65536 | 65536 | 65536 |
Max registers / thread | 255 | 255 | 255 | 255 |
Max thread block size | 1024 | 1024 | 1024 | 1024 |
FP32 cores / SM | 64 | 64 | 64 | 128 |
Ratio of SM registers to FP32 cores | 1024 | 1024 | 1024 | 512 |
Shared Memory Size / SM | 64 KB | Configurable up to 96 KB | Configurable up to 164 KB | Configurable up to 228 KB |
Матрица сравнения поддержания точности вычислений[6][7]
Supported CUDA Core Precisions | Supported Tensor Core Precisions | |||||||||||||||||
FP8 | FP16 | FP32 | FP64 | INT1 | INT4 | INT8 | TF32 | BF16 | FP8 | FP16 | FP32 | FP64 | INT1 | INT4 | INT8 | TF32 | BF16 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NVIDIA Tesla P4 | Нет | Нет | Да | Да | Нет | Нет | Да | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
NVIDIA P100 | Нет | Да | Да | Да | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
NVIDIA Volta | Нет | Да | Да | Да | Нет | Нет | Да | Нет | Нет | Нет | Да | Нет | Нет | Нет | Нет | Нет | Нет | Нет |
NVIDIA Turing | Нет | Да | Да | Да | Нет | Нет | Да | Нет | Нет | Нет | Да | Нет | Нет | Да | Да | Да | Нет | Нет |
NVIDIA A100 | Нет | Да | Да | Да | Нет | Нет | Да | Нет | Да | Нет | Да | Нет | Да | Да | Да | Да | Да | Да |
NVIDIA H100 | Нет | Да | Да | Да | Нет | Нет | Да | Нет | Да | Да | Да | Нет | Да | Нет | Нет | Да | Да | Да |
Обозначение:
- FPnn: floating point with nn bits
- INTn: integer with n bits
- INT1: binary
- TF32: TensorFloat32
- BF16: bfloat16
Сравнение мощностей декодирования
Видео | H.264 decode (1080p30) | H.265 (HEVC) decode (1080p30) | VP9 decode (1080p30) |
---|---|---|---|
V100 | 16 | 22 | 22 |
A100 | 75 | 157 | 108 |
H100 | 170 | 340 | 260 |
Изображение/сек[5] | JPEG 4:4:4 decode(1080p) | JPEG 4:2:0 decode(1080p) |
---|---|---|
A100 | 1490 | 2950 |
H100 | 3310 | 6350 |
GPGPU-ускорители
Ускорители GPGPU-вычислений с тензорными ядрами, в которых используются чипы с микроархитектурой Hopper:
- NVIDIA H100 — с середины 2022 года;
- NVIDIA GH200 Grace Hopper — с середины 2023 года.
Примечания
- ↑ NVIDIA анонсировала 4-нм ускорители Hopper H100 и самый быстрый в мире ИИ-суперкомпьютер EOS на базе DGX H100 (рус.). ServerNews. (22 марта 2022). Дата обращения: 21 сентября 2023. Архивировано 20 сентября 2023 года.
- ↑ Представлен ускоритель вычислений NVIDIA H100 на новейшей архитектуре Hopper и с памятью HBM3 (рус.). 3DNews. (22 марта 2022). Дата обращения: 18 сентября 2023. Архивировано 25 ноября 2023 года.
- ↑ NVIDIA представила GeForce RTX 4090 и две GeForce RTX 4080 — ускорители нового поколения с ценой от $899 (рус.). 3DNews. (20 сентября 2022). Дата обращения: 21 сентября 2023. Архивировано 14 октября 2022 года.
- ↑ NVIDIA A100 Tensor Core GPU Architecture . www.nvidia.com. Дата обращения: 18 сентября 2020. Архивировано 15 февраля 2021 года.
- ↑ 1 2 NVIDIA H100 Tensor Core GPU Architecture Whitepaper . NVIDIA.
- ↑ NVIDIA Tensor Cores: Versatility for HPC & AI . NVIDIA. Дата обращения: 22 сентября 2023. Архивировано 21 сентября 2023 года.
- ↑ Abstract . docs.nvidia.com. Дата обращения: 22 сентября 2023. Архивировано 22 сентября 2023 года.
Ссылки
- Архитектура NVIDIA Hopper (рус.). Официальный сайт NVIDIA Corporation. Дата обращения: 21 сентября 2023.
- GPU NVIDIA H100 с тензорными ядрами (рус.). Официальный сайт NVIDIA Corporation. Дата обращения: 21 сентября 2023.