Конференция Nvidia по технологиям графических процессоров (GTC) продолжается. Во время выступления генерального директора Дженсена Хуанга были раскрыты подробности об архитектуре Nvidia Hopper следующего поколения. Хотя это графический процессор, ориентированный на ИИ и центр обработки данных, он дает нам несколько намеков на то, чего мы можем ожидать от ориентированной на игры архитектуры графического процессора Nvidia Ada Lovelace, выпуск которой запланирован на конец 2022 года.
H100 — это большой шаг вперед по сравнению с нынешним флагманом A100. Полный GPU содержит 80 миллиардов транзисторов, что на 26 миллиардов больше, чем у A100. Он построен на специальном 4-нм техпроцессе TSMC. Он поддерживает до 80 ГБ памяти HBM 3, обеспечивая пропускную способность до 3 ТБ/с.
H100 поддерживает PCIe 5.0 и NVLink для соединения нескольких графических процессоров. Он может обеспечить производительность 2000 TFLOPS для FP16 и 1000 TFLOPS для TF32, что в три раза больше, чем у A100. Hopper представляет новый набор инструкций под названием DPX. Он предназначен для повышения производительности в таких различных областях, как диагностика заболеваний, квантовое моделирование, графовая аналитика и оптимизация маршрутизации.
Полный графический процессор H100 включает 18432 ядра CUDA и 576 ядер Tensor. Это сопоставимо с A100 с 8192 и 512 соответственно, хотя на данный момент не все ядра разблокированы, по-видимому, для максимизации производительности. Тактовые частоты ядра также не доработаны. Несмотря на то, что она изготовлена на таком передовом узле, версия SXM H100 имеет TDP 700 Вт. Правильно, семь. сто. Вт.
H100 позиционируется как карта-монстр, но подходит ли она геймерам для ПК? Ответ вроде такой. H100 — это производительность вычислений, а не графика, но мы можем взять немного информации и использовать ее, чтобы предсказать, как может выглядеть игровая версия.
Переход на специальный 4-нм узел TSMC — это большой шаг вперед по сравнению с Samsung 8-нм процесс, используемый для серии RTX-30. Скорее всего, он будет использоваться и для карт серии RTX-40. Также следует отметить поддержку PCIe 5.0. Хотя сам по себе он не дает реального прироста производительности по сравнению с PCIe 4.0, он вполне может дать преимущество по сравнению с PCIe 3.0, который до сих пор широко используется во многих игровых системах.
Но, возможно, самым большим самородком является довольно удивительный TDP 700 Вт в конфигурации высокого класса. Просто посмотрите на VRM этой карты! 700 Вт для продукта для центра обработки данных — это то, чем можно управлять, но если мы получим что-то подобное для флагманской RTX 4090, мы будем шокированы. К сожалению, слухи о резком увеличении энергопотребления продолжают появляться. Даже 500 Вт — это скачок, и это означает, что видеокарты с четырьмя слотами могут стать нормой, во всяком случае, в верхней части рынка.
Nvidia все еще работает над H100. Если его основные характеристики совпадают с серией RTX 40, справедливо будет сказать, что карты высокого класса будут горячими и прожорливыми, но будут наполнены технологиями и намного быстрее, чем RTX 3090 (и скоро будет выпущен RTX 3090 Ti ). AMD будет конкурировать со своими картами на базе RDNA3, и это обещает быть адской битвой, при этом максимальная производительность явно является приоритетом для обеих компаний за счет энергоэффективности. Мы не можем ждать!