ДВИГАТЕЛЬ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

Применение искусственного интеллекта не ограничивается одной отраслью. Он используется в сфере супервычислений, здравоохранения, финансовых услуг, анализа больших данных и играх. Это будущее всех индустрий и рынков, так как каждая компания испытывает потребность в технологиях искусственного интеллекта. А их вычислительной основой являются графические процессоры NVIDIA.
NVIDIA Volta – это новая движущая сила искусственного интеллекта. Основанная на пяти прогрессивных технологиях, архитектура Volta поспособствует прорыву во всех отраслях. Такие серьезные достижения для человека, как искоренение рака и революция в сфере перевозок за счет появления беспилотных транспортных средств, уже в пределах досягаемости.

640 TENSOR-ЯДЕР

Все индустрии испытывают потребность в технологиях искусственного интеллекта, а благодаря огромному росту производительности вычислительных платформ, искусственный интеллект теперь можно внедрить везде. У графического процессора Volta 640 Tensor-ядер, что обеспечивает производительность задач глубокого обучения более 100 Терфлопс в секунду. Это превышает производительность архитектуры предыдущего поколения Pascal более чем в 5 раз.
НОВАЯ АРХИТЕКТУРА GPU

Решение самых сложных проблем человечества потребует использования самых мощных решений как для проведения вычислений, так и для анализа данных. 21 миллиард транзисторов делают Volta самой мощной архитектурой GPU в мире. Она объединяет ядра CUDA и Tensor, чтобы обеспечить производительность одного GPU на уровне суперкомпьютера.
НОВОЕ ПОКОЛЕНИЕ NVLINK

Volta использует второе поколение высокоскоростной технологии внутреннего соединения NVIDIA NVLink™. Она ускоряет обмен данных в 2 раза по сравнению с интерфейсом NVLink первого поколения. Это обеспечивает расширенные возможности распараллеливания данных для достижения максимальной производительности приложений.

ПО ОПТИМИЗИРОВАННОЕ ПОД VOLTA

Специалисты по обработке и анализу данных часто вынуждены идти на компромисс, выбирая между точностью моделей и продолжительностью симуляции. Благодаря оптимизированному под Volta программному обеспечению CUDA и библиотекам NVIDIA Deep Learning SDK, например, cuDNN, NCCL и TensorRT, ведущие в отрасли фреймворки и приложения могут использовать возможности архитектуры Volta. А это значит, что ученые и исследователи могут совершать открытия быстрее, чем когда-либо.
TENSOR ЯДРА В АРХИТЕКТУРЕ NVIDIA VOLTA
Новое поколение технологий глубокого обучения
Графический ускоритель NVIDIA® Tesla® V100 GPU построен на основе революционной архитектуры GPU NVIDIA Volta. Потоковые мультипроцессоры Volta на 50 процентов более энергоэффективны, чем мультипроцессоры предыдущего поколения NVIDIA® PascalTM. Это приводит к значительному приросту производительности в операциях одинарной (FP32) и двойной (FP64) точности. Но каково же главное новшество архитектуры? Интеграция ядер Tensor.
Благодаря огромному росту производительности вычислительных платформ, искусственный интеллект теперь можно внедрить везде.
У графического процессора Volta 640 Tensor-ядер, что обеспечивает производительность задач глубокого обучения более 100 Терфлопс в секунду. Это превышает производительность архитектуры предыдущего поколения Pascal более чем в 5 раз.



Разработчики могут запускать тренировку алгоритмов глубокого обучения, используя вычисления смешанной точности (FP16 и FP32). Это приводит к 3-х кратному ускорению производительности по сравнению с архитектурой предыдущего поколения и сходимости ожидаемых уровней точности нейросети. Подобный 3-х кратный прирост производительности является ключевым достижением технологии ядер Tensor. Теперь вычисления для задач глубокого обучения занимают всего несколько часов.
КОММУТИРУЮЩАЯ МАТРИЦА NVLINK

Системы, оснащенные несколькими GPU и CPU, становятся все более распространенными в разных отраслях, поскольку разработчики все больше внедряют параллелизм в приложения, например, для искусственного интеллекта. Для решения больших и сложных задач применяются системные конфигурации на основе 4 и 8 GPU, которые соединены между собой интерфейсом PCIe. Но пропускная способность PCIe все чаще становится слабым местом мульти-GPU систем, что обуславливает необходимость в более быстрой и масштабируемой технологии внутреннего соединения.


МАКСИМИЗАЦИЯ ПРОИЗВОДИТЕЛЬНОСТИ СИСТЕМЫ
Технология NVIDIA® NVLink™ устраняет эту проблему, обеспечивая более высокую пропускную способность, большее число соединений и повышенную масштабируемость для конфигураций с несколькими GPU или GPU в комбинации с CPU. Один GPU NVIDIA Tesla® V100 поддерживает до шести соединений с общей пропускной способностью 300 ГБ/с, что в 10 раз превосходит показатели PCIe 3-его поколения. Такие серверы, как NVIDIA DGX-1™, используют эту технологию для повышения масштабируемости и быстрой тренировки моделей глубокого обучения.
НОВЫЙ УРОВЕНЬ ПРОИЗВОДИТЕЛЬНОСТИ

NVIDIA NVLink может обеспечить прирост производительности до 31% по сравнению с сервером с идентичной конфигурацией с другим типом внутреннего соединения. Значительно более высокая пропускная способность и пониженная латентность позволяют увеличить нагрузки и масштабировать производительность по мере их роста.
NVSWITCH: ПОЛНОЕ ПОДКЛЮЧЕНИЕ NVLINK

Быстрый рост объема нагрузок, связанных с задачами глубокого обучения, обуславливает необходимость в более быстрой и масштабируемой технологии внутреннего соединения, так как пропускная способность PCIe все чаще становится слабым местом мульти-GPU систем.
Технология NVLink позволила объединить в одном сервере восемь GPU, обеспечив более высокую скорость передачи данных, чем PCIe. Однако новый уровень производительности для глубокого обучения требует новой технологии интерконнекта, способной объединить в одном сервере большее число GPU и обеспечить их полноценное подключение.
NVIDIA NVSwitch – это первая архитектура, поддерживающая до 16 GPU в серверном узле и обеспечивающая коммуникацию между всеми восемью парами GPU со скоростью 300 ГБ/с каждая. Все 16 соединенных между собой GPU можно использовать как один масштабный ускоритель с унифицированной памятью объемом 0,5 терабайта и вычислительной производительностью 2 петафлопса.