Розничная торговля - отличный пример отрасли, в которой технологии искусственного интеллекта и анализа данных применимы и востребованы. Прогнозные модели, нейронные сети для прикладных задач - все это на практике, а не в теории, помогает ритейлерам улучшать ассортимент, планировать складскую логистику и улучшать качество обслуживания клиентов. Сегодня мы поговорим об оборудовании, на котором работают эти интеллектуальные решения.
Как посчитать ИИ?
Для расчета математических моделей работа нейронных сетей, обучающих систем прогнозирования и т. Д. Требует серьезных вычислительных мощностей и специальных архитектур высокопроизводительных программных и аппаратных систем.
Ситуация, когда вычисления занимают часы или даже дни, вполне типична для этой категории задач. Но для бизнеса это может быть слишком долгим и даже опасным, реакция часто должна быть немедленной, а иногда требуются упреждающие меры для экономии денег, здоровья, ресурсов и т. Д.
Первым шагом к ускорению вычислений стало использование графических ускорителей - высокопроизводительных карт, которые изначально были созданы для графических задач, но показали высокую эффективность для других вычислений, не связанных с графикой.
Такие карты устанавливаются в стандартные слоты (например, PCIe). Вы можете поставить сразу несколько из них, и все современные вычислительно-ресурсоемкие приложения умеют их использовать. Есть технология SXM4, когда GPU «встроен» в плату, за счет чего минимизируются задержки передачи данных по шине.
Технологический вклад NVIDIA
Ведущий мировой разработчик и производитель графических ускорителей - NVIDIA. Их флагманский продукт, ускоритель A100, обладает впечатляющими характеристиками: 8192 ядра, включая тензорное, до 80 ГБ памяти, производительность до 9,7 терафлопс.
Узкое место систем с графическими ускорителями - обмен данными. Чтобы эффективно объединить в сеть несколько вычислительных процессоров, NVIDIA представила собственную шину данных NVLink. В последних версиях он обеспечивает пропускную способность 600 ГБ / с на графический процессор (в 10 раз быстрее, чем PCIe v4).
Идея получила дальнейшее развитие с появлением NVSwitch, способного объединять до 12 шин NVLink и открывшего путь для создания мощных и легко масштабируемых вычислительных кластеров из графических ускорителей.
NVIDIA не была бы лидером в своей области, если бы не предложила собственную реализацию такого кластера - в виде продукта DGX A100.
Это сервер, в котором карты A100 устанавливаются не в слоты, а «вышиты» на плате и подключаются через NVSwitch. Высокоскоростные сетевые коммутаторы от Mellanox (приобретенные NVIDIA в 2020 году) позволяют построить кластер из нескольких DGX A100 и сконцентрировать невероятное количество вычислительных ресурсов в одном месте.
Почему DGX хороши для задач ИИ?
Закрытая предсказуемая экосистема. DGX - это не просто сервер, а полноценный программно-аппаратный комплекс. NVIDIA поддерживает обширный спектр программного обеспечения для обучения и обслуживания нейронных сетей, а также для анализа данных. Программное обеспечение NVIDIA DGX основано на мощной аппаратной платформе, которая является самой технологически продвинутой в мире.
Компетенции NVIDIA в области науки о данных. В NVIDIA по всему миру работают несколько сотен человек, занимающихся обучением нейронных сетей и построением прогнозных моделей - разработчиками и аналитиками. Это означает, что NVIDIA обладает отличным рыночным опытом для поддержки клиентов, занимающихся наукой о данных, и предоставляет им единую точку входа для решения всех проблем.
Каталог NGC. Он включает в себя множество готовых решений, оптимизированных для графических процессоров - как проприетарных решений NVIDIA, так и разработок партнеров. Это решения проблем искусственного интеллекта, машинного обучения и высокопроизводительных вычислений. Благодаря предварительно обученным моделям искусственного интеллекта и отраслевым SDK клиенты могут решать свои проблемы быстрее, чем когда-либо прежде.
Портфель продуктов и услуг Softline постоянно пополняется собственными решениями и решениями поставщиков в области искусственного интеллекта. Мы можем предложить заказчикам такое решение, как SuperPod - кластер с вычислительной частью DGX, устройствами хранения и высокоскоростной сетевой инфраструктурой.