NVIDIA и AWS объединились, чтобы вывести ИИ на масштаб продукта: новые инстансы, ускоренный векторный поиск и рекордная производительность для обучения
NVIDIA и AWS расширяют сотрудничество: новые Amazon EC2 G7 инстансы на базе NVIDIA RTX PRO 4500 Blackwell Server Edition GPUs обеспечивают до 4.6x прирост AI-инференса, до 2.1x производительности графики и значительно ускоряют обработку данных через Amazon EMR с cuDF. Инстансы поддерживают до 8 GPU, 256 ГБ суммарной GPU-памяти, 700 Gbps EFA и до 7.6 ТБ локального NVMe SSD — от конфигураций с 1 GPU до bare metal.
В Amazon OpenSearch Serverless GPU-ускоренное векторное индексирование на базе библиотеки NVIDIA cuVS стало стандартом по умолчанию для всех векторных коллекций. Это даёт сокращение времени индексации до 10 раз и снижение затрат в 4 раза по сравнению с CPU-only — в итоге миллиардные векторные базы данных строятся меньше чем за час.
AWS подтвердил статус NVIDIA Exemplar Cloud на NVIDIA GB300 для тренировочных нагрузок — это означает, что инстансы AWS проходят строгие тесты производительности NVIDIA. Статус стал результатом глубокой совместной инженерной работы команд NVIDIA и AWS.
G7-инстансы доступны через AWS Deep Learning AMIs, контейнеры, EMR, EKS, ECS и графические AMIs — вскоре и в SageMaker AI. Это даёт командам AI, медиа, CAD, VDI и гейминга универсальную платформу без необходимости в собственном GPU-управлении.