NVIDIA показала три рабочих процесса для Vision AI-агентов: синтетические данные и дообучение вместо рутины
NVIDIA представила три ключевых рабочего процесса (agent skills и blueprints) для Vision AI-агентов на основе OpenUSD и Omniverse. Они покрывают весь цикл: генерация синтетических данных дефектов (Defect Image Generation), аугментация видео для расширения сценариев (Video Data Augmentation) и дообучение моделей через NVIDIA TAO. Всё завязано на Metropolis — платформу для разработки и деплоя видео-ИИ на edge.
Gartner прогнозирует, что к 2028 году больше двух третей корпоративных данных будет создаваться и обрабатываться вне ЦОД и облака, а к 2029 — более двух третей компаний globally будут использовать edge AI. Пока 90% edge-данных не обрабатывается. NVIDIA пытается закрыть эту дыру повторяемыми пайплайнами: без OpenUSD командам приходится пересобирать 3D-среды каждый раз при смене условий или локации.
Три типовые проблемы, которые решают эти скиллы: плато точности из-за пробелов в данных (редкие дефекты, смена окружения), нехватка ML-экспертизы для дообучения (метки, конфиги, трекинг) и ручная сборка агента (видео-пайплайны, метаданные, эмбеддинги, поиск, алерты). NVIDIA даёт готовые стартовые точки для каждого этапа.