Яндекс превратил YTsaurus в облачную рендер-ферму для GPU-тяжёлых задач
В Яндексе растёт количество задач, где GPU нужны не только для машинного обучения, но и для генерации визуального контента: 3D-сцен, видео, цифровых аватаров и синтетических данных. Конкретный кейс — проект к премьере сериала «Кибердеревня», где сканировали гостей, создавали 3DGS-аватары (3D Gaussian Splatting) и интегрировали их в Unity-сцены. Этот пайплайн показал узкое место: при масштабировании скорость упирается в инфраструктуру рендеринга.
Традиционно такие задачи решаются на локальных рабочих станциях или через внешние рендер-фермы. Однако у Яндекса уже есть YTsaurus — распределённая система с GPU-кластерами, поддержкой контейнеризации и механизмами планирования задач. Инженеры решили использовать её как внутреннюю рендер-ферму, хотя реализация оказалась нетривиальной — пришлось пробрасывать графический стек в изолированные контейнеры.