Челленджи деплоя, сетевых политик и планировщика: как мы внедряли ML-платформу Kubeflow
|
|
Среда, 16 Ноября 2022 г. 16:42
+ в цитатник
Kubeflow — фреймворк на базе Kubernetes, который помогает быстро запускать модели машинного обучения. Мы в VK решили внедрить его в свои рабочие процессы и столкнулись с некоторыми трудностями.
Меня зовут Федюнин Андрей, я системный инженер в команде платформы, которая предоставляет разработчикам Kubernetes для запуска приложений, и отвечаю за ML-кластер в нашей команде. Сегодня расскажу, зачем и как мы внедряли Kubeflow, как решали проблемы и к чему пришли.
Читать дальше → https://habr.com/ru/post/698760/?utm_source=habrahabr&utm_medium=rss&utm_campaign=698760
Метки:
Блог компании VK
Системное администрирование
DevOps
Kubernetes
vk cloud
ИТ-инфраструктура
Kubeflow
ML
машинное обучение
пайплайны
ML cluster
-
Запись понравилась
-
0
Процитировали
-
0
Сохранили
-