Старт: 22 апреля 2021

105 - Автоматизация пайплайнов, воспроизводимость и MLOps

c DVC, MLflow и Airflow

Прокачиваем необходимые инженерные навыки для проектов машинного обучения
Write your awesome label here.

What's included?

  • 7 модулей
  • 1 практический проект на весь курс 
  • 100 % онлайн
  • запись семинаров
  • code rev

Engineering Practices

Вы изучите передовые инженерные практики и решения для машинного обучения и автоматизации процессов, изучите полезные инструменты с открытым исходным кодом

Collaboration Tools

Инструменты, которые помогут организовать работу над проектом, кодом и работу в команде

Course Program

1. Организовать работу с проектом и кодом

Сделаем обзор подходов и технологий, которые помогут организовать работу над проектом, кодом и работу в команде. Настроим репозиторий, разберемся с особенностями работы с Git в ML проектах, инструментарием GitLab трекинга задач, гипотез и изменений кода

2. Управление окружением с Python virtual environments и Docker

Разберемся с Docker и docker-compose. Настроим воспроизводимое окружение для ML проекта

3. Версионирование данных и автоматизация пайплайнов с DVC

Разберемся с особенностями применения Data Version Control (DVC) в ML проектах - для версионирования данных, артефактов и моделей. Автоматизируем пайплайн (конвейер) обучения моделей и оценки их качества. Запуск экспериментов теперь происходит одной командой!

4. Управление ML экспрериментами и метриками  с DVC и MLflow

Добавим к нашему проекту MLflow! Теперь у нас появится удобный интерфейс для трекинга метрик и параметров экспериментов, сравнения экспериментов, визуализации результатов GridSearch. DVC и MLflow используются вместе для управления экспериментами и жизненным циклом моделей

5. Автоматизация пайплайнов скоринга и мониторинга с Airflow

Разберемся с особенностями Airflow - для чего можно использовать, как создавать пайплайны и как его можно использовать в связке с DVC и MLflow. Также Airflow часто используются для production запуска моделей по расписанию. Это хорошее решение для запуска генерации прогнозов в batch режиме

6. Настройка CI/CD и MLOps для задач скоринга с DVC, Gitlab, Arflow & MLFlow, Grafana

Настраиваем автоматический CI/CD процесс с помощью инструментов DVC, Gitlab, Arflow & MLFlow. Добавляем мониторинг работы нашей системы с помощью Grafana и Prometheus

Course Program

Кому подойдет этот курс

Новичкам

Курс поможет освоить инженерные навыки, необходимые для роста в Data Science & Machine Learning.
Вы научитесь тому, что требуется в реальных проектах, прокачаете технические скилы и повысите свою ценность для компании

Data Scientists

Курс поможет прокачать инженерные навыки, в том числе для автоматизации экспериментов, автоматической генерации отчетов и документации, а также для разработки production решений

Machine Learning Engineers

Курс будет интересен, если планируете использовать DVC, MLflow, Airflow, но еще не знакомы с ними, либо нужно быстро разобраться в том, как их можно интегрировать и заставить работать вместе
Meet the instructor

Михаил Рожков

Data Scientist & Machine Learning Engineer

Основатель проекта Machine Learning REPA, более 5 лет занимается Machine Learning & Data Science, руководит проектами и помогает командам внедрять хорошие инструменты и инженерные практики
Patrick Jones - Course author

Стоимость курса

* Мы вернем деньги, если в течение 14 дней после начала курса вы посчитаете, что он вам не подходит!

Студентам

 
7 500
При оплате до 31 марта 2021

для студентов очной формы обучения

Специалистам

оплата от физического лица
15 000
При оплате до 31 марта 2021

При оплате
курса после 01 апреля 2021
стоимость — 18 000 рублей

Компаниям

оплата от юридического лица
26 000
При оплате до 31 марта 2021

При оплате
курса после 01 апреля 2021
стоимость — 35 000 рублей

По итогам курса вы сможете

Уверенно работать с Git

Организовать работу над кодом и уверенно работать с Git

Автоматизировать пайплайны

Автоматизировать пайплайны экспериментов, подготовки данных и оценки модели с DVC

Настроить CI/CD

Настроить процессы непрерывной интеграции и доставки с GitLab

Управлять моделями и метриками

Управлять экспериментами, метриками и жизненным циклом моделей с DVC и MLflow

Выстроить работу команды

Работать в команде по принципам GitFlow и CodeReview

Настроить MLOps

Использовать Airflow для задач MLOps, настроить мониторинг работы моделей с Grafana

Выводить в Production

Разрабатывать production решения и запускать по расписанию в batch режиме

Документировать эксперименты

Организовать автоматическую генерацию отчетов по экспериментам

Отправить заявку сейчас!

Первое занятие пройдет 22 апреля 2021
Created with