Старт: 24 февраля 2021

Автоматизация пайплайнов, воспроизводимость и MLOps

c DVC, MLflow и Airflow

Прокачиваем необходимые инженерные навыки для проектов машинного обучения
Write your awesome label here.

What's included?

  • 7 модулей
  • 1 практический проект на весь курс 
  • 100 % онлайн
  • запись семинаров
  • code rev

Engineering Practices

Вы изучите передовые инженерные практики и решения для машинного обучения и автоматизации процессов, изучите полезные инструменты с открытым исходным кодом

Collaboration Tools

Инструменты, которые помогут организовать работу над проектом, кодом и работу в команде

Course Lessons

Course Program

1. Организовать работу с проектом и кодом

Сделаем обзор подходов и технологий, которые помогут организовать работу над проектом, кодом и работу в команде. Настроим репозиторий, разберемся с особенностями работы с Git в ML проектах, инструментарием GitLab трекинга задач, гипотез и изменений кода

2. Управление окружением с Python virtual environments и Docker

Разберемся с Docker и docker-compose. Настроим воспроизводимое окружение для ML проекта

3. Версионирование данных и автоматизация пайплайнов с DVC

Разберемся с особенностями применения Data Version Control (DVC) в ML проектах - для версионирования данных, артефактов и моделей. Автоматизируем пайплайн (конвейер) обучения моделей и оценки их качества. Запуск экспериментов теперь происходит одной командой!

4. Управление ML экспрериментами и метриками  с DVC и MLflow

Добавим к нашему проекту MLflow! Теперь у нас появится удобный интерфейс для трекинга метрик и параметров экспериментов, сравнения экспериментов, визуализации результатов GridSearch. DVC и MLflow используются вместе для управления экспериментами и жизненным циклом моделей

5. Автоматизация пайплайнов скоринга и мониторинга с Airflow

Разберемся с особенностями Airflow - для чего можно использовать, как создавать пайплайны и как его можно использовать в связке с DVC и MLflow. Также Airflow часто используются для production запуска моделей по расписанию. Это хорошее решение для запуска генерации прогнозов в batch режиме

6. Настройка CI/CD и MLOps для задач скоринга с DVC, Gitlab, Arflow & MLFlow, Grafana

Настраиваем автоматический CI/CD процесс с помощью инструментов DVC, Gitlab, Arflow & MLFlow. Добавляем мониторинг работы нашей системы с помощью Grafana и Prometheus

Кому подойдет этот курс

Новичкам

Курс поможет освоить инженерные навыки, необходимые для роста в Data Science & Machine Learning.
Вы научитесь тому, что требуется в реальных проектах, прокачаете технические скилы и повысите свою ценность для компании

Data Scientists

Курс поможет прокачать инженерные навыки, в том числе для автоматизации экспериментов, автоматической генерации отчетов и документации, а также для разработки production решений

Machine Learning Engineers

Курс будет интересен, если планируете использовать DVC, MLflow, Airflow, но еще не знакомы с ними, либо нужно быстро разобраться в том, как их можно интегрировать и заставить работать вместе
Meet the instructor

Михаил Рожков

Data Scientist & Machine Learning Engineer

Основатель проекта Machine Learning REPA, более 5 лет занимается Machine Learning & Data Science, руководит проектами и помогает командам внедрять хорошие инструменты и инженерные практики
Patrick Jones - Course author

Стоимость курса

* Мы вернем деньги, если в течение 14 дней после начала курса вы посчитаете, что он вам не подходит!

Студентам

 
Скидка 50 %
или бесплатно на условиях стажировки (по запросу, места ограничены)


Специалистам

оплата от физического лица
15 000
При оплате до 03 февраля 2021

При оплате
курса после 03 февраля 2021
стоимость — 18 000 рублей

Компаниям

оплата от юридического лица
23 000
При оплате до 03 февраля 2021

При оплате
курса после 03 февраля 2021
стоимость — 29 000 рублей

По итогам курса вы сможете

Уверенно работать с Git

Организовать работу над кодом и уверенно работать с Git

Автоматизировать пайплайны

Автоматизировать пайплайны экспериментов, подготовки данных и оценки модели с DVC

Настроить CI/CD

Настроить процессы непрерывной интеграции и доставки с GitLab

Управлять моделями и метриками

Управлять экспериментами, метриками и жизненным циклом моделей с DVC и MLflow

Выстроить работу команды

Работать в команде по принципам GitFlow и CodeReview

Настроить MLOps

Использовать Airflow для задач MLOps, настроить мониторинг работы моделей с Grafana

Выводить в Production

Разрабатывать production решения и запускать по расписанию в batch режиме

Документировать эксперименты

Организовать автоматическую генерацию отчетов по экспериментам

Отправить заявку сейчас!

Первое занятие 3-го набора пройдет 24 февраля 2021
Created with