Обучение на размеченных данных

От: Coursera

81 видеолекция по обучению на размеченных данных от МФТИ. Курс длится 1,5 месяца и предполагает 8 часов занятий в неделю. Способствует развитию в профессии специалистов Data Science. Эксперты научат строить предсказывающие алгоритмы, оценивать обобщающую способность, подбирать параметры модели, подсчитывать метрики качества. Студенты узнают про случайные леса и метод градиентного бустинга. Обратная связь по заданиям. Сертификат по окончании.

Сводка

Цена
0₽
Рассрочка
от 200₽
Статус
Идет набор
Начнется
12.10.2020
Длительность
4 недели
Язык
ru

Описание курса

Предсказывать некоторую величину для любого объекта с помощью линейных моделей

- Решать задачи обучения на размеченных данных
- Разбираться в том, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться
- Ориентироваться в кросс-валидации
- Уменьшать сложность модели и производить отбор признаков с помощью регуляризации
- Работать с новым семейством алгоритмов — решающими деревьями

О школе

Coursera
Отзывы 0
Информация
Компания основана в 2012 году. Официальный сайт https://ru.coursera.org. Мы собрали и проверили более 17 отзывов об онлайн курсах Coursera.

Программа курса

Машинное обучение и линейные модели
Добро пожаловать на курс "Обучение на размеченных данных"! В этом модуле вы узнаете, что такое машинное обучение, какие в нём бывают постановки задачи, и что особенного в обучении на размеченных данных. Затем вы изучите один из основных способов решения задач обучения на размеченных данных — предсказание с помощью линейных моделей. Мы обсудим, как их настраивать и применять в задачах регрессии и классификации. В практических заданиях вы поработаете с настоящими данными и узнаете, какие проблемы в них можно обнаружить, а также попробуете делать прогнозы при помощи линейных моделей.
Борьба с переобучением и оценивание качества
Вторая неделя нашего курса будет посвящена общим вопросам, с которыми приходится столкнуться в любой задаче анализа данных. Вы узнаете, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться — в частности, вы познакомитесь с кросс-валидацией, с помощью которой можно оценить способность алгоритма давать хорошие предсказания на новых данных. Далее речь пойдёт о метриках качества — без них невозможно понять, подходит ли алгоритм для решения той или иной задачи. Наконец, вы познакомитесь с библиотекой scikit-learn, которая является одним из основных инструментов современных специалистов по анализу данных.
Линейные модели: классификация и практические аспекты
Добро пожаловать на третью неделю курса! Вы уже поработали с линейными моделями, научились измерять их качество и устранять переобучение с помощью регуляризации. Пришло время разобраться, почему регуляризация действительно помогает уменьшить сложность модели или произвести отбор признаков — об этом пойдёт речь в первом уроке. Там же вы познакомитесь с логистической регрессией, которая является одним из наиболее популярных методов для решения задач классификации. Далее вы узнаете о некоторых важных нюансах работы с линейными моделями: масштабировании признаков, переходе в новые признаковые пространства и т.д. Мы не только расскажем обо всём этом, но и покажем, как оно работает в Python и библиотеке scikit-learn.
Решающие деревья и композиции алгоритмов
Линейные модели — очень важный и полезный, но слишком простой класс алгоритмов в машинном обучении; не во всех задачах они позволяют добиться желаемого качества. В этом модуле вы познакомитесь с новым семейством алгоритмов — решающими деревьями. Они во многом являются полной противоположностью линейных моделей. В частности, сами по себе они очень сложны и подвержены переобучению. При этом оказывается, что если объединить много деревьев в одну сложную модель, то можно получить очень качественное решение. Об этом крайне важном подходе — построении композиций решающих деревьев — мы в основном и будем говорить на этой неделе.
Нейронные сети и обзор методов
Рады приветствовать вас на последней, пятой неделе курса! Мы расскажем ещё о нескольких подходах к решению задач машинного обучения, которые не были затронуты в предыдущих модулях, но при этом играют важную роль в практических задачах. Это нейронные сети, байесовские модели, метрические методы. Вы узнаете, для чего они нужны, и попробуете самостоятельно применить их в практических заданиях.
Инструменты
Python
scikit-lear

Отзывы

Еще не добавили ни одного отзыва