Введение
Добро пожаловать! На этой неделе мы начнём осваивать язык Python — один из главных инструментов специалиста в науке о данных, и вспомним кое-что о производных, которые активно используются при настройке моделей машинного обучения.
Библиотеки Python и линейная алгебра
На этой неделе мы познакомимся с Python-библиотеками, содержащими большое количество полезных инструментов: от быстрых операций с многомерными массивами до визуализации и реализации различных математических методов. Кроме того, мы освоим линейную алгебру — основной математический аппарат для работы с данными: в большинстве задач данные можно представить в виде векторов или матриц.
Оптимизация и матричные разложения
На этой неделе мы научимся с помощью методов оптимизации находить наилучшие значения параметров системы, чтобы минимизировать затраты или максимизировать точность предсказаний, а также познакомимся с матричными разложениями, которые используются при построении регрессионных моделей, для уменьшения размерности данных, в рекомендательных системах и в анализе текстов.
Случайность
На этой неделе мы освоим базовые концепции теории вероятностей и статистики, которые необходимы для понимания механизма работы практически всех методов анализа данных. Мы разберёмся с самыми популярными распределениями, узнаем, какие явления ими описываются и какими статистиками оцениваются их параметры, а также научимся строить доверительные интервалы.