Знакомство с обобщенными линейными моделями
Обобщенные линейные модели (GLM) позволяют моделировать поведение величин, не подчиняющихся нормальному распределению. Чтобы первые шаги в мире GLM были легче, мы разберем их устройство на примере GLM для нормально распределенных величин - так вы сможете проводить параллели с простыми линейными моделями. Вы узнаете, что такое функция связи, как работает метод максимального правдоподобия и научитесь тестировать гипотезы о GLM при помощи тестов Вальда и тестов отношения правдоподобий.
Проблема выбора модели
В этом модуле мы поговорим о методологических проблемах, связанных с построением моделей. Модель есть упрощенное отображение реальности и выбор между разными конкурирующими способами такого упрощения - частая задача аналитика. В этом модуле вы научитесь сравнивать модели при помощи информационных критериев. Мы обсудим основные варианты хода анализа при выборе моделей и поговорим о сложностях, возникающих в связи со скрытой множественностью моделей. Наконец, мы научим вас распознавать основные виды злоупотреблений при выборе моделей (data-fishing, p-hacking).
Обобщенные линейные модели с бинарным откликом
Иногда возникает необходимость моделировать наступило ли какое-то событие или , выиграла ли футбольная команда или проиграла, выздоровел ли пациент после лечения или , совершил ли клиент покупку или . Для модели рования таких бинарных данных (событий с двумя исходами) не подходят обычные линейные модели, но это легко можно сделать при помощи обобщенных линейных моделей. В этом модуле вы научитесь моделировать вероятности наступления событий, представляя их в виде шансов. Мы разберем, как устроена функция связи логит и как интерпретируются коэффициенты GLM в случае ее применения. Наконец, вы сможете попрактиковаться в анализе обобщенных линейных моделей с разными распределениями, выполнив проект по анализу данных. Результаты этого анализа нужно будет представить в виде отчета в формате html, написанного при помощи rmarkdown/knitr.