Знакомство со смешанными линейными моделями
В этом модуле вы сделаете первый шаг в мир смешанных линейных моделей. Вы познакомитесь с понятием случайного фактора. Вы увидите примеры дизайнов сбора данных, когда использование таких факторов становится необходимым и поймете, что происходит с моделями, если такие факторы не учитывать или учитывать нерационально. Вам предстоит построить смешанную модель, предполагающую, что переменная-отклик подчиняется нормальному распределению. На этом примере вы научитесь трактовать результаты построения смешанных моделей и визуализировать их. Вы увидите, что подходы к работе со смешанными моделями существенно отличаются от более привычных нам форм регрессионного и дисперсионного анализа.
Моделирование структуры дисперсии в смешанных моделях
Одним из ключевых ограничений при работе с моделями, основанными на нормальном распределении переменной отклика, является отсутствие гетероскедастичности. Тем не менее признаки неравенства дисперсии для разных значений ковариат выявляются очень часто. Если гетерогенность дисперсий не учитывать, это может привести к неадекватной трактовке результатов подбора модели. В этом модуле мы рассмотрим один из возможных подходов к решению этой проблемы - моделирование структуры дисперсии. Вы познакомитесь с нескольким способами моделирования связи между варьированием переменной отклика и непрерывными или дискретными предикторами, которые называются ковариаты дисперсии. Мы рассмотрим как можно ввести такой компонент, как в простую, так и смешанную линейную модель.
Смешанные линейные модели для счетных данных
В этом модуле вы научитесь моделировать поведение счетных величин при помощи обобщенных смешанных линейных моделей (GLMM). В основе этих моделей будет лежать распределение Пуассона или отрицательное биномиальное распределение. Мы вместе вспомним, что такое связывающей функция, и каким образом она обеспечивает связь между предиктором и счетной зависимой переменной. GLMM для счетных данных требуют, чтобы связь среднего и дисперсии в данных соответствовала ожидаемой для выбранного распределения. Вы научитесь оценивать степень избыточности дисперсии и бороться с ней, если она присутствует. Мы встретим и обсудим случаи, когда функции языка R не будут способны подобрать модель по техническим причинам, и рассмотрим некоторые методы устранения таких проблем. Наконец, мы обсудим особенности трактовки результатов GLMM: интерпретацию коэффициентов моделей, основанных на распределениях для счетных данных, методы тестирования гипотез, пост-хок тесты и способы визуализации результатов.
Смешанные линейные модели для бинарных данных
В последнем модуле этой специализации мы применим весь имеющийся нашем арсенале набор средств для построения модели, в которой зависимая переменная имеет бинарную природу. Мы повторим принципы работы с бинарными переменными: переход от вероятностей к шансам и логитам. Далее мы обсудим материал, в котором несколько случайных факторов находятся в иерархическом соподчинении. На примере модели для этих данных мы рассмотрим разнообразные подводные камни, которые имеются при работе со смешанными моделям с бинарной переменной-откликом.