Специализация Просто о статистике (с использованием R) от Coursera

От: Coursera

6 месяцев изучения основ прикладного анализа данных в R от СПбГУ. Специализация содержит 5 курсов. Занятия 7 часов в неделю. Подходит начинающим аналитикам. В программе: базовая статистика, программирование на R, линейная регрессия, продвинутые линейные модели. Живое общение с преподавателем. Каждый из курсов заканчивается практическим проектом, которым студенты смогут пополнить портфолио. Сертификат по окончании.

Сводка

Цена
0₽
Рассрочка
от 200₽
Статус
Идет набор
Длительность
180 дней
Язык
ru

Описание курса

Анализировать данные с использованием R

- Моделировать зависимости между величинами при помощи общих, обобщенных и смешанных линейных моделей
- Выбирать подходящие методы анализа в зависимости от свойств данных и с учетом дизайна сбора материала
- Создавать автоматизированные отчеты о результатах статистического анализа, используя R Markdown/knitr
- Разобрать, как устроены простая и множественная линейная регрессия, дисперсионный анализ, логистическая и Пуассоновская регрессия

О школе

Coursera
Отзывы 0
Информация
Компания основана в 2012 году. Официальный сайт https://ru.coursera.org. Мы собрали и проверили более 17 отзывов об онлайн курсах Coursera.

Программа курса

1 курс
Знакомство с R и базовая статистика
Статистическая обработка данных и визуализация результатов анализа - это неизбежный этап работы с данными, полученными в различных областях естественных наук, в социологии, психологии или экономике. В этом курсе мы подробно разберем основы статистики и познакомимся с основами языка статистического программирования R. Мы научим вас гибко использовать средства визуализации (диаграммы, графики и т.п.), чтобы сделать результаты анализа максимально доступными и понятными. Вы научитесь рассчитывать основные описательные статистики: медиану и квантили, среднее и стандартное отклонение. Вы познакомитесь с принципами использования теоретических распределений статистик для построения доверительных интервалов и тестирования гипотез (на примере t-критерия). Наконец, мы обсудим сложности, возникающие при множественном тестировании гипотез и научим вас преодолевать их. Этот курс для людей, начинающих знакомство со статистикой, а также для тех, кто хочет не только освоить базовые возможности языка R, но и научиться строить сложные графики.
2 курс
Линейная регрессия
В этом курсе мы разберем основные методы описания взаимосвязей между количественными признаками. Если корреляционный анализ позволяет количественно оценить силу и направление связи между двумя величинами, то построение регрессионных моделей дает более широкие возможности. При помощи регрессионного анализа можно количественно описывать поведение изучаемых величин в зависимости от переменных-предикторов и получать предсказания на новых данных. Вы узнаете, как строить простые и множественные линейные модели с использованием языка R. У всякого метода есть свои ограничения, поэтому мы поможем вам разобраться, в каких ситуациях можно, а в каких нельзя применять линейную регрессию, и научим вас методам диагностики подобранных моделей. Специальное место в курсе отводится глубинной анатомии регрессионного анализа: вы освоите операции с матрицами, которые лежат в основе линейной регрессии, чтобы получить возможность разбираться в более сложных разновидностях линейных моделей. Если вы сталкиваетесь с необходимостью поиска и описания взаимосвязей между теми или иными явлениями, которые могут быть измерены количественно, тогда этот курс - хорошая возможность понять, как устроены простая и множественная линейная регрессия, узнать о возможностях и ограничениях этих методов. Курс рассчитан на тех, кто уже знаком с базовыми приемами анализа данных с использованием языка R и с созданием простейших .html документов при помощи rmarkdown и knitr.
3 курс
Линейные модели с дискретными предикторами
Необходимость описать закономерности изменения количественной переменной в нескольких группах возникает часто, например, если перед вами данные эксперимента. Дисперсионный анализ - это один из методов, который позволяет эффективно решать такие задачи, особенно, если таких групп больше чем две (однофакторный дисперсионный анализ), или группировка задается несколькими факторами (многофакторный дисперсионный анализ). В этом курсе вы узнаете, что в рамках парадигмы линейных моделей вполне можно работать не только с непрерывными, но и с дискретными предикторами - а иногда это даже приходится делать одновременно (как в ковариационном анализе и др.). Мы разберем несколько вариантов представления дискретных предикторов в линейных моделях и последствия разных способов кодирования для интерпретации модели. Вы научитесь подбирать линейные модели со взаимодействием факторов, чтобы описывать ситуации, когда характер действия фактора меняется в разных группах. В этом курсе для анализа и визуализации линейных моделей мы будем использовать язык статистического программирования R. Его богатейшие возможности позволят вам разобраться в тонкостях внутреннего устройства линейных моделей с дискретными и непрерывными предикторами. Этот курс ориентирован на людей, которые хотят научиться описывать закономерности поведения количественных величин в зависимости от дискретных факторов. Курс рассчитан на тех, кто освоил базовые приемы регрессионного анализа с использованием языка R и создание простейших .html документов при помощи rmarkdown и knitr.
4 курс
Обобщенные линейные модели
Результаты подсчета чего-либо или вероятности возникновения событий - это величины, практически не поддающиеся моделированию при помощи обычных линейных моделей, так как не подчиняются нормальному распределению. Обобщенные линейные модели (Generalized Linear Models, GLM) позволяют обойти это ограничение. В этом курсе мы постараемся с минимальным количеством математики рассказать об устройстве GLM и многочисленных подводных камнях, связанных с анализом. GLM для счетных данных основаны на распределении Пуассона или отрицательном биномиальном распределении. Модели для бинарных данных (например, логистическая регрессия) - на биномиальном распределении. Мы обсудим особенности диагностики моделей, возникающие в зависимости от выбранного распределения. Параметры GLM подбирают при помощи метода максимального правдоподобия, поэтому и аппарат тестирования гипотез и техники упрощения моделей довольно сильно отличаются от привычного для простых линейных моделей. Для анализа данных мы будем использовать язык R, чтобы вы могли лучше разобраться в тонкостях работы с обобщенными линейными моделями. Вас ждут интерактивные задания на платформе Stepic и проект по анализу данных в конце курса. Этот курс для всех, кто хочет научиться строить модели для счетных или бинарных величин. Для успешного прохождения пригодятся базовые представления о регрессионном анализе, умение создавать простейшие .html документы при помощи rmarkdown и knitr.
5 курс
Смешанные линейные модели
Oдним из условий применимости обычных линейных моделей является независимость наблюдений друг от друга, на основе которых подбирается модель. Однако на практике часто встречаются ситуации, когда дизайн сбора материала таков, что нарушение этого условия неизбежно. Представьте, что вы решили построить модель, описывающую связь успеваемости по физкультуре и величины IQ теста у студентов. Для решения этой задачи вы сделали многочисленные выборки в нескольких институтах. Можно ли объединить такие данные в один анализ, построенной по традиционной схеме? Конечно . Студенты в каждом вузе могут быть в чем-то сходными друг с другом. Даже характер связи между изучаемыми величинами может быть несколько разным. Такого рода данные, в которых присутствуют внутригрупповые корреляции, стоит анализировать при помощи смешанных линейных моделей. Мы покажем, что некоторые предикторы стоит включать в модель в качестве так называемых “случайных факторов”. Вы узнаете, что случайные факторы могут быть иерархически соподчинены. Мы обсудим, как такие смешанные модели могут быть построены для зависимых переменных подчиняющихся разным типам распределений. Кроме того, мы покажем, что случайная часть модели может быть устроена еще сложнее - в ней может быть компонент, моделирующий поведение дисперсии в ответ на влияние ковариаты. В конце курса вас ждет проект, в котором вы сможете потренироваться в построении смешанных моделей, выбрав один из нескольких датасетов. На основе анализа этих данных вы сможете создать отчет, выдержанный в традициях воспроизводимого исследования. Этот курс поможет научиться строить модели со случайными факторами для величин с разными типами распределений. Чтобы легче осваивать материалы курса, вам пригодятся базовые представления о линейных моделях (общих и обобщенных), базовые знания R и умение создавать простейшие .html документы при помощи rmarkdown и knitr.
Инструменты
R

Отзывы

Еще не добавили ни одного отзыва