Знакомство с R и базовая статистика

От: Coursera

1,5 месяца изучения языка разработки R и базовой статистики от СПбГУ. Курс содержит 5 модулей. Занятия 2–5 часов в неделю. Подходит начинающим программистам с минимальным опытом работы, способствует развитию в профессии. В программе: знакомство с R, работа с данными, графики с использованием ggplot2, описательная статистика и тестирование гипотез. Эксперт даст обратную связь по заданиям. Студенты получат сертификат после прохождения тестов.

Сводка

Цена
0₽
Рассрочка
от 200₽
Статус
Идет набор
Длительность
35 дней
Язык
ru

Описание курса

Проводить статистическую обработку данных и визуализировать результаты анализа

- Гибко использовать средства визуализации (диаграммы, графики)
- Делать результаты анализа максимально доступными и понятными
- Научиться рассчитывать основные описательные статистики: медиану и квантили, среднее и стандартное отклонение
- Использовать теоретические распределения статистик для построения доверительных интервалов и тестирования гипотез (на примере t-критерия)
- Преодолевать сложности, возникающие при множественном тестировании гипотез
- Создавать в R автоматизированные отчеты с помощью R Markdown и knitr
- Разбираться с основными описательными статистиками и их свойствами

О школе

Coursera
Отзывы 0
Информация
Компания основана в 2012 году. Официальный сайт https://ru.coursera.org. Мы собрали и проверили более 17 отзывов об онлайн курсах Coursera.

Программа курса

Знакомство с R
В этом модуле мы начнем знакомство с языком статистического программирования R - основным инструментом, который мы будем использовать для анализа данных. Вы узнаете, как установить и настроить R и RStudio и как получить помощь. К концу модуля вы сможете использовать операторы и функции R для работы с числами и векторами.
Работа с данными
Существует множество способов представления и хранения данных в R. После обсуждения того, какие бывают типы данных, мы обратимся к методам их препарирования. Вы научитесь разными способами извлекать части векторов и таблиц и использовать для вычислений только нужные фрагменты данных. Для работы мы будем использовать не только данные, уже встроенные в R, но и научим вас открывать данные из внешних источников на примере .xlsx или .csv файлов. Мы обсудим принципы организации табличных данных для удобства машинного анализа (опрятные данные, tidy data).
Графики с использованием ggplot2
Графическое представление данных позволяет получить максимум информации за минимальный промежуток времени - часто это лучший способ представить данные в отчете. В этом модуле вы научитесь строить графики разной степени сложности, пользуясь принципами грамматики графиков (средствами пакета ggplot2). Кроме того, мы поговорим о том, как создавать в R автоматизированные отчеты с помощью rmarkdown и knitr.
Описательная статистика
Чаще всего, анализируя данные, мы имеем дело с выборками, но хотим делать выводы о свойствах генеральной совокупности, из которой они взяты. Описание выборок - это первый этап анализа данных. В этом модуле вы познакомитесь с основными описательными статистиками и их свойствами (медиана, квантили, среднее, дисперсия, стандартное отклонение). Мы обсудим свойства нормального и t- распределения и научимся с их помощью вычислять вероятности. Наконец, пользуясь центральной предельной теоремой, вы научитесь строить доверительные интервалы к оценкам средних.
Тестирование гипотез
В этом модуле вы научитесь тестировать гипотезы, чтобы проверять предположения на основании данных. На примере одновыборочного и двухвыборочного t-тестов мы разберем механизм конструирования тестовых статистик и алгоритм действий при тестировании гипотез. Вы узнаете, откуда родом те самые “условия применимости” t-тестов и научитесь их проверять. Мы обсудим ошибки, которые возникают при тестировании гипотез (не только ошибки I- и II-рода, но и S- или M-ошибки). Вы узнаете об опасностях, которые подстерегают вас при множественных тестах, и научитесь оберегать себя от них при помощи поправок на множественное тестирование. Знания, полученные в этом курсе в целом, вы сможете закрепить, выполнив проект, посвященный описанию выборок и тестированию различий между группами.
Инструменты
R

Отзывы

Еще не добавили ни одного отзыва