Data Engineering от Skillfactory

От: Skillfactory

Практический курс "Data Engineering" обучает перспективному направлению в Big Data и рассчитан на новичков. Бизнес-аналитики и специалисты Data Science, аналитики данных и разработчики, менеджеры и руководители за 70 дней научатся собирать информацию для принятия бизнес-решений, используя различные источники. Получат практические навыки по эффективному пользованию командной строкой linux, работе с инструментом обработки данных Apache Spark и с файлами ORC, Parquet, Avro; с программами Cluster Manager, Python, Hadoop, Apache Airflow, Apache ZooKeeper и Apache Hive. Выдаётся диплом об окончании курса.

Сводка

Цена
от 49 833₽ 29 900₽
Рассрочка
от 200₽
Статус
Идет набор
Длительность
75 дней
Язык
ru

Описание курса

Собирать данные из разных источников, очищать их и передавать в удобном виде аналитикам для принятия бизнес-решений

- Работать с хранилищем данных и понимать, как обрабатываются данные
- Пользоваться одним из главных инструментов дата инженера — командной строкой Linux
- Разбираться в разных видах баз данных, их особенностях и различиях
- Работать с Apache Spark, как с инструментом для обработки данных
- Работать с разными форматами файлов (ORC, Parquet, Avro)

О школе

Skillfactory
Отзывы 0
Информация
Компания основана в 2016 году. Официальный сайт https://skillfactory.ru. Мы собрали и проверили более 115 отзывов об онлайн курсах Skillfactory.

Программа курса

Введение, практический linux
Кто такой Data Engineer и зачем ему Linux?
Модуль 1
Современные хранилища данных
Разнообразие баз данных и их особенности
Модуль 2
Экосистема Hadoop
Что такое Hadoop, что он умеет и как им пользоваться
Модуль 3
Источники данных и работа с ними
Файлы как источники данных, JDBC - структурированные данные, SQL для выгрузки данных
Модуль 4
Apache Spark и обработка данных
Зачем нужен Apache Spark и как с ним работать
Модуль 5
Hadoop как хранилище данных
Особенности и нюансы hdfs
Модуль 6
Apache Airflow для оркестрации конвейеров
Настройка data pipelines
Модуль 7
Обзор облачных хранилищ
Особенности и нюансы работы с облачными хранилищами: Google, Amazon, Azure
Инструменты
Cluster Manager
Python
Hadoop
Apache Airflow
Apache ZooKeeper
Apache Hive

Отзывы

Еще не добавили ни одного отзыва