Целью подготовки слушателей по Программе является получение компетенции, необходимой для выполнения нового вида профессиональной деятельности в области информационных технологий обучающимися по специальностям и направлениям подготовки ИТ-сферы; приобретение новой квалификации «Аналитик больших данных»

Курс обеспечивает теоретические и практические знания в области методов и инструментов анализа Больших данных. Программа курса включает в себя изучение понятия Больших данных, особенностей работы с ними и средств обеспечивающих их масштабируемый анализ.

В рамках дисциплины рассматриваются средства для работы с данными различного вида: структурированными, пвседоструктурированными, неструктурированными, потоковыми, распределенными и другими. Изучаются основные парадигмы распределенной обработки данных, такие как MapReduce, лямбда-архитектуры и другие, а также особенности методов анализа применяемых к Большим данным.


В модуле рассказывается про технологию Федеративного обучения, которая позволяет выполнять алгоритмы машинного обучения на источниках данных без их передачи в централизованное хранилище данных. В модуле рассматриваются разные виды распределения данных, типы систем федеративного обучения, основные алгоритмы и фреймворки.