Целью подготовки слушателей по Программе является получение компетенции, необходимой для выполнения нового вида профессиональной деятельности в области информационных технологий обучающимися по специальностям и направлениям подготовки ИТ-сферы; приобретение новой квалификации «Специалист по большим данным».

Модуль представляет собой изучение основ проектирования баз данных, включая анализ предметной области, моделирование данных и реализацию их физической модели. На примерах рассматриваются основные функции управления данными, такие как определение, манипулирование, поиск, защита данных. Дается характеристика базам данных NoSQL, ориентированных на хранение и обработку больших объемов данных. Рассматриваются способы распределения и согласованности в базах данных NoSQL. Приводится сравнительная характеристика существующих архитектурных решений управления доступом к базам данных и механизм транзакций как способ параллельной обработки запросов пользователей.

Курс обеспечивает теоретические и практические знания в области методов и инструментов анализа Больших данных. Программа курса включает в себя изучение понятия Больших данных, особенностей работы с ними и средств обеспечивающих их масштабируемый анализ.

В рамках дисциплины рассматриваются средства для работы с данными различного вида: структурированными, пвседоструктурированными, неструктурированными, потоковыми, распределенными и другими. Изучаются основные парадигмы распределенной обработки данных, такие как MapReduce, лямбда-архитектуры и другие, а также особенности методов анализа применяемых к Большим данным.