Модуль представляет собой изучение основ проектирования баз данных, включая анализ предметной области, моделирование данных и реализацию их физической модели. На примерах рассматриваются основные функции управления данными, такие как определение, манипулирование, поиск, защита данных. Дается характеристика базам данных NoSQL, ориентированных на хранение и обработку больших объемов данных. Рассматриваются способы распределения и согласованности в базах данных NoSQL. Приводится сравнительная характеристика существующих архитектурных решений управления доступом к базам данных и механизм транзакций как способ параллельной обработки запросов пользователей.
Курс обеспечивает теоретические и практические знания в области методов и инструментов анализа Больших данных. Программа курса включает в себя изучение понятия Больших данных, особенностей работы с ними и средств обеспечивающих их масштабируемый анализ.
В рамках дисциплины рассматриваются средства для работы с данными различного вида: структурированными, пвседоструктурированными, неструктурированными, потоковыми, распределенными и другими. Изучаются основные парадигмы распределенной обработки данных, такие как MapReduce, лямбда-архитектуры и другие, а также особенности методов анализа применяемых к Большим данным.