Тематический план
Поколения платформ анализа данных. Хранилища данных.
Три поколения платформ анализа распределенных данных. Концепция хранилища данных. ETL процесс. Проблемы интеграции данных из распределенных источников.Неструктурированные данные. Озера данных
Неструктурированные и полу структурированные данные. Концепция "озер" данных. Средства распределенного анализа данных. Концепция MapReduce. Основные инструменты распределенного анализа данных.Потоковые данные
Понятие потоковых данных. Проблемы обработки потоковых данных. Свойства систем анализа потоковых данных. Лямбда-архитектура. Капа-архитектура.Федеративное обучение
Проблемы централизованного анализа данных. Федеративное обучение. Виды систем федеративного обучения. Проблемы построения систем федеративного обучения. Основные инструменты федеративного обучения. Основные алгоритмы федеративного обучения.