Тематический план
Введение в машинное обучение и основные понятия статистики. Первичная обработка данных
Предмет дисциплины, её объём, содержание и связь с другими дисциплинами учебного плана. Обзор литературы по курсу. Основные понятия математической статистики. Методы обработки данных: алгоритмы поиска выборосов (критерий Шовене), алгоритмы восстановления пропущенных данных (метрические и статистические методы).Линейная регрессия и ее обобщения
Постановка задачи регрессии, модель линейной регрессии и ее обобщения (полиномиальная регрессия, лассо и регуляризация). Контроль качества модели для задачи регрессии.Задача классификации
Постановка задачи классификации. Модели машинного обучения для задачи классификации: метод ближайшего соседа, деревья решений, линейные классификаторы, метод опорных векторов. Контроль качества модели для задачи классификации.Вероятностные алгоритмы, байесовские классификаторы
Понятие об алгоритмах, выдающих вероятности. Байесовский классификатор. Контроль качества модели, выдающей вероятности.Отбор оптимального числа признаков и ансамбли алгоритмов
Важность задачи по отбору признаков для модели искусственного интеллекта. Методы отбора признаков: прямые и итерационные. Синтез новых признаков. Понятие об ансамбле алгоритмов. Виды ансамблей для задач классификации и регрессии. Градиентный бустинг.