

О курсе
Что мы изучаем на курсе
Введение. Первичный анализ данных
● Определение Data Science
● Средства для анализа данных и ML (настройка окружения)
● Данные в машинном обучении (признаковое пространство)
● Избранные вопросы статистики и теории вероятностей (плотность распределения, основные статистики, гистограмма)
● Введение в pandas
● Средства визуализации (seaborn, matplotlib)
Постановки задач машинного обучения
● Постановка задачи машинного обучения с учителем
● Сведение к задаче оптимизации (МНК)
● Линейные методы регрессии и классификации
● Примеры задач машинного обучения
● Валидация с помощью отложенной выборки
Градиентный спуск. Введение в numpy
● Введение в numpy
● Градиентный спуск (на примере лин. регрессии)
Логистическая регрессия. Переобучение
● Метрики качества регрессии и классификации
● Метод максимума правдоподобия
Переобучение и борьба с ним
● Кросс-валидация
● Регуляризация
● Подбор параметров
Работа с признаками
● Обработка пропусков
● Понижение размерности (PCA)
Метод опорных векторов. Многоклассовая классификация
● Подходы и метрики для многоклассовой классификации
Решающие деревья
● Критерий Джини\Энтропийный критерий
● Смещение и разброс
Композиции
● Бэггинг
● Метод случайных подпространств
● Случайный лес
● Мета-обучение
Градиентный бустинг
● Обзор CatBoost и XGBoost
Кластеризация
● Метрики кластеризации
● Метрики близости
● K-means
● Иерархическая кластеризация
● DBSCAN
Полносвязные нейронные сети
● Обобщение логистической регрессии
● Back propagation
● Обзор методов оптимизации
● Введение в PyTorch
Обзор пройденного за курс. Воркшоп по решению "боевой" задачи
Преподаватели

Вильданов Вадим Кадирович

Камскова Инна Дмитриевна