Назад

О курсе

Что мы изучаем на курсе

Введение. Первичный анализ данных

● Обзор курса
● Определение Data Science
● Средства для анализа данных и ML (настройка окружения)
● Данные в машинном обучении (признаковое пространство)
● Избранные вопросы статистики и теории вероятностей (плотность распределения, основные статистики, гистограмма)
● Введение в pandas
● Средства визуализации (seaborn, matplotlib)

Постановки задач машинного обучения

● Классификация методов машинного обучения
● Постановка задачи машинного обучения с учителем
● Сведение к задаче оптимизации (МНК)
● Линейные методы регрессии и классификации
● Примеры задач машинного обучения
● Валидация с помощью отложенной выборки

Градиентный спуск. Введение в numpy

● Избранные вопросы мат. анализа и лин. алгебры
● Введение в numpy
● Градиентный спуск (на примере лин. регрессии)

Логистическая регрессия. Переобучение

● Логистическая регрессия
● Метрики качества регрессии и классификации
● Метод максимума правдоподобия

Переобучение и борьба с ним

● Переобучение
● Кросс-валидация
● Регуляризация
● Подбор параметров

Работа с признаками

● Подготовка и отбор признаков
● Обработка пропусков
● Понижение размерности (PCA)

Метод опорных векторов. Многоклассовая классификация

● Метод опорных векторов
● Подходы и метрики для многоклассовой классификации

Решающие деревья

● Решающие деревья
● Критерий Джини\Энтропийный критерий
● Смещение и разброс

Композиции

● Бутстрап
● Бэггинг
● Метод случайных подпространств
● Случайный лес
● Мета-обучение

Градиентный бустинг

● Алгоритм градиентного бустинга
● Обзор CatBoost и XGBoost

Кластеризация

● Постановка задачи кластеризации
● Метрики кластеризации
● Метрики близости
● K-means
● Иерархическая кластеризация
● DBSCAN

Полносвязные нейронные сети

● Напоминание производной сложной функции
● Обобщение логистической регрессии
● Back propagation
● Обзор методов оптимизации
● Введение в PyTorch

Обзор пройденного за курс. Воркшоп по решению "боевой" задачи

Преподаватели

Вильданов Вадим Кадирович

Data Scientist / Python разработчик, кандидат физико-математических наук.Бизнес-Информатика

Камскова Инна Дмитриевна

Доцент кафедры математического моделирования экономических процессов ННГУ им. Н.И. Лобачевского, кандидат экономических наук.

Оставьте заявку