Анализ данных [2022] [Высшая математика] [ШАД Helper] [Егор Илларионов]

Bot

Администратор
Команда форума
23 Янв 2020
191,613
3,088
113
Анализ данных [2022]
Высшая математика
ШАД Helper
Егор Илларионов
Пройдём все темы, обозначенные в требованиях к поступающим в ШАД по анализу данных. Прорешаем задачи прошлых годов. Лекция и семинар каждую неделю.

Автор программы
- кандидат физико-математических наук и преподаватель мехмата МГУ - Илларионов Егор.

Цели курса:
1. Дать понимание математических основ машинного обучения
2. Освоить базовые инструменты чтения и препроцессинга разнородных данных
3. Научиться быстро собирать baseline модели и видеть способы улучшения
4. Получить навыки командной работы и совместной генерации идей
5. Сформировать community для начинающих и более опытных специалистов по анализу данных/машинному обучению.

Спойлер: Содержание
Модуль 1 - Основные задачи и инструменты машинного обучения.
  • Настройка необходимого окружения.
  • Полезные ссылки и ресурсы.
  • Numpy, работа с числовыми данными, сэмплирование
Модуль 2 - Кластеризация: метрики и алгоритмы
  • Pandas, работа с табличными данными, работа с пропущенными значениями, EDA
Модуль 3 - SVD, рекомендательная модель
  • Визуализация данных Matplotlib, задача понижения размерности, PCA
Модуль 4 - Линейная регрессия
  • Препроцессинг и очистка данных, соревнование
Модуль 5 - Логистическая регрессия, обобщенная линейная модель
  • Feature engineering, классификация текстовых данных, соревнование
Модуль 6 - Переобучение: признаки, причины, методы устранения. Регуляризация
  • Кросс-валидация, соревнование
Модуль 7 - Решающие деревья для регрессии и классификации
  • Подбор гиперпараметров, соревнование
Модуль 8 - Ансамбли алгоритмов
  • Итоговый хакатон, награждение победителей, рекомендации по дальнейшему обучению

Примечание: на момент создания темы актуальная цена не известна.
Продажник