Машинное обучение - Подготовка данных (Модуль 1) [stepik] [Alexey Kozhakin]

Admin

Администратор
Команда форума
22 Фев 2018
59,626
17,719
113
Складчина: Машинное обучение - Подготовка данных (Модуль 1) [stepik] [Alexey Kozhakin]

Данный курс является первым модулем из серии моих курсов по машинному обучению (ML). В этом курсе в качестве задачи будет рассматриваться прогнозирование в футбольной аналитике. Мы сосредоточимся на сборе данных, которые будут использоваться для прогнозирования в следующих модулях. Помимо сбора данных, мы также применим некоторые техники предобработки данных.

Программа курса
Введение

  1. О курсе
  2. Среда разработки
Сбор данных с использованием парсинга
  1. Выбор источника данных
  2. Выбор метода парсинга
  3. Определение целевых данных
  4. Разработка скрипта парсинга
  5. Библиотека прасинга датасета
Обзор данных
  1. Обзор датасета
  2. Библиотеки для анализа данных
Очистка данных
  1. Важность и цель очистки данных.
  2. Устранение дубликатов
  3. Методы заполнения пропущенных данных.
  4. Целевая переменная
  5. Входные параметры
Валидация данных
  1. Проверка качества данных после очистки и обработки
  2. Проверка точност на моделях
  3. Анализ важности признаков
Кластерный анализ
  1. Понижение размерности
  2. Кластерный анализ
  3. Добавление новых параметров
  4. Оценка качества модели после применения кластеризации
Нормализация и стандартизация данных
  1. Приведение данных к единообразному формату.
  2. Преобразование категориальных признаков.
  3. Оценка качества модели после нормализации модели
Балансировка данных
  1. Статистический анализ
  2. Балансировка данных
цена 500 р.