Машинное обучение с несбалансированными данными [Udemy] [Соледад Галли]

Bot

Администратор
Команда форума
23 Янв 2020
201,207
3,138
113
Машинное обучение с несбалансированными данными
Изучите несколько методов устранения дисбаланса данных и повышения производительности ваших моделей машинного обучения.
Авторы: Соледад Галли
Последнее обновление: 11/2020
Снимок экрана 2020-11-26 в 19.12.35.png


Субтитры: Русский, Английский [Автоматически созданные]
Язык: Английский
Чему вы научитесь


  • Методы неполной выборки наугад
  • Методы недостаточной выборки, которые сосредоточены на наблюдениях, которые сложнее классифицировать
  • Методы недостаточной выборки, игнорирующие потенциально зашумленные наблюдения
  • Методы избыточной выборки для увеличения количества наблюдений меньшинств
  • Способы создания синтетических данных для увеличения примеров класса меньшинств
  • SMOTE и его варианты
  • Используйте методы ансамбля с методами выборки для повышения производительности модели.
  • Наиболее подходящие метрики оценки для использования с несбалансированными наборами данных

Описание
Добро пожаловать в машинное обучение с несбалансированными наборами данных. В этом курсе вы изучите несколько методов, которые вы можете использовать с несбалансированными наборами данных, чтобы повысить производительность ваших моделей машинного обучения.

Если вы работаете с несбалансированными наборами данных прямо сейчас и хотите улучшить производительность своих моделей, или просто хотите узнать больше о том, как справиться с дисбалансом данных, этот курс покажет вам, как это сделать.

Мы шаг за шагом проведем вас через увлекательные видеоуроки и научим всему, что вам нужно знать о работе с несбалансированными наборами данных. На протяжении этого всеобъемлющего курса мы охватываем практически все доступные методики работы с несбалансированными наборами данных, обсуждая их логику, их реализацию на Python, их преимущества и недостатки, а также соображения, которые следует учитывать при использовании этой техники. В частности, вы узнаете:

  • Методы неполной выборки случайным образом или с упором на выделение определенных групп выборки
  • Методы случайной избыточной выборки и методы, создающие новые примеры на основе существующих наблюдений
  • Методы ансамбля, которые используют возможности нескольких слабых учеников в сочетании с методами выборки для повышения производительности модели
  • Чувствительные к стоимости методы, которые более серьезно наказывают за неправильные решения для представителей меньшинств
  • Соответствующие метрики для оценки производительности модели на несбалансированных наборах данных
К концу курса вы сможете решить, какой метод подходит для вашего набора данных, и / или применить и сравнить улучшение производительности, возвращаемое различными методами для нескольких наборов данных.
Этот всеобъемлющий курс машинного обучения включает более 50 лекций, охватывающих около 8 часов видео, и ВСЕ темы включают практические примеры кода Python, которые вы можете использовать для справки и для практики, а также повторно использовать в своих собственных проектах .

Материалы курса
10 разделов • 84 лекций • Общая продолжительность 6 ч 24 мин

Спойлер: Материалы курса
Снимок экрана 2020-11-26 в 19.15.20.png


Для кого этот курс:
  • Специалисты по данным и инженеры по машинному обучению, работающие с несбалансированными наборами данных

www.udemy.com/course/machine-learning-with-imbalanced-data/