Машинное зрение: локализация объектов на Python [Udemy] [Центр digital-профессий ITtensive]

Bot

Администратор
Команда форума
23 Янв 2020
201,202
3,138
113
Машинное зрение: локализация объектов на Python
Обработка изображений с помощью фильтров, градиентов, каскадов и нейросетей для выделения форм и областей
Авторы: Центр digital-профессий ITtensive
Опубликовано: 12/2020

Чему вы научитесь

Описание

Второй курс из серии Машинное зрение посвящен локализации объекта на изображениях с помощью OpenCV на Python. Для работа по курсу необходимо установить модули numpy pandas sklearn keras tensorflow pillow opencv-python opencv-contrib-python scikit-image cmake face_recognition mrcnn.

Курс состоит из 4 больших частей:

Выделение форм

Разберем базовые подходы к фильтрации изображений и освоим авто-поворот изображений:

  • Графические фильтры: четкость, размытие, наращивание и эрозия.
  • Восстановление резкости: адаптивные гистограммы, Ричардсон-Люси, маска нечеткости и устранение шума.
  • Выделение границ по Собелю, Щару и Канни.
  • Сбор контуров из границ, ограничивающие прямоугольники и поворот изображения.
  • Преобразования Хафа и выделение окружностей.
В заключении соберем простой сканер штрих-кодов на изображении.
Выделение объектов

Применим общие подходы к обнаружению различных форм на изображении на примере человеческих лиц.

  • Примитивы Хаара и каскады Виолы-Джонса.
  • Гистограммы направленных градиентов.
  • Глубокие нейросети.
  • Локальные бинарные шаблоны гистограмм.
Для закрепления материала обнаружим лица на фотографиях и распознаем их.
Выделение признаков

Используем дескрипторы ключевых точек для масштабно-инвариантных преобразований.

  • SIFT и SURF.
  • ORB, FAST и BRIEF.
  • Моменты изображения.
  • Трехмерная трансформация и повороты.
  • Объединение изображений в панораму.
Объединим несколько изображений в панораму, используя ключевые точки.
Сегментация изображений

В заключении разберем нейросетевые подходы для локализации классов объектов на изображении.

  • YOLO: You Only Look Once.
  • Mask R-CNN: Regions CNN.
  • MobileNet-SSD: Single Shot Detection.
  • Сегментационные нейросети.
В качестве курсового проекта обработаем набор реальных фотографий для подготовки их к задаче распознавания или классификации.
Для кого этот курс:

  • Разработчики систем машинного зрения
  • Инженеры по работе с графическими данными
  • Научные работники и исследователи данных

www.udemy.com/course/ittensive-machine-vision-localization/