Складчина: Современное компьютерное зрение [stepik] [AI Education] [Елена Кантонистова,Марк Блуменау]
Курс посвящен основам глубинного обучения в области Computer Vision (CV). В курсе мы начнем с азов компьютерного зрения, а затем затронем актуальные задачи CV и посмотрим на устройство популярных решений.Программа курса
О курсе
Классические методы Computer Vision
- Основы обработки изображений: фильтры и сверткиДемо-доступ
- Операторы градиента: Лаплас, Собель, КанниДемо-доступ
- Бинаризация и трешхолдинг (Otsu, адаптивный порог)Демо-доступ
- Методы выделения признаков: SIFT и другие
- HOG: гистограммы направленных градиентов
- Поиск и сопоставление ключевых точек
- Преобразование Хафа и обнаружение геометрических фигур
- Пространственные преобразования: аффинные и перспективные
- Основы сверточных нейронных сетей: ядра, фильтры, пуллинги
- Архитектура LeNet: первые шаги в CV с использованием CNN
- AlexNet: особенности и влияние на развитие глубокого обучения
- VGG: глубокие сети с фиксированными свертками
- ResNet: идея резидуальных связей для решения проблемы исчезающих
- Домашнее задание
- ViT (Vision Transformer): альтернатива CNN
- MobileNet: легковесные модели для мобильных устройств
- EfficientNet и EfficientNetV2: масштабируемость и оптимизация
- Практика: аугментации и MBConv
- Домашнее задание
- Основы задачи детекции и Non-Maximum Suppression
- RCNN: архитектура и эволюция (Fast RCNN, Faster RCNN)
- YOLOv1
- Современные подходы к детекции: YOLO11 и более новые версии
- Детекция на практике
- Домашнее задание
- Задача сегментации
- U-Net: идея и применение в медицинских изображениях
- Deeplab и его разновидности: адаптация к различным уровням разре
- Mask R-CNN: объединение детекции и сегментации
- Segment Anything Model (SAM): универсальная модель сегментации
- Практика по сегментации
- Домашнее задание (тестирование)
- Задача трекинга и оценивание качества трекинга
- Алгоритм трекинга
- Работа с видеопотоками. FFMpeg: чтение, запись, сжатие видео
- Gstreamer: организация сложных видео- и аудиопайплайнов
- Практика: захват видео с камер в реальном времени
- Тест по последнему занятию
- Итоговый проект курса
- Установка библиотеки. Загрузка и вывод изображений
- Аннотации типов в Python
- Практика с FastAPI
- Библиотека Pydantic