Основы Data Science [2021] [it-academy] [Роман Сидоренко]

Bot

Администратор
Команда форума
23 Янв 2020
202,011
3,138
113
Основы Data Science [2021]
it-academy
Роман Сидоренко
Курс по Data Science направлен на приобретение знаний, навыков и умений по извлечению, структурированию и использованию полезной информации из неструктурированных, а также разрозненных источников.

Он охватывает основные современные средства Data Mining, Machine Learning и Big Data.
Использование указанных технологий даёт неоспоримое преимущество не только организациям на рынке товаров и услуг, но и людям на рынке труда.

Спойлер: Для кого этот курс
1. Для разработчиков, желающих расширить свои компетенции;
2. Для студентов старших курсов и выпускников технических ВУЗов, которые хотят повысить свои шансы на трудоустройство;
3. Для аспирантов и соискателей научных степеней, желающих приобрести навыки решения научных и исследовательских задач с использованием современных информационных технологий;
4. Для специалистов, желающих повысить свою компетенцию в области Data Mining, Big Data и Data Science.
Спойлер: Для чего этот курс
1. Приобретения знаний в областях Data Mining, Big Data и Data Science;
2. Формирования устойчивых навыков и умений по постановке и решению аналитических и исследовательских задач с использованием математической статистики и современных информационных технологий, а также разработки информационных рекомендательных систем.
Спойлер: Вы будите уметь
1. Осуществлять сбор, обобщение и очистку исходных информационных данных;
2. Находить аналитические зависимости в структурированных и неструктурированных данных;
3. Осуществлять постановку и решение задач математического программирования и исследования операций;
4. Знать и уметь применять основные алгоритмы машинного обучения и математического программирования;
5. Знать, как работает Machine Learning;
6. Уметь пользоваться основными инструментами Data Mining, Big Data и Data Science;
7. Знать основные типы и архитектуру нейронных сетей;
8. Реализовывать, внедрять и обучать Machine Learning модели;
9. Решать задачи Computer Vision, Natural Language Toolkit, а также прогнозирования временных рядов;
10. Знать концепции Map Reduce и CUDA;
11. Знать принципы функционирования высоконагруженных систем;
12. Разрабатывать рекомендательные системы.
Спойлер: Содержание
Модуль 1 - Введение в Data Science
  • Объект Data Science.
  • Взаимосвязь Data Mining, Big Data и Data Science.
  • Инструментарий Data Science.
  • Основные способы получения данных.
  • Базовый эксплоративный анализ и визуализация данных.
Модуль 2 - Математические основы Data Science
  • Основы матричного исчисления.
  • Реализация матричных операций в Python.
  • Основы теории вероятности и математической статистики.
  • Проверка статистических гипотез в Python.
  • Основы математического программирования и исследования операций.
  • Классификация алгоритмов математического программирования.
  • Визуализация данных в Python.
Модуль 3 - Основы Data Science и Machine Learning
  • Принципы построения моделей в Data Science.
  • Метрики качества моделей. Проверка качества модели.
  • Введение в Deep Learning и Machine learning.
  • Объект Deep Learnig и Machine Learning. Классы решаемых задач.
  • Большие данные и параллельные вычисления.
  • Подходы к построению высоконагруженных систем.
  • Обобщение и сбор данных для обучения их очистка и нормализация.
  • Обзор и классификация алгоритмов ML.
Модуль 4 - Основные алгоритмы Machine Learning
  • Алгоритмы «Дерево решений», «Случайный лес», «K-ближайших соседей», «Градиентный бустинг».
  • Кластеризация и поиск ассоциаций.
  • Линейная и логистическая регрессия. Ограничения, преимущества и недостатки.
  • Обучение с учителем.
  • Обучение классификатора на размеченных данных.
  • Проверка качества модели: переобучение, регуляризация, обучающая и тестовая выборки.
  • Борьба с переобучением: ансамблирование. Обзор методов ансамблирования.
  • Реализация алгоритмов в Python.
Модуль 5 - Методы предобработки данных
  • Снижение размерности, разреженные данные, многомерные пространства.
  • Коррелирующие параметры.
  • Нерациональное использование памяти, сложность моделей.
  • Статистический анализ данных, выбор параметров на основе корреляции.
  • Снижение размерности данных: поиск подмножеств, регуляризация, уменьшение пространства.
  • Векторное разложение.
  • Методы декомпозиции.
  • Спрямляющие пространства.
Модуль 6 - Рекомендательные системы
  • Введение в рекомендательные системы.
  • Различие между предсказаниями и рекомендациями.
  • Типы рекомендательных систем.
  • Постановка целей.
  • Неперсонализированные рекомендации.
  • Способы построения рекомендательных систем.
  • Цепи Маркова.
  • Групповые рекомендации.
Модуль 7 - Распознавание изображений, машинное зрение
  • Теоретические основы обработки изображений.
  • Форматы данных (RGB, CMYK, B&W), принципы и алгоритмы сжатия изображений, примеры чтения и конвертации изображений.
  • Выделение признаков изображений.
  • Задача поиска изображения по шаблону, представление свойств изображения с помощью гистограмм.
  • Поиск похожих картинок по контенту.
  • Сегментация изображений, детекция объектов.
  • Детектор лиц на изображении.
Модуль 8 - Введение в нейронные сети
  • Основные элементы нейронных сетей.
  • Классификация архитектур нейронных сетей.
  • Обучение: функция потерь, обратное распространение ошибки, стохастический градиент.
  • Регуляризация.
  • Инициализация весов.
  • Сверточные нейронные сети.
  • Практическое применение сверточных рекурентных и генеративно-конкурирующих сетей в задачах Computer Vision.
Модуль 9 - Распознавание естественного языка
  1. Введение в обработку текста.
  2. Частотный анализ.
  3. Законы Ципфа и Хипса.
  4. Морфологический и синтаксический анализ.
  5. Векторная модель и методы снижения размерности в ней.
  6. Классификация текстов.
  7. Извлечение именованных сущностей.
  8. Языковые модели.
  9. Извлечение информации.
  10. Генерация текстов.
Модуль 10 - Временные ряды
  • Временные ряды.
  • Модели построения прогнозов.
  • Разложение временного ряда на компоненты.
  • Автокорреляция и корелограммы.
  • Стационарность ряда.
  • Сложные модели прогнозирования.
  • Прогнозирование временных рядов на цепях Маркова.
Модуль 11 - Общение с заказчиком. Требования к Data Science проектам
  • Cпособы выяснения требований, проверка их выполнимости.
  • Формализация и утверждение требований с заказчиком.
  • Общий порядок составления отчетов.
  • Цели, явные и неявные ожидания заказчиков проекта.
  • Описание зависимостей и способов воздействия на важные для заказчика факторы.
  • Практический опыт создания хайлоад моделей.
  • Выбор алгоритмов, библиотек, тонкой настройки моделей.
Модуль 12 - Подведение итогов
  • Защита дипломных проектов.

Примечание: полная стоимость курса 2 999 (BYN)
Продажник