Складчина: Causal Inference для аналитиков [Stepik] [Максим Кан]
Курс для тех, кто хочет научиться оценивать эффекты без A/B-тестов, и применять методы Causal Inference в реальных задачах.
Чему вы научитесь
- Познакомитесь со всей необходимой теорией Causal Inference: узнаете, что такое потенциальные результаты, конфаундинг и почему именно A/B эксперименты являются стандартом Causal Inference.
- Узнаете, как линейная регрессия OLS устраняет смещение через ортогонализацию, и научитесь правильно применять её в задачах Causal Inference.
- Научитесь применять нелинейные модели, такие как CatBoost и XGBoost, в задачах Causal Inference, используя теорему Фриша–Во–Ловелла и Double Machine Learning.
- Узнаете, что такое Propensity Score на самом деле, и сможете применять методы IPTW и DRE на практике.
- Поймёте истинную силу панельных данных и моделей Two-Way Fixed Effects, а также научитесь учитывать ненаблюдаемые переменные.
- Научитесь применять метод синтетического контроля Causal Impact: узнаете, как работать с ковариатами и проверять качество модели с помощью A/A симуляций.
- Разберётесь с методом Difference-in-Differences, поймёте его предпосылки и научитесь применять его для оценки эффектов.
- Получите handbook по решению задач Causal Inference.
- Опытные аналитики посмотрят на A/B-тестирование под новым углом.
Зачем проходить данный курс?
Часто в работе аналитиков встречаются случаи, когда провести рандомизированный эксперимент (A/B-тест) невозможно. В таких случаях second-best option — методы Causal Inference.
- Требования к знаниям Causal Inference всё чаще встречаются в вакансиях на аналитиков.
- Курс научит вас качественно проводить Causal Inference исследования, корректно оценивать эффекты на нерандомизированных данных и использовать результаты для принятия обоснованных продуктовых решений.
- В каждом модуле вас ждут практические кейсы на данных, разбор популярных заблуждений и типичных ошибок (еще много мемов).
- Курс даст вам структурное понимание Causal Inference и поможет разобраться, как применять его методы в реальных задачах.
После прохождения курса полученных знаний и навыков должно хватить, чтобы качественно проводить Causal Inference исследования у себя на работе или пройти секцию с Causal Inference на собеседовании.
Формат курса
- Текстовые лекции по теме. Материал сложный, но я старался писать понятным языком. Помимо математики, мы также разбираем интуицию за изучаемыми методами.
- Тесты по пройденному материалу.
- Практические задания на данных. Учимся применять изученные методы на реальных кейсах.
Курс предназначен для всех специалистов в области Data Science и будет особенно полезен продуктовым аналитикам, маркетинговым аналитикам, а также аналитикам данных.
Начальные требования
- Навыки программирования на Python и опыт работы с библиотеками Pandas и Numpy.
- Знания базовой статистики: ЦПТ, Доверительные интервалы, t-test, p-value.
- Знания классических понятий и концепций из Machine Learning: кросс-валидация, oof-предсказания, MSE.
Программа курса
1. Введение
Что даст вам этот курс?
Что нужно знать перед прохождением?
2. Основы причинно-следственного анализа
Введение в Causal Inference
Average Treatment Effect
Причинно-следственный DAG
Selection Bias и Confounding Bias
3. Линейная регрессия. Regression Adjustment и Ортогонализация
Линейная регрессия OLS. Ортогонализация
Two Way Fixed Effects. Ненаблюдаемые конфаундеры
Double Machine Learning для ортогонализации
Инструментальная переменная и 2SLS регрессия
4. Propensity Score
Склонность к воздействию - балансирующая мера
Inverse Probability of Treatment Weighting (IPW)
Double robust estimator
5. Casual Impact
Принцип работы Causal Impact
Анализ остатков и A/A симуляции
Работа с ковариатами
6. Difference in Difference
Канонический Difference in Difference
Предположения Difference in Difference
Модификации Difference in Difference
Цена: 3499
Скрытая ссылка