Apache Superset: полный курс [Stepic] [Трофим Воробьев]

Bot

Администратор
Команда форума
23 Янв 2020
205,815
3,143
113

Складчина: Apache Superset: полный курс [Stepic] [Трофим Воробьев]​

[IMG]

Вам надоело платить за PowerBI и Tableau? Apache Superset — бесплатная BI-система уровня enterprise, которая не уступает платным аналогам. Хотите молниеносные дашборды, гибкую аналитику и нулевую стоимость лицензий? Этот курс — быстрый старт для тех, кто хочет развернуть Superset с нуля, настроить его под бизнес-задачи и забыть о дорогих подписках. Вы получите готовую BI-платформу без скрытых платежей и ограничений. Сэкономьте бюджет компании — переходите на Superset уже сегодня!
Чему вы научитесь

  • Docker-развертывание – быстрый старт без головной боли
  • Кастомизация деплоя – тонкая настройка через .env и docker-init.sh
  • Бэкапы и восстановление – защита данных от потерь
  • Кэширование с Redis – ускорение работы дашбордов и защита СУБД
  • Jinja и Handlebars – динамические запросы и гибкие шаблоны
  • Annotation Layers – расширенная аналитика на графиках
  • CSS Templates – изменение интерфейса под корпоративный стиль
  • Локализация – перевод Superset на любой язык
  • RBAC (Role-Based Access Control) – гибкие права для пользователей
  • RLS (Row-Level Security) – защита строк данных на уровне БД
  • CLS (Column-Level Security) – контроль доступа к отдельным столбцам
  • Keycloak-интеграция – корпоративная аутентификация
  • Superset API – программируемое управление системой
  • Swagger – единая точка Superset API
  • Celery – фоновые задачи
  • Взаимодействие Superset с СУБД – подключение, как происходит общение
О курсе
Добро пожаловать на курс!

Задать вопросы перед прохождением можно ЗДЕСЬ - телеграм канал слушателей курсов автора (и сам автор там же)

Освойте Apache Superset на 100%!

От установки до администрирования — полный цикл работы с Superset в одном курсе. Научитесь разворачивать систему, строить дашборды и управлять безопасностью, чтобы сделать её идеальным BI-решением для бизнеса.

В бесплатной части оставлена инструкция по установке необходимой инфраструктуры с помощью Docker, а также описан вариант с использованием готового сервера для обучения (если вы не DevOps/Developer - то научитесь визуализировать, ничего не устанавливая). Также прочитайте необходимые начальные навыки - требуется знание Python/SQL на базовом уровне.

Что предстоит делать

  • Изучать текстовые/видеоматериалы
  • Выполнять интересные, приближенные к реальным задачи на локально развернутой инфраструктуре
  • Читать полезные статьи, которые будут приложены к курсу
Как устроен курс
  • Лекция в формате видеозаписи + текстовые инструкции, если необходимо
  • Выполнение тестовых заданий по лекции
  • Разработка, приближенная (являющаяся) реальной
Какие темы затронем
  • все, что связано с Apache Superset
Для кого этот курс
Данный курс предназначен для всех, кто так или иначе работает / планирует работать с данными.
Начальные требования
Для успешного прохождения курса необходимо:
  • Знание Docker, либо быть готовым повторить всё за преподавателем
  • Знания SQL обязательно (select, where, group by, having, order by, join и т.д.). Вы умеете писать SQL-запросы. Вы понимаете, что такое база данных, и что различных систем управления базой данных (СУБД) очень много (Postgres, ClickHouse, MySQL и т.д.). Вы готовы работать с SQL, так как в курсе очень много будет связано именно с БД.
  • Знания Python обязательно - вы знакомы с типами данных, функциями. Знаете про библиотеки - панды ваши друзья. Желательно знать какую-либо IDE (PyCharm, VSCode), но не обязательно.
Рекомендуемые системные требования Docker:
  • Процессор: Intel Core i5 8400 Coffee Lake или лучше (в реальности достаточно и i3)
  • Память: 8 ГБ оперативной памяти (в реальности достаточно и 4-5ГБ)
  • Хранение: 20 ГБ SSD/HDD (в реальности не менее 10ГБ)
Для того, что вы могли понять, достаточно ли ресурсов вашего компьютера для прохождения курса, уроки с установкой Docker, DataLens, Superset, ClickHouse и Airflow будут доступны бесплатно.
Спойлер: Программа курса
Введение
  1. Об Apache Superset, авторе, курсе
Установка необходимых инструментов
  1. Готовые инструкции
Быстрый старт
  1. Сразу дашборд
  2. Датасет
  3. Чарт
  4. Дашборд
Продвинутая кастомизация
  1. CSS элементов дашборда
  2. CSS Templates
  3. JSON metadata дашборда
  4. Jinja Templates. Активация
  5. Jinja Templates. Переменные
  6. Jinja Templates. Циклы
  7. Jinja Templates. Фильтры
  8. Jinja Templates. Ветвления
  9. Jinja Templates. Макросы
  10. Jinja Templates. Проброс фильтра в виртуальный датасет
  11. Jinja Templates. Фильтр по дате. Пользовательский ввод
  12. Jinja Templates. Собственный макрос. Логирование в stdout
  13. Handlebars
  14. Jinja + Handlebars. Column Level Security (CLS)
  15. Annotation Layers
  16. Итоговый тест
Superset_db
  1. Структура контейнера. Тома. БЭКАП!
  2. Ломаем. Сила Бэкапа!
  3. Открываем доступ. Изучаем внутренности. Пулы соединений
Делаем MVP
  1. Environment (переменные окружения)
  2. Command (команды, выполняемые во время установки)
  3. Контейнер superset_init, superset cli
  4. Правим ошибки, особенности SECRET_KEY, смены пароля admin
superset_cache
  1. Открываем доступ, изучаем назначение
Superset_worker, Superset_worker_beat
  1. Кратко о celery, Superset_worker_beat, Superset_worker
  2. AlertS & Reports
  3. Прогрев кэша, танцы с Celery
API, Swagger
  1. Swagger, удаляем Celery
  2. Скрипт API, CSRF, JWT (аутентификация)
  3. Скрипт API, прогрев кэша
  4. Пагинация
  5. Пишем чистильщик мусора
Ролевая модель (RBAC)
  1. Структура модели RBAC
  2. Создаем бизнесмена
  3. Permissions
  4. Статус дашборда в RBAC. Области видимости
  5. DASHBOARD_RBAC
  6. RLS
Маленькие полезные фишки
  1. Фильтры по горизонтали
  2. Система тэгов
  3. Кастомная страница аутентификации
  4. Перенаправление после аутентификации
Локализация (перевод на русский язык)
  1. Введение, Flask-babel, translator
  2. Messages.json, po2json, fuzzy
  3. Виртуальное окружение, polib, свой скрипт
  4. Fuzzy - будь осторожен(на)
  5. Танго с бабелью
Поднимаем ClickHouse
  1. Кратко о ClickHouse + установка
  2. Делаем коннект + чарт на данных из ClickHouse
  3. Общение Superset с БД + потребление ресурсов
  4. Данные готовятся на стороне БД!
Интеграция с KeyCloak
  1. Кратко о KeyCloak + установка
  2. Настройка KeyCloak
  3. Настройка Superset
  4. Аутентифицируемся
  5. Немного под капот (сложно, не обязательно)
Заключение
  1. Заключение

Скрытая ссылка