Складчина: Apache Superset: полный курс [Stepic] [Трофим Воробьев]
Вам надоело платить за PowerBI и Tableau? Apache Superset — бесплатная BI-система уровня enterprise, которая не уступает платным аналогам. Хотите молниеносные дашборды, гибкую аналитику и нулевую стоимость лицензий? Этот курс — быстрый старт для тех, кто хочет развернуть Superset с нуля, настроить его под бизнес-задачи и забыть о дорогих подписках. Вы получите готовую BI-платформу без скрытых платежей и ограничений. Сэкономьте бюджет компании — переходите на Superset уже сегодня!
Чему вы научитесь
- Docker-развертывание – быстрый старт без головной боли
- Кастомизация деплоя – тонкая настройка через .env и docker-init.sh
- Бэкапы и восстановление – защита данных от потерь
- Кэширование с Redis – ускорение работы дашбордов и защита СУБД
- Jinja и Handlebars – динамические запросы и гибкие шаблоны
- Annotation Layers – расширенная аналитика на графиках
- CSS Templates – изменение интерфейса под корпоративный стиль
- Локализация – перевод Superset на любой язык
- RBAC (Role-Based Access Control) – гибкие права для пользователей
- RLS (Row-Level Security) – защита строк данных на уровне БД
- CLS (Column-Level Security) – контроль доступа к отдельным столбцам
- Keycloak-интеграция – корпоративная аутентификация
- Superset API – программируемое управление системой
- Swagger – единая точка Superset API
- Celery – фоновые задачи
- Взаимодействие Superset с СУБД – подключение, как происходит общение
Добро пожаловать на курс!
Задать вопросы перед прохождением можно ЗДЕСЬ - телеграм канал слушателей курсов автора (и сам автор там же)
Освойте Apache Superset на 100%!
От установки до администрирования — полный цикл работы с Superset в одном курсе. Научитесь разворачивать систему, строить дашборды и управлять безопасностью, чтобы сделать её идеальным BI-решением для бизнеса.
В бесплатной части оставлена инструкция по установке необходимой инфраструктуры с помощью Docker, а также описан вариант с использованием готового сервера для обучения (если вы не DevOps/Developer - то научитесь визуализировать, ничего не устанавливая). Также прочитайте необходимые начальные навыки - требуется знание Python/SQL на базовом уровне.
Что предстоит делать
- Изучать текстовые/видеоматериалы
- Выполнять интересные, приближенные к реальным задачи на локально развернутой инфраструктуре
- Читать полезные статьи, которые будут приложены к курсу
- Лекция в формате видеозаписи + текстовые инструкции, если необходимо
- Выполнение тестовых заданий по лекции
- Разработка, приближенная (являющаяся) реальной
- все, что связано с Apache Superset
Данный курс предназначен для всех, кто так или иначе работает / планирует работать с данными.
Начальные требования
Для успешного прохождения курса необходимо:
- Знание Docker, либо быть готовым повторить всё за преподавателем
- Знания SQL обязательно (select, where, group by, having, order by, join и т.д.). Вы умеете писать SQL-запросы. Вы понимаете, что такое база данных, и что различных систем управления базой данных (СУБД) очень много (Postgres, ClickHouse, MySQL и т.д.). Вы готовы работать с SQL, так как в курсе очень много будет связано именно с БД.
- Знания Python обязательно - вы знакомы с типами данных, функциями. Знаете про библиотеки - панды ваши друзья. Желательно знать какую-либо IDE (PyCharm, VSCode), но не обязательно.
- Процессор: Intel Core i5 8400 Coffee Lake или лучше (в реальности достаточно и i3)
- Память: 8 ГБ оперативной памяти (в реальности достаточно и 4-5ГБ)
- Хранение: 20 ГБ SSD/HDD (в реальности не менее 10ГБ)
Спойлер: Программа курса
Введение
- Об Apache Superset, авторе, курсе
- Готовые инструкции
- Сразу дашборд
- Датасет
- Чарт
- Дашборд
- CSS элементов дашборда
- CSS Templates
- JSON metadata дашборда
- Jinja Templates. Активация
- Jinja Templates. Переменные
- Jinja Templates. Циклы
- Jinja Templates. Фильтры
- Jinja Templates. Ветвления
- Jinja Templates. Макросы
- Jinja Templates. Проброс фильтра в виртуальный датасет
- Jinja Templates. Фильтр по дате. Пользовательский ввод
- Jinja Templates. Собственный макрос. Логирование в stdout
- Handlebars
- Jinja + Handlebars. Column Level Security (CLS)
- Annotation Layers
- Итоговый тест
- Структура контейнера. Тома. БЭКАП!
- Ломаем. Сила Бэкапа!
- Открываем доступ. Изучаем внутренности. Пулы соединений
- Environment (переменные окружения)
- Command (команды, выполняемые во время установки)
- Контейнер superset_init, superset cli
- Правим ошибки, особенности SECRET_KEY, смены пароля admin
- Открываем доступ, изучаем назначение
- Кратко о celery, Superset_worker_beat, Superset_worker
- AlertS & Reports
- Прогрев кэша, танцы с Celery
- Swagger, удаляем Celery
- Скрипт API, CSRF, JWT (аутентификация)
- Скрипт API, прогрев кэша
- Пагинация
- Пишем чистильщик мусора
- Структура модели RBAC
- Создаем бизнесмена
- Permissions
- Статус дашборда в RBAC. Области видимости
- DASHBOARD_RBAC
- RLS
- Фильтры по горизонтали
- Система тэгов
- Кастомная страница аутентификации
- Перенаправление после аутентификации
- Введение, Flask-babel, translator
- Messages.json, po2json, fuzzy
- Виртуальное окружение, polib, свой скрипт
- Fuzzy - будь осторожен(на)
- Танго с бабелью
- Кратко о ClickHouse + установка
- Делаем коннект + чарт на данных из ClickHouse
- Общение Superset с БД + потребление ресурсов
- Данные готовятся на стороне БД!
- Кратко о KeyCloak + установка
- Настройка KeyCloak
- Настройка Superset
- Аутентифицируемся
- Немного под капот (сложно, не обязательно)
- Заключение
Скрытая ссылка