Складчина: ClickHouse: эффективная работа с большими данными [karpov.courses] [Ярослав Шумиченко, Трофим Воробьев]
Главная задача курса — дать практические навыки для работы с Clickhouse: от написания эффективных запросов до создания производительных аналитических решений
Полученные навыки помогут вам не только решать задачи быстрее, но и стать экспертом в одном из самых востребованных инструментов на рынке
Кому подойдёт этот курс:
- Начинающим специалистам
Только начинаете свою карьеру в аналитике или разработке данных?
Курс поможет вам понять, как эффективно работать с ClickHouse, оптимизировать запросы и разрабатывать структуры данных, что сделает вас более уверенными на собеседованиях и в решении реальных задач - Аналитикам
Хотите стать более независимыми и углубить свои технические навыки?
Освоив ClickHouse, вы сможете самостоятельно строить сложные запросы, анализировать большие объемы данных и рассчитывать метрики в разы быстрее
- Дата саентистам
Ищете способы ускорить работу с данными?
Знание ClickHouse поможет вам быстро готовить данные для моделей и оптимизировать ваши эксперименты, экономя время на предобработке - Дата инженерам
Работаете с обработкой данных и созданием пайплайнов?
Курс научит вас ускорять ETL-процессы, выбирать правильные движки таблиц для задач и строить высокопроизводительные решения
1. Оптимизировать запросы для максимальной скорости
Научитесь строить эффективные запросы, использовать индексы и профилировать выполнение, что позволит анализировать данные в разы быстрее даже на больших объемах.
2. Работать с большими объёмами данных
Освоите методы работы с массивами, JSON и сложными структурами, чтобы решать задачи любой сложности и быть готовыми к реальным проектам.
3. Выбирать подходящие движки таблиц
Разберётесь, как пользоваться различными движками таблиц ClickHouse, чтобы минимизировать ресурсы и повысить производительность своих систем.
4. Использовать словари для ускорения аналитики
После обучения сможете подключать внешние базы данных через словари ClickHouse, что позволит сократить время на обработку справочной информации.
5. Автоматизировать и масштабировать работу
Освоите создание распределённых таблиц и других инструментов масштабирования, чтобы быть готовыми к работе с большими и распределёнными системами данных.
6. Тонкая настройка ClickHouse для сложных систем
Научитесь настраивать конфигурацию сервера, управлять ресурсами, контролировать потребление памяти и потоков даже под высокой нагрузкой.
Разберётесь, как использовать материализованные представления для автоматизации сложных расчётов.
Программа
Модуль 1. CLICKHOUSE: основы и аналитическая практика
Тема 1. Введение в ClickHouse
Что такое OLAP и OLTP, отличие колоночных СУБД и зачем нужен ClickHouse
Тема 2. Синтаксис запросов
Работа с выборками, JOIN, агрегатами и аналитическими функциями
Тема 3. Типы данных и функции
Числовые, строковые, временные типы и массивы, работа с JSON
Тема 4. Объекты архитектуры
Системные таблицы, представления, словари и пользовательские функции
Тема 5. Табличные движки
MergeTree, индексы, ReplacingMergeTree, Memory и интеграция с внешними источниками
Модуль 2. CLICKHOUSE: производительность и архитектура в продакшене
Тема 6. Масштабирование и распределение
Партиционирование, шардирование и репликация для устойчивых кластеров
Тема 7. Загрузка и обновление данных
Мутации, пересоздание партиций и работа с обновлениями в кластере
Тема 8. Оптимизация запросов
Первичный ключ, PREWHERE, работа с JOIN, CTE и подзапросами
Тема 9. Оптимизация архитектуры
Анализ нагрузки, материализованные представления, проекции и управление ресурсами
Тема 10. Практический кейс
Построение производительной BI-системы на ClickHouse: от загрузки до оптимизации
Цена 47000 рублей
Скрытая ссылка