SmartData 2024. Конференция по инженерии данных [Тариф Online] [JUG Ru Group]

Admin

Администратор
Команда форума
22 Фев 2018
59,647
17,719
113
4 сентября. Online
Открытие конференции SmartData 2024. Программный комитет SmartData
Airbyte. 2 года в продакшене. Александра Попова
Использование вероятностных структур данных для оптимизации ETL-процессов. Дмитрий Вертлиб
Assessing Data Pipeline Quality & Sanity with Data Angiograms. Sri Vishnu Chanderraju. EN
Schema Registry: Ultimate Guide. Тимофей Брунько
Проблемы обработки Excel-файлов в Apache NiFi и как их решать. Игорь Шемаров
От хайпа до продакшена: data mesh на Airflow + dbt. Никита Юрасов
Как построить пайплайн RAG с использованием LLamaIndex. Алсу Нурутдинова
Компания ositive Technologies
Как быстро запустить процесс ведения каталога данных в компании на примере DataHub. Наталья Журавлева
Шардированный не значит распределенный: что важно знать, когда Postgres мало. Евгений Иванов
Сервисы ML Inference нейросетей в Рекламе. Дмитрий Ульянин
Оптимизация распределения партиций в последовательности задач распределенной обработки данных. Милена Булкина
Debezium Engine: практическое руководство по использованию. Анастасия Сашина
Подведение итогов онлайн-части конференции SmartData 2024. Программный комитет SmartData
8 сентября.Offline + online
Открытие офлайн-части конференции SmartData 2024. Программный комитет SmartData
Как мы сократили TTM создания дашбордов. Анар Багиров
Пишем свой cluster manager для Apache Spark. Александр Токарев
Разделяй, властвуй и замораживай: построение DWH с использованием Iceberg REST Catalog. Валентин Пановский
Как работает Apache Iceberg на примере Trino. Владимир Озеров
Как мы Apache Kafka на Redpanda меняли. Роман Ананьев
Data Vault 2.0. В каких случаях внедрять, разбор основных проблем применения методологии при построении DWH на Greenplum. Денис Лукьянов
dbt в деле: реальные кейсы и лайфхаки. Антон Александров
Инструменты Data Quality: как, зачем, почему. Опыт Т-Банка. Дмитрий Руднев
Data sketches — быстро, дешево и (почти) точно! Сергей Жемжицкий
Как мы делаем облачный Greenplum. Леонид Борчук
Data mesh: ожидания vs реальность. Петр Гуринов
Введение в Velox — универсальный нативный движок исполнения запросов. Павел Солодовников
Data Lineage: как настроить в зоопарке технологий и зачем это нужно. Булат Усманов
Каждый байт на вес золота. Опыт построения DMP в рекламе Яндекса. Алексей Стыценко
Нетворкинг и афтерпати

9 сентября.Offline + online
Apache Arrow: быстрее, ниже, сложнее. Евгений Глотов
NiFi. Пишем код для codeless-системы. Бронислав Житников
Как мы тестировали 5 способов загрузки данных в Greenplum и что из этого вышло. Татьяна Дидова
Как мы строим систему распределенного трейсинга, в которой можно терять данные. Игорь Балюк
One More Way to Make Backup in Ignite. Николай Ижиков
От ручного труда к автоматической генерации проверок качества данных. Александр Мадумаров
Оркестратор пайплайнов для небольшой команды инженеров и аналитиков: как мы используем Dagster. Алексей Завальский
Обработка событий в Snowplow: от сбора до аналитики. Мария Бученкова
Как навести порядок в двух эксабайтах данных? Максим Гудзикевич
CI/CD для большого хранилища данных. Арсений Бирюков
Это реальный космос: space-индустрия сегодня. Яна Харлан
Закрытие конференции SmartData 2024 Анна Сакар Компания:JUG Ru Group

Скоро добавим еще больше докладов
Мы активно дополняем программу. Подписывайтесь на нашу рассылку, чтобы быть в курсе.