Data Internals X 2025. Профессиональная конференция по инженерии данных [Онтико]

Bot

Администратор
Команда форума
23 Янв 2020
189,502
3,069
113
163946.jpg

Открытие конференции
Выжимаем максимум из Clickhouse для BI-отчетности с ограниченным бюджетом
Михаил Кацуба (Lenta Tech)

Векторный поиск в YDB: опыт выбора и реализации
Александр Зевайкин (YDB)

Citus изнутри: как устроен шардинг
Александр Календарев ( Независимый докладчик)

Как мы решардим петабайтные кликхаузы в MyTracker: удаляй и властвуй
Алексей Захожий (VK)

Технология многоуровневого инкрементального резервирования и ее интеграция с ядром СУБД
Дмитрий Еманов (Firebird Project)

DuckDB для работы с графами: форматы хранения графа в S3, расширение GraphAr и опыт разработки
Максим Маевский (Т-Банк)

Вы строите Lakehouse, а сторадж строит вам проблемы
Дмитрий Листвин (Авито)

Круглый стол – открытый микрофон «Как вырастить специалиста по базам данных?»
Константин Ратвин (МФТИ), Руслан Савченко (Яндекс), Николай Ижиков (СберТех), Станислав Моисеев (Т-Банк), Сергей Петренко (VK Tech, Tarantool)

Managed Sharded PostgreSQL Service в Яндекс Облаке
Андрей Бородин (Yandex Cloud)

Балансировка по нагрузке в динтаблицах YTsaurus
Александра Латышева (Яндекс)

Круглый стол «Платформа данных: баланс практичности и развития»
Петр Гуринов (Лемана Тех), Олег Бондарь (Яндекс ), Сергей Михалев (Т-Банк)

Ревью без боли: DataOps-подход к управлению изменениями в DWH
Артемий Наумов (Лемана Тех)

Streaming и batch в единой платформе. Взболтать, но не смешивать!
Владимир Верстов (Яндекс Go)

Все еще ходите за метриками в BI? Как мы экспериментировали с LLM и не пRAGадали
Сергей Волков (Сбер)

Рецепты приготовления AI-ready-контента в BI
Евгений Семенюк (Сбер)

Data Governance в финтехе: конкурентное преимущество в эпоху AI
Александр Бояркин (Альфа-Банк)

Python вместо ручек. Как мы автоматизировали проставление атрибутов сущностей в дата-каталоге
Марина Суслова (hh.ru)

Работа над качеством данных — вершина айcберга или дно впадины?
Ирина Шахтарина (Сбер)

От Pydantic v1 к v3: глубокий разбор Pydantic Core на Rust и алгоритмов валидаторов
Арсений Савин (Effective)

WeSQL: облачная СУБД на базе MySQL
Алексей Копытов (MyDB)

Гибкая настройка параметров запуска Spark-приложений
Евгений Милин (Сбер)

Простой Python, автоматический Spark: минус Kubernetes, плюс продуктивность
Юрий Орлов (VK, VK Cloud)

Data Quality как distributed-система: паттерны отказоустойчивости для данных
Александр Бергер (Wildberries & Russ)

Доставка данных для ML в Kubernetes: от S3 до распределенных проектных хранилищ
Константин Дорошенко (Т-Банк, Отдел технологий искусственного интеллекта)

Многопоточное и/или консистентное чтение из реляционных источников данных в федеративных системах
Виталий Исаев (Яндекс)

От события до дашборда в облаках: практика по созданию потоковой платформы на Kubernetes
Сергей Емельянов (VK Tech)

Дата-контракты — как создать продукт с нуля, изменив мышление всей компании
Анна Мавлютова (Т-Банк)

Как подготовить платформу данных к миграции уже сейчас?
Владислав Заболоцкий (Райффайзен Банк)

Оптимальное вычисление выражений в аналитических запросах с использованием SIMD и JIT
Алексей Лукьянчиков (Яндекс)

CSI-драйверы: подводные камни и архитектурные решения
Константин Неумоин (Флант)

Airflow еще доступнее: опыт self-service-оркестрации в Lemana Tech
Михаил Зотов (Лемана Тех)

DataRentgen: чем плох lineage в OSS DataCatalog, и как сделать лучше
Максим Мартынов (МТС Web Services (MWS))

Балансировка данных на кластерах OpenSearch: покоординатный спуск
Дмитрий Потапов (Yandex Cloud)