[ДМК] Apache Airflow и конвейеры обработки данных [Харенслак Б., де Руйтер Дж.]

Bot

Администратор
Команда форума
23 Янв 2020
190,431
3,071
113
Apache Airflow и конвейеры обработки данных
978-5-97060-970-5_270_369_jpg__100.jpg


Издание: Черно-белое
Оригинальное название: "Data Pipelines with Apache Airflow"

Оригинальный правообладатель: Manning
Автор: Харенслак Б., де Руйтер Дж.
Дата выхода: ноябрь 2021 года
Формат: 165 * 235 мм
Бумага: офсетная
Обложка: Твердый переплет
Объем, стр.: 502
ISBN: 978-5-97060-970-5
Вес: 1000
pdf от издателя

Конвейеры обработки данных управляют потоком данных с момента их первоначального сбора до консолидации, очистки, анализа, визуализации и многого другого. Apache Airflow предоставляет единую платформу, которую можно использовать для проектирования, реализации, мониторинга и обслуживания конвейеров. Простота пользовательского интерфейса, возможности plug-and-play и гибкие сценарии Python оптимизируют решение любых задач, касающихся управления данными.
Эта книга научит вас создавать и сопровождать эффективные конвейеры обработки данных. Вы изучите наиболее распространен-ные модели их использования, особенности ориентированных ациклических графов (ОАГ), которые обеспечивают работу Airflow, а также способы их настройки в соответствии с потребностями вашего конвейера.

Издание предназначено для специалистов по DevOps, обработке и хранению данных, машинному обучению, а также системных администраторов с навыками программирования на Python.

dmkpress.com/catalog/computer/data/978-5-97060-970-5/