Расширенная аналитика с PySpark [Коллектив авторов]

Bot

Администратор
Команда форума
23 Янв 2020
208,808
3,150
113
upload_2023-1-28_7-52-28.png

Книга посвящена практическим методам анализа больших объемов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных, показаны основы обработки данных в PySpark и Python на примере очистки данных, подробно освещается машинное обучение с помощью Spark. Книга поможет читателю понять, как устроен и работает весь конвейер PySpark для комплексной аналитики больших наборов данных: от создания и оценки моделей до очистки, предварительной обработки и исследования данных с особым акцентом на производственные приложения. Отдельные главы посвящены обработке изображений и библиотеке Spark NLP.

Для специалистов по обработке данных и машинному обучению

bhv.ru/product/rasshirennaya-analitika-s-pyspark/