Автор: Холден Карау, Энди Конвински
Название: Изучаем Spark. Молниеносный анализ данных
Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. С помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala.
Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.
Книга поможет Вам:
Узнать, как развертывать интерактивные, пакетные и потоковые приложения;
Вы исследуете возможности использования разных источников данных, включая HDFS, Hive, JSON и S3;
Вы овладеете продвинутыми приемами программирования на основе Spark, такими как разделение данных на разделы и применение совместно используемых переменных.
Подробнее:
Ска http://www.ozon.ru/context/detail/id/33061124/ чать:
Название: Изучаем Spark. Молниеносный анализ данных
Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. С помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala.
Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.
Книга поможет Вам:
Узнать, как развертывать интерактивные, пакетные и потоковые приложения;
Вы исследуете возможности использования разных источников данных, включая HDFS, Hive, JSON и S3;
Вы овладеете продвинутыми приемами программирования на основе Spark, такими как разделение данных на разделы и применение совместно используемых переменных.
Подробнее:
Ска http://www.ozon.ru/context/detail/id/33061124/ чать:
Скрытое содержимое могут видеть только пользователь группы : Администратор