Складчина: [Питер] Парсинг с помощью Python. Веб-скрапинг в действии. 3-е межд. изд. [Райан Митчелл]
Парсинг с помощью Python. Веб-скрапинг в действии Если программирование — магия, то веб-скрапинг — настоящее колдовство. Написав простую автоматизированную программу, можно отправлять запросы веб-серверам, получать ответы с данными, а затем анализировать эти данные и извлекать необходимую информацию.
Это обновленное третье издание книги не только познакомит вас с веб-скрапингом, но и послужит исчерпывающим руководством по сбору практически любых видов данных в современном Интернете. В части I основное внимание уделено механике веб-скрапинга: как с помощью Python отправлять запросы веб-серверам, обрабатывать ответы и автоматизировать взаимодействие с сайтами. В части II исследуются более конкретные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.
Книга покажет, как:
Тема: Бестселлеры O'Reilly
Год: 2025
Страниц: 352
ISBN: 978-601-08-4570-1
Формат: Скан PDF
Стоимость: 1971
Парсинг с помощью Python. Веб-скрапинг в действии Если программирование — магия, то веб-скрапинг — настоящее колдовство. Написав простую автоматизированную программу, можно отправлять запросы веб-серверам, получать ответы с данными, а затем анализировать эти данные и извлекать необходимую информацию.
Это обновленное третье издание книги не только познакомит вас с веб-скрапингом, но и послужит исчерпывающим руководством по сбору практически любых видов данных в современном Интернете. В части I основное внимание уделено механике веб-скрапинга: как с помощью Python отправлять запросы веб-серверам, обрабатывать ответы и автоматизировать взаимодействие с сайтами. В части II исследуются более конкретные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.
Книга покажет, как:
- анализировать сложные HTML-страницы;
- разрабатывать веб-сканеры с помощью фреймворка Scrapy;
- хранить данные, полученные с помощью скрапинга;
- читать и извлекать данные из документов;
- очищать и нормализовывать плохо отформатированные данные;
- читать и записывать информацию на естественных языках;
- выполнять поиск по формам и страницам входа;
- выполнять скрапинг JavaScript-кода и работать с API;
- писать и использовать программы для преобразования изображений в текст;
- обходить противоскрапинговые ловушки и блокаторы ботов;
- тестировать свои веб-сайты с помощью скрапинга.
Тема: Бестселлеры O'Reilly
Год: 2025
Страниц: 352
ISBN: 978-601-08-4570-1
Формат: Скан PDF
Стоимость: 1971
Для просмотра скрытого содержимого необходимо Войти или Зарегистрироваться.