Kategorie

Парсинг с помощью Python. Веб-скрапинг в действии

  • Автор: Митчелл Р.

  • Переплет: мягкий
  • Страниц: 352
  • Формат: 24x17x2 см
  • Вес: 550 г
  • ISBN: 978-601-08-4570-1
  • Серия: Бестселлеры O`Reilly

  • Бумага: офсетная
  • Иллюстрации: ч/б иллюстрации
  • Год издания: 2025
  • Язык издания: русский
  • Возрастные ограничения: 12+

44467333

Dostupnost: odeslání do 9-13 pracovních dnů

1 362 Kč

Парсинг с помощью Python. Веб-скрапинг в действии Если программирование — магия, то веб-скрапинг — настоящее колдовство. Написав простую автоматизированную программу, можно отправлять запросы веб-серверам, получать ответы с данными, а затем анализировать эти данные и извлекать необходимую информацию. Это обновленное третье издание книги не только познакомит вас с веб-скрапингом, но и послужит исчерпывающим руководством по сбору практически любых видов данных в современном Интернете. В части I основное внимание уделено механике веб-скрапинга: как с помощью Python отправлять запросы веб-серверам, обрабатывать ответы и автоматизировать взаимодействие с сайтами. В части II исследуются более конкретные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга. Книга покажет, как: • анализировать сложные HTML-страницы, • разрабатывать веб-сканеры с помощью фреймворка Scrapy, • хранить данные, полученные с помощью скрапинга, • читать и извлекать данные из документов, • очищать и нормализовывать плохо отформатированные данные, • читать и записывать информацию на естественных языках, • выполнять поиск по формам и страницам входа, • выполнять скрапинг JavaScript-кода и работать с API, • писать и использовать программы для преобразования изображений в текст, • обходить противоскрапинговые ловушки и блокаторы ботов, • тестировать свои веб-сайты с помощью скрапинга.