1
/
of
1
Питер Пресс
Современный скрапинг веб-сайтов с помощью Python. 2-е межд. издание
Современный скрапинг веб-сайтов с помощью Python. 2-е межд. издание
Regular price
$53.49 USD
Regular price
Sale price
$53.49 USD
Unit price
/
per
Couldn't load pickup availability
Product details
- Authors :
- Binding : Paperback
- Coverage : 650
- Ean : 9785446116393
- Format : 70x100/16
- Handling Time : 19 days
- Isbn : 978-5-4461-1639-3
- Pages : 592
- Publication Year : 2025
- Publisher :
- Series : Бестселлеры O'Reilly
Если программирование напоминает волшебство, то веб-скрапинг — это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете.В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.- Разбирайте сложные HTML-страницы.- Разрабатывайте поисковые роботы с помощью фреймворка Scrapy.- Изучайте методы хранения данных, полученных с помощью скрапинга.- Считывайте и извлекайте данные из документов.- Очищайте и нормализуйте плохо отформатированные данные.- Читайте и пишите информацию на естественных языках.- Освойте поиск по формам и логинам.- Изучите скрапинг JavaScript и работу с API.- Используйте и пишите программы для преобразования изображений в текст.- Учитесь обходить скрапинговые ловушки и блокаторы ботов.- Протестируйте собственный сайт с помощью скрапинга.
Share
Isbn:
978-5-4461-1639-3Ean:
9785446116393HandlingTime:
19 daysPublisher:
Питер ПрессBinding:
PaperbackPages:
592
NaN
/
of
-Infinity
Ordered
Aug 27
Order Ready
Sep 15
Delivered
Sep 17 - Sep 23