Обучение программированию онлайн

Python в веб-выскабливание ошибку - ошибку TypeError: не удается использовать шаблон строки в байтах-как объект

Я хочу построить скребок для паутины. В настоящее время я изучаю Python. Это самые основы! Код Python import urllib.request import re htmlfile = urllib.request.urlopen("http://basketball.realgm.com/") htmltext = htmlfile.read() title = re.findall('<title>(.*)</title>', htmltext) print (htmlt...

2

4

python-3.x web-scraping scraper

Python-Scrapy не может извлечь данные

Я только начинаю с Python / Scrapy. У меня есть написанный паук, который ползает по веб-сайту и собирает информацию. Но я застрял в двух местах. Я пытаюсь извлечь телефонные номера со страницы, и они закодированы следующим образом <span class="mrgn_right5">(+001) 44 42676000,</span> <span...

1

2

python scrapy scraper

скрести сайты с бесконечной прокруткой

Я написал много скребков, но я не совсем уверен, как обращаться с бесконечными скроллерами. В наши дни большинство веб-сайтов и т. д., Facebook, Pinterest имеют бесконечные скроллеры....

3

26

python scraper screen-scraping

XPath:: получить следующий брат

У меня есть следующая структура HTML: я пытаюсь построить надежный метод для извлечения второго элемента color digest, так как в DOM будет много этих тегов. <table> <tbody> <tr bgcolor="#AAAAAA"> <tr> <tr> <tr> <tr> <td>Color Digest ...

3

53

html xpath siblings scraper