scraper

Я хочу построить скребок для паутины. В настоящее время я изучаю Python. Это самые основы! Код Python import urllib.request import re htmlfile = urllib.request.urlopen("http://basketball.realgm.com/") htmltext = htmlfile.read() title = re.findall('<title>(.*)</title>', htmltext) print (htmlt...

Я только начинаю с Python / Scrapy. У меня есть написанный паук, который ползает по веб-сайту и собирает информацию. Но я застрял в двух местах. Я пытаюсь извлечь телефонные номера со страницы, и они закодированы следующим образом <span class="mrgn_right5">(+001) 44 42676000,</span> <span...

Я написал много скребков, но я не совсем уверен, как обращаться с бесконечными скроллерами. В наши дни большинство веб-сайтов и т. д., Facebook, Pinterest имеют бесконечные скроллеры....

У меня есть следующая структура HTML: я пытаюсь построить надежный метод для извлечения второго элемента color digest, так как в DOM будет много этих тегов. <table> <tbody> <tr bgcolor="#AAAAAA"> <tr> <tr> <tr> <tr> <td>Color Digest ...