Что такое питон.метод get () работает в этом сценарии?

Я просматривал учебник по соскабливанию данных списка с веб-страницы, и у нас есть красивый объект Soup с именем "суп", я должен найти все элементы из "супа", такие что они находятся в таблице, а элемент находится в некотором классе, поэтому они сдел …

Получить href текст ссылки, которая имеет определенный атрибут класса с помощью BeautifulSoup в Python

Как я могу получить только текст из href в теге привязки, который соответствует классу. Так что если у меня есть <a href="Link_I_Need.html" class="Unique_Class_Name">link text</a> Как я могу получить строку Link_I_Need.html из только …

Невозможно импортировать beautifulsoup в python

Я использую Python.7.10 и установили beautifulsoup с помощью pip. Пакет был успешно установлен. Но когда я пытаюсь импортировать beautifulsoup, я получаю эту ошибку: ImportError: No module named beautifulsoup Я проверил список установленных модул …

Красивый суп 4 CSS селектор не работает так же, как учебник показать

Я запускаю пример CSS селектора коды из [Beautiful Soup 4 tutorial page][1], но результаты разные, некоторые дают правильный результат, некоторые нет. На веб-сайте они говорят, что он должен работать так же, как и в Python 2.7 и 3. У меня есть Pytho …

Как анализировать XML в Python и LXML?

Вот мой проект: я строю графики погодных данных из WeatherBug с помощью RRDTool. Мне нужен простой и эффективный способ загрузки данных о погоде из WeatherBug. Я использовал ужасно неэффективный bash-script-скребок, но перешел на BeautifulSoup. Произ …

Используйте Python для получения URL-адресов результатов поиска Baidu

Я пытаюсь получить результаты поиска от Baidu. Но теперь я застрял здесь: import sys import urllib import urllib2 from bs4 import BeautifulSoup question_word = "Hello" url = "http://www.baidu.com/s?wd=" + urllib.quote(question_word.decode(sys.s …

Как очистить Instagram с BeautifulSoup

Я хочу соскрести фотографии с публичного аккаунта Instagram. Я довольно хорошо знаком с bs4, поэтому я начал с этого. Используя инспектор элементов в Chrome, я заметил, что картинки находятся в неупорядоченном списке, а у Ли есть класс "Фото", поэтом …

Включить несколько имен классов в findAll в BeautifulSoup4 [дубликат]

На этот вопрос уже есть ответ здесь: BeautifulSoup findAll () задано несколько классов? 3 ответа У меня есть строка кода в скрипте python, как показано ниже …

Удалить теги из разбираемого красивого супового списка?

В данный момент я попадаю в цикл for со всеми строками, которые я хочу: page = urllib2.urlopen(pageurl) soup = BeautifulSoup(page) tables = soup.find("td", "bodyTd") for row in tables.findAll('tr'): На данный момент у меня есть моя информация, но …

Конкретные наскрести результат в НХЛ с помощью Python-Beautifulsoup

Я пытаюсь наскрести только общий счет для определенной команды. Я написал следующее: import urllib.request import re from bs4 import BeautifulSoup #url1 = "http://scores.nbcsports.com/nhl/scoreboard.asp" ## This works, however is using a set day …