Используйте Python для получения URL-адресов результатов поиска Baidu
Я пытаюсь получить результаты поиска от Baidu. Но теперь я застрял здесь:
import sys
import urllib
import urllib2
from bs4 import BeautifulSoup
question_word = "Hello"
url = "http://www.baidu.com/s?wd=" + urllib.quote(question_word.decode(sys.stdin.encoding).encode('gbk'))
htmlpage = urllib2.urlopen(url).read()
soup = BeautifulSoup(htmlpage)
for child in soup.findAll("h3", {"class": "t"}):
print child.contents[0]
Это вернет все теги, имеющие целевые URL-адреса. Я не знаю, как пользоваться .get ('href'), чтобы перечислить фактические URL-адреса
Я новичок в Python, поэтому у меня могут быть некоторые путаницы в основных понятиях.. Я буду очень признателен за помощь.
Спасибо!