Используйте Python для получения URL-адресов результатов поиска Baidu

Question

Используйте Python для получения URL-адресов результатов поиска Baidu

Я пытаюсь получить результаты поиска от Baidu. Но теперь я застрял здесь:

import sys
import urllib
import urllib2
from bs4 import BeautifulSoup
question_word = "Hello"
url = "http://www.baidu.com/s?wd=" +     urllib.quote(question_word.decode(sys.stdin.encoding).encode('gbk'))
htmlpage = urllib2.urlopen(url).read()
soup = BeautifulSoup(htmlpage)
for child in soup.findAll("h3", {"class": "t"}):
    print child.contents[0]

Это вернет все теги, имеющие целевые URL-адреса. Я не знаю, как пользоваться .get ('href'), чтобы перечислить фактические URL-адреса

Я новичок в Python, поэтому у меня могут быть некоторые путаницы в основных понятиях.. Я буду очень признателен за помощь.

Спасибо!

1 3

python html urllib beautifulsoup

1 ответ:

宏杰李 · Accepted Answer · 2017-03-13 07:57:58

for child in soup.findAll("h3", {"class": "t"}):
    print child.a.get('href')
Используйте ., чтобы получить следующий тег a в теге h3, затем вы можете использовать .get()