Запрос страницы данных Википедии


У меня проблемы с пониманием API Википедии.

У меня есть изолированная Ссылка, обработав json, который я получил в качестве ответа после отправки запроса http://en.wikipedia.org/w/api.php

Предполагая, что я получил следующую ссылку , как я могу получить доступ к такой информации, как дата рождения и т. д.

Я использую python. Я попытался сделать

import urllib2,simplejson
search_req = urllib2.Request(direct_url_to_required_wikipedia_page)
response = urllib2.urlopen(search_req)

Я пробовал читать api. Но, я не могу понять, как извлечь данные из конкретных страницы.

3 3

3 ответа:

Попробуйте:

import urllib
import urllib2
import simplejson

url = 'http://en.wikipedia.org/w/api.php'
values = {'action' : 'query',
          'prop' : 'revisions',
          'titles' : 'Jennifer_Aniston',
          'rvprop' : 'content',
          'format' : 'json'}

data = urllib.urlencode(values)
req = urllib2.Request(url, data)
response = urllib2.urlopen(req)
json = response.read()

Переменная json-это json страницы Википедии. Теперь вы можете разобрать его с помощью simplejson или чего-то еще...

Перейдите в MediaWiki API. Он лучше организован и дружелюбен для людей : -).

Такую информацию, как дата рождения, вы не получите из API, по крайней мере напрямую. Лучшее, что вы можете сделать, это получить код страницы (или визуализированный HTML) и проанализировать его, чтобы получить необходимую информацию.

В качестве альтернативы вы можете посмотреть наDBpedia .