Запрос страницы данных Википедии
У меня проблемы с пониманием API Википедии.
У меня есть изолированная Ссылка, обработав json, который я получил в качестве ответа после отправки запроса http://en.wikipedia.org/w/api.php
Предполагая, что я получил следующую ссылку , как я могу получить доступ к такой информации, как дата рождения и т. д.
Я использую python. Я попытался сделать
import urllib2,simplejson
search_req = urllib2.Request(direct_url_to_required_wikipedia_page)
response = urllib2.urlopen(search_req)
Я пробовал читать api. Но, я не могу понять, как извлечь данные из конкретных страницы.
3 ответа:
Попробуйте:
import urllib import urllib2 import simplejson url = 'http://en.wikipedia.org/w/api.php' values = {'action' : 'query', 'prop' : 'revisions', 'titles' : 'Jennifer_Aniston', 'rvprop' : 'content', 'format' : 'json'} data = urllib.urlencode(values) req = urllib2.Request(url, data) response = urllib2.urlopen(req) json = response.read()
Переменная json-это json страницы Википедии. Теперь вы можете разобрать его с помощью simplejson или чего-то еще...
Перейдите в MediaWiki API. Он лучше организован и дружелюбен для людей : -).
Такую информацию, как дата рождения, вы не получите из API, по крайней мере напрямую. Лучшее, что вы можете сделать, это получить код страницы (или визуализированный HTML) и проанализировать его, чтобы получить необходимую информацию.
В качестве альтернативы вы можете посмотреть наDBpedia .