使用维基百科表重命名文件

时间:2013-03-24 11:56:54

标签: wikipedia

我想制作一个给出系列名称的程序,将我的文件重命名为维基百科的剧集名称。我可能会将剧集列表添加到表格或某些数据结构并重命名文件。可以这样做,如果是这样,我怎样才能获得维基百科的剧集列表? 感谢

2 个答案:

答案 0 :(得分:3)

如果您想获取维基百科文章的文字,可以使用the API

例如,要获取文章HTML(用XML括起来),您可以使用以下请求:

http://en.wikipedia.org/w/api.php?format=xml&action=parse&page=List%20of%20Breaking%20Bad%20episodes

如果您更喜欢使用wikitext而不是HTML,则查询类似于:

http://en.wikipedia.org/w/api.php?format=xml&action=query&titles=List%20of%20Breaking%20Bad%20episodes&prop=revisions&rvprop=content

答案 1 :(得分:0)

从维基百科中检索数据是非常容易的。我会去使用python 使用urllib2requestsmechanize检索网页。您最喜欢的编程语言可能有类似的功能。使用BeautifulSoup分析检索到的页面并使用它来检索名称。

更难的是将本地文件名映射到该表,除非您的原始文件已经有类似S1E7的内容,您不知道从您创建的表中选择哪个剧集名称。