我想制作一个给出系列名称的程序,将我的文件重命名为维基百科的剧集名称。我可能会将剧集列表添加到表格或某些数据结构并重命名文件。可以这样做,如果是这样,我怎样才能获得维基百科的剧集列表? 感谢
答案 0 :(得分:3)
如果您想获取维基百科文章的文字,可以使用the API。
例如,要获取文章HTML(用XML括起来),您可以使用以下请求:
http://en.wikipedia.org/w/api.php?format=xml&action=parse&page=List%20of%20Breaking%20Bad%20episodes
如果您更喜欢使用wikitext而不是HTML,则查询类似于:
答案 1 :(得分:0)
从维基百科中检索数据是非常容易的。我会去使用python
使用urllib2
或requests或mechanize检索网页。您最喜欢的编程语言可能有类似的功能。使用BeautifulSoup分析检索到的页面并使用它来检索名称。
更难的是将本地文件名映射到该表,除非您的原始文件已经有类似S1E7的内容,您不知道从您创建的表中选择哪个剧集名称。