如何确定2个页面是相同主题但是使用不同语言?

时间:2015-02-07 18:31:49

标签: wikipedia-api

我根据其pageid(或网址)导入Wiki页面。

我们说我已经导入了一个页面,并且我已经存储了其中的语言(即EN)。

如果我要导入上述EN版本的翻译页面,只接收一个新的pageid(或url),我如何在两者之间进行链接,以便我可以将它们存储在同一主题下的数据库中id(但有两种不同的语言)?

当然使用MediaWiki API。

1 个答案:

答案 0 :(得分:0)

您可以通过langlinks检查它们是否已连接。例如,langlinks的爱因斯坦页面结果: 按标题:https://en.wikipedia.org/w/api.php?action=query&titles=Albert%20Einstein&prop=langlinks 通过pageid:https://en.wikipedia.org/w/api.php?action=query&pageids=736&prop=langlinks 但必须记住,不同的语言页面不是翻译,内容在同一主题上可能不同,它们不是en.wikipedia的直接翻译。