导入维基百科 - 获取不同语言的匹配文章

时间:2012-10-23 19:30:46

标签: mediawiki wikipedia

我导入了两种语言,英语和马耳他语的维基百科数据库转储(pages-articles.xml版本)。

但是,我需要能够将文章从一种语言链接到另一种语言。我的印象是我必须为此导入其他表。我需要导入哪些表格?

提前致谢!

马耳他数据库转储存储库:http://dumps.wikimedia.org/mtwiki/20121012/

英语db dump repository:http://dumps.wikimedia.org/enwiki/20121001/

2 个答案:

答案 0 :(得分:4)

该信息位于the langlinks table,因此您需要下载langlinks.sql.gz,这是一个SQL转储,而不是XML。

一个可能的问题是这些链接可能不是对称的,因此例如en:A可能会链接到mt:B,但mt:B会链接到en:C。你必须决定该怎么办。

答案 1 :(得分:0)

如果我理解正确,你想创建一个英文维基和马耳他维基,并让它们相互链接。

为此,您需要将“en”和“mt”的中介语前缀添加到interwiki表中。以下是对它的描述:

https://www.mediawiki.org/wiki/Interwiki_link

您应该从文章中删除指向所有其他语言的链接。否则他们会在很多文章的底部显示为垃圾。

P.S。:很高兴听到您正在使用马耳他语!我真的很喜欢它:)