我想将XML中的Wikipedia数据库转换转换为纯文本格式。所以我在这个页面http://attardi.github.io/wikiextractor/中使用了WikiExtractor函数。但是,当我在终端上运行命令行时: WikiExtractor.py enwiki20160113pagesarticles.xml 但是,警告信息如“"警告:圣地亚哥州旧城区历史公园'旧城区的模板错误”。 (1158971):title(0)递归(116,0,0)"每10秒出现一次。你能告诉我这个消息是什么意思吗?这些警告信息是否严重? 非常感谢 !
答案 0 :(得分:0)
在wikiextractor github中,有人报告了类似的问题......答案是:“由于格式错误的模板,警告是正常的。”查看更多详情:https://github.com/attardi/wikiextractor/issues/33