有没有一种方法可以解析Wiki对话页面?

时间:2020-04-17 08:39:03

标签: mediawiki wikipedia wikipedia-api mediawiki-api

我当时想提取编辑者在Wikipedia讨论页面上发表的评论,以及编辑者的姓名和时间戳(例如https://en.wikipedia.org/wiki/Talk:Coronavirus)。有没有任何有意义的方法可以做到这一点?可以在保留树结构的同时提取注释,即注释是否响应其他注释。

谢谢!

1 个答案:

答案 0 :(得分:2)

仅约。有一些工具可以尝试使用它,例如python-mwchatter,但是通常它是自由格式的Wikitext,因此没有可靠的方法可以从中提取结构。