DBpedia信息提取框架

时间:2010-11-13 23:15:14

标签: php frameworks extraction text-extraction information-extraction

有没有人使用维基百科数据提取?我需要用它来工作。

您能否提供其他工具来提取网页上的信息?

谢谢!

1 个答案:

答案 0 :(得分:4)

当你说维基百科数据提取时,我假设你指的是software DBpedia用来将维基百科XML转储转换为DBpedia data dumps?您是否考虑过自己使用DBpedia转储?

从网页中提取信息的工具是一个非常广阔的空间。你想提取什么样的信息?它来自半结构化(例如表格),还是非结构化文本(例如散文)。您是否对页面标题和作者等元数据或命名实体等较低级别的概念感兴趣?

(我会在问题上留下这些澄清问题,但我的帐户级别不允许)