DBpedia Spotlight的参数是什么意思?

时间:2018-03-23 11:13:03

标签: ontology dbpedia linked-data spotlight-dbpedia

我对使用DBpedia Spotlight感兴趣。但是,我们需要在两个参数置信度支持中插入一个值。这两个参数究竟意味着什么?

我想在文中找出重要的,突出的n-gram。在这种情况下,通常建议的信心和支持参数经验法则)是什么?

1 个答案:

答案 0 :(得分:4)

当您要求 DBpedia Spotlight 注释文本(查找实体/主题)时,它会搜索在DBpedia上具有URI的n-gram(n-gram是维基百科标题)。那些n-gram称为DBpedia资源。

支持:这是资源突显参数,它可以帮助您忽略不重要或无法提供信息的资源。当您为其设置值X时,这意味着具有多个小于X 的维基百科内链接的资源将被忽​​略,并且不会返回给您。

信心:这是消歧信心参数,它是一个阈值,它取0到1之间的值。当你为它设置一个高值时,你得到更好,更值得信赖的注释,但你冒着失去一些正确的的风险。

选择那些(或任何其他)参数的值取决于您的使用案例。

<强>示例:

  • 如果您对您感兴趣的n-gram类型有一些测试集或金标准,您可以调整您的选择,直到您的黄金标准达到足够好的结果。

  • 如果您只关心检索前n个n-gram以推断文本主题,您可以选择较高的值来调整参数,以获得少量(大多数)正确的n-gram并按置信度对它们进行排序。

  • 如果你想获得尽可能多的n-gram,你的任务不会受到错误的影响或偏见,你可以设置较低的值。