DBLP作者消歧

时间:2014-01-10 08:09:20

标签: rdf author disambiguation

伙计们,我正在研究DBLP,并使用Hugh Glaser的存储库,RKB-EXPLORER DBLP(rdf / xml)。 考虑dblp中的一篇文章的这一页:

http://dblp.rkbexplorer.com/id/journals/jvcir/YuanWSZ13

正如您所看到的,本文的作者ID是这样的:

http://dblp.rkbexplorer.com/id/people-b3f641eef09c498bdd94087b74854be9-36a6b8e7b69947e5659953aaf7fb802c

我尝试了不同文章的同一作者姓名,并且知道上面的id如下:

b3f641eef09c498bdd94087b74854be9:作者姓名的32个图表编码。(没关系) 36a6b8e7b69947e5659953aaf7fb802c:文章名称为32编码。

所以,它实际上为“同名”人提供相同的id,但很多人的名字完全相同。这是一种暧昧。 对于dblp作者的消歧,我尝试了以下两种方法:

  1. 获取每篇文章的从属关系,然后如果同一名称出现在两篇具有相同从属关系的文章中。我认为这可以肯定是同一个人。 但困难的是dblp.rkbelporer.com数据集没有提供足够的信息。并使用谷歌搜索来搜索文章标题,也无法获得足够的信息。
  2. 获取每篇文章的所有作者的图像,并执行类似个人图像匹配的操作以检查同名是否是同一个人。 但这也是某种不可行的,因为作者个人的文章形象太少了。
  3. 那么,有什么建议吗?非常感谢。

0 个答案:

没有答案