如何从作者列表中检索/计算引文计数和/或引文索引?

时间:2012-05-10 14:50:14

标签: r api web-scraping citations

我有一份作者名单。 我希望自动检索/计算每位作者的(理想年度)引文索引(h-index,m-quotient,g-index,HCP指标或...)。

Author Year Index
first  2000   1
first  2001   2
first  2002   3

考虑到每位研究人员每篇论文的引用次数,我可以计算所有这些指标。

Author Paper Year Citation_count
first    1    2000   1
first    2    2000   2
first    3    2002   3

尽管我付出了努力,但我还没有找到能够做到这一点的API /抓取方法。

我的机构可以使用包括Web of Science在内的多种服务。

1 个答案:

答案 0 :(得分:1)

有效的主要问题是构建citation graph。完成后,您可以计算所需的所有指标(例如h-indexg-indexPageRank)。

假设您有一系列论文(以某种方式检索过),您可以从每个论文中提取引文并构建引文图。您可能会发现有用的ParsCit, an open-source CRF Reference String and Logical Document Structure Parsing Package也会被CiteSeerX使用并且效果很好。