我相信我在微软的学术知识API中遇到了一些错误。第一种是当我使用CalcHistogram方法使用'Conference Instance Entity'运行搜索时。我运行了一个指定会议名称的搜索,并为2008年以后的任何事情设置了开始日期。以下是我的代码(在python中):
'expr': "And(Composite(PCS.CN = 'AAAI'),CISD>'2008')",
我指定要返回的属性是引文计数(CC)和会议开始日期(CISD)。问题是由于某种原因,结果不包括2009年的任何内容。
{"attribute":"CISD",
"distinct_values":9,
"total_count":9,
"histogram":[
{"value":"2008-07-13","logprob":-25.000,"count":1},
{"value":"2010-07-11","logprob":-25.000,"count":1},
{"value":"2011-08-07","logprob":-25.000,"count":1},
{"value":"2013-07-14","logprob":-25.000,"count":1},
{"value":"2014-07-27","logprob":-25.000,"count":1},
{"value":"2015-01-25","logprob":-25.000,"count":1},
{"value":"2016-02-12","logprob":-25.000,"count":1},
{"value":"2017-02-04","logprob":-25.000,"count":1},
{"value":"2018-02-14","logprob":-25.000,"count":1}]
}]
这令人困惑,因为它每隔一年都有相关信息。但是,AAAI确实在2009年举行了一次会议,API提供了相关信息。当查询过滤器是会议和年份(在这种情况下为AAAI和2009)的论文时,我会得到一份完整的论文清单。为什么今年被排除在会议即时搜索之外?
我遇到的第二个错误是缺少某些论文的数据。我能够找到我搜索的具体论文,但他们缺少有关会议或期刊的信息。
{
"expr":"Ti = 'decontamination of mutually contaminated models'",
"num_entities":1,
"histograms":[
{"attribute":"AA.AuN",
"distinct_values":2,
"total_count":2,
"histogram":[
{"value":"clayton scott","logprob":-21.161,"count":1},
{"value":"gilles blanchard","logprob":-21.161,"count":1}]
},
{"attribute":"J.JN",
"distinct_values":0,
"total_count":0,
"histogram":[]
},
{"attribute":"C.CN",
"distinct_values":0,
"total_count":0,
"histogram":[]
}]
}
在这里,我搜索了2014年AISTATS(国际人工智能与统计会议)会议的论文。我发现本文使用的是DBLP数据库,并在此处包含了链接:
http://dblp.uni-trier.de/db/conf/aistats/aistats2014.html
正如您所看到的,Microsoft API返回了论文的正确作者,因此它的数据库中显然有一些相关信息。但是,它不包含有关其会议或期刊名称的信息。
非常感谢回应。提前谢谢你,
肖恩
答案 0 :(得分:2)
我们目前不认为AAAI 2009是一个离散的会议实例。您仍然可以从AAAI 2009找到论文的原因是因为我们在AAAI 2009 上发表了论文,我们只是没有将它们与离散的会议实例相关联。我们仍然将它们链接到AAAI系列,这就是为什么查询“AAAI 2009”有效(我们的查询解析器将“AAAI”识别为会议系列,将“2009”识别为出版年)。
对于论文Decontamination of Mutually Contaminated Models,我们根本没有设法将其与JMLR(机器学习研究期刊)或AISTATS(国际人工智能和统计会议)混为一谈。实际上,我们目前甚至不认识AISTATS作为会议系列。
我已经向我们的团队提出了这两个错误,我们将努力在未来的数据刷新中解决这些错误。
另外,Microsoft Academic Knowledge API中的数据正在为我们的Microsoft Academic网站提供支持。我提到,因为该网站有一个非常方便的“反馈”功能,可以轻松报告这些类型的数据问题(如果您愿意,可以匿名)。我可以向您保证,我们非常认真地对待图表中的这些类型的数据错误,并希望快速修复它们。