我有一组来自Facebook的兴趣和喜欢数据,我有兴趣丰富来自其他来源的数据,即Freebase。有没有办法确定Freebase中的哪个条目与Facebook Graph中的给定条目相对应?
首先,Facebook Graph不提供任何外部资源的链接,因此似乎需要在外部资源中找到任何关系。我发现,至少对于某些条目,Freebase提供了一个“Facebook URL”,因此可以通过环形方式将两者联系起来。例如,对于乐队'Take Back Sunday',这里是Facebook Graph URL:
https://graph.facebook.com/23854511408
...也可以使用虚荣URL:
https://graph.facebook.com/TakingBackSunday
现在在Freebase中,如果我以RDF格式(http://rdf.freebase.com/rdf/en.taking_back_sunday)或JSON格式查看“收回星期日”条目,我可以看到Facebook虚荣URL的链接。假设MQL可以查询此属性,则可以通过此方法将Freebase链接到Facebook Graph。但问题是Freebase中的许多条目都没有Facebook链接。
关于是否有一致的方法来发现这些联系的任何想法?
答案 0 :(得分:4)
如果您可以将Facebook图形数据转换为RDF格式,并且如果您对跨数据集连接特定类型的实体(例如,波段)感兴趣,则可以使用Silk之类的链接发现工具。你写了一个映射,告诉Silk如何比较名称,流派,故乡等,Silk将计算连接。这需要相当多的努力。
另一种选择可能是使用Google Refine,它具有“对帐”功能,可以发现与您的数据匹配的Freebase实体。挑战再次是如何将Facebook数据导入Google Refine。
答案 1 :(得分:4)
Create a new column根据您的已对帐名称列使用以下GREL代码获取Freebase URI:
“http://rdf.freebase.com/ns/”+ cell.recon.match.id [1,-1] .replace(“/”,“。”)
Export将您的扩充数据添加到新的电子表格中。