Freebase:以我公司的整个数据库为基础是否值得?

时间:2012-08-16 20:02:21

标签: database startup freebase

我正在与一家正在为现场音乐建立场地/艺术家数据库的公司,最近遇到了Freebase。它看起来非常引人注目,即使数据不适用于新的,崭露头角的乐队。对于那些使用Freebase的人,我有几个问题:

  1. 将所有数据输入与Freebase集成是否有缺点?我们不打算出售或私有化这些信息。

  2. Freebase在可用性方面有哪些缺点?

1 个答案:

答案 0 :(得分:1)

披露:我在Google上使用Freebase。

Freebase中的音乐数据是我们最强大的领域之一,随着我们继续加载更多数据集,它将继续变得更加广泛和丰富。例如,我们从MusicBrainz导入数据,清理它并将主题与Freebase中的现有主题相匹配,以避免重复。

  1. 就缺点而言,您应该准备好处理大量数据。例如,Freebase目前有4 musical artists named "John Smith",可能对您的应用程序有用,也可能没有用,但您仍然需要找出您的用户感兴趣的John Smith的哪个(哪些)地图。我们称之为“对帐”及其必要条件,以便您的应用准确了解要查询API的主题。

    既然您提到了音乐场所,我还应该指出,虽然Freebase有很多关于场所的数据,但我们还没有geosearch API,所以如果你需要的话,你需要自己动手。

    由于任何人都可以编辑Freebase,您还应该考虑使用as_of_time来保护您的网站免遭破坏。

  2. Freebase非常适合开发人员,因为您可以轻松地跳入并清理错误数据或添加缺少的主题。但是,一直面临挑战的领域是从Google外部加载大量数据。我们构建了允许人们上传数据集的OpenRefine,但这些数据集必须通过一个需要一些时间才能完成的QA流程。有必要让这些QA流程维持Freebase的质量水平,但它确实会减慢加载大型数据集的过程。

  3. 我真的希望您选择使用Freebase音乐数据来建立您的公司。我知道已经有很多音乐创业公司乐于使用我们的数据。