是否可以通过应用某些过滤器来获取Freebase的主题?
Freebase现在包含大约2800万个主题。
我希望获得所有主题名称,例如,记录名称(约7百万个主题)。
有可能吗?
答案 0 :(得分:1)
不确定。您可以通过API轻松完成此操作,但是对于您想要的主题数量,您最好使用数据转储。
获取此1.4 GB文件:http://download.freebase.com/datadumps/latest/freebase-simple-topic-dump.tsv.bz2
并使用命令
bzegrep -v $'/music/recording[\t,]' freebase-simple-topic-dump.tsv.bz2 | cut -f 2 > names.txt
几分钟后你就会拥有2100万个名字。