我想从文本中获取实体的dbpedia
链接。我已经看到DBpedia spotlight
是最好的方法。所以我尝试使用curl
命令,输出看起来不错。
我正在使用此http://hi.baidu.com/shirleyzzzhen/item/e757e17bfdf98125d6a89c00中DBpedia Spotlight Web Service
HttpClient
Java
websocket
来处理文本。我想每天处理数百万份文件。是否可以通过此方法处理我的文档?是否有访问Web服务的每日限制?
答案 0 :(得分:1)
“我想每天处理数百万份文件。是否可以通过这种方法处理我的文件?”
是的,但我认为使用url参数而不是文本是个好主意。例如。 http://spotlight.dbpedia.org/rest/annotate?url=http://edition.cnn.com/2015/04/29/asia/nepal-earthquake/index.html
“访问网络服务是否有任何每日限制?”
不,没有。但请记住,spotlight.dbpedia.org是一项演示服务。我建议你有自己的实例来处理它。