我使用IBM Watson Retrieve和Rank Web Interface创建了一系列html文章。通过网络界面,我能够上传我的HTML文章。问题是当我查询集合时,id和title的数据不可用。这是我在浏览器中进行的查询:
https://MY-USER-NAME:MY-PASSWORD@gateway.watsonplatform.net/retrieve-and-rank/api/v1/solr_clusters/MY-CLUSTER/solr/MY-COLLECTION/select?q=what是跨音速副翼嗡嗡声的基本机制& wt = json& fl = id,title
我得到的回应是:
{“responseHeader”:{“status”:0,“QTime”:106,“params”:{“q”:“跨音速副翼嗡嗡声的基本机制是什么”,“fl”:“id,标题 “ ”重量“: ”JSON“}}, ”响应“:{ ”numFound“:12, ”启动“:0, ”文档“:[{的 ”ID“:” 6a06f47c-cb3f-4791- 9914-c84772eb9415" , “标题”: “无标题”} .....
粗体部分是问题所在。使用网络界面时,有没有办法在上传文件时设置标题和ID?或者,更好的是,我是否有另一种方法来查询我的集合以获取我上传的文档的文件名和/或文档中的文本?
答案 0 :(得分:2)
使用网络界面时,有没有办法在上传文件时设置标题和ID?
不,抱歉。
但是,如果您自己从Web界面外部上传文档,则可以指定标题和ID(当您返回时,文档将显示在Web界面中)。
我是否有另一种方法来查询我的集合以获取我上传的文档的文件名
是
在您上面发布的查询中,您拥有的最后一个参数是您要检索的字段
&fl=id,title
您正在检索ID和标题。
如果您想要内容来自的文件名,请添加fileName
。例如:
https://MY-USER-NAME:MY-PASSWORD@gateway.watsonplatform.net/retrieve-and-rank/api/v1/solr_clusters/MY-CLUSTER/solr/MY-COLLECTION/select?q=what是跨音速副翼嗡嗡声的基本机制& wt = json& fl = id,title,fileName
我是否有另一种查询我的集合以从文档中获取文本的方法
是。
与上面类似,您只需要更新您检索的字段列表。 doc的内容放在一个名为body
的字段中。
因此,要获取ID,标题和正文,您可以使用:
https://MY-USER-NAME:MY-PASSWORD@gateway.watsonplatform.net/retrieve-and-rank/api/v1/solr_clusters/MY-CLUSTER/solr/MY-COLLECTION/select?q=what是跨音速副翼嗡嗡声的基本机制& wt = json& fl = id,title,body
这可以获得内容的纯文本版本。如果您需要HTML,请改用contentHtml
。
https://MY-USER-NAME:MY-PASSWORD@gateway.watsonplatform.net/retrieve-and-rank/api/v1/solr_clusters/MY-CLUSTER/solr/MY-COLLECTION/select?q=what是跨音速副翼嗡嗡声的基本机制& wt = json& fl = id,title,contentHtml