我想训练我的Discovery系列,我已经上传了200多个文件。我通过GUI上传了这些文件。通过Discovery文档,我知道我必须进行API调用来训练我的集合,因为培训API还没有通过GUI公开。作为训练API调用的一部分,我需要包含一个如下所示的文档:
{
"natural_language_query": "{natural_language_query}",
"filter": "{filter_definition}"
"examples": [
{
"document_id": "{document_id_1}",
"cross_reference": "{cross_reference_1}",
"relevance": 0
},
{
"document_id": "{document_id_2}",
"cross_reference": "{cross_reference_2}",
"relevance": 0
}
]
}
我的问题是我应该如何获取已经上传的文档的documentIds?有没有办法通过GUI找到这个?或者是一个API调用,它将返回类似于:
的内容{
"document_name" = "MyDocument1",
"documentId" = "the_document_id_for_MyDocument1"
},
...
{
"document_name" = "MyDocumentN",
"documentId" = "the_document_id_for_MyDocumentN"
}
或者获取documentIds的唯一方法是创建一个新的集合并直接通过API调用上传所有文档,并在我将它们取回时跟踪documentIds?
答案 0 :(得分:0)
使用GUI,执行以下步骤:
term(_id)
文本框。extracted_metadata
请注意,查询和过滤器输入应保持为空