Question

我想训练我的Discovery系列，我已经上传了200多个文件。我通过GUI上传了这些文件。通过Discovery文档，我知道我必须进行API调用来训练我的集合，因为培训API还没有通过GUI公开。作为训练API调用的一部分，我需要包含一个如下所示的文档：

{
  "natural_language_query": "{natural_language_query}",
  "filter": "{filter_definition}"
  "examples": [
    {
      "document_id": "{document_id_1}",
      "cross_reference": "{cross_reference_1}",
      "relevance": 0
    },
    {
      "document_id": "{document_id_2}",
      "cross_reference": "{cross_reference_2}",
      "relevance": 0
    }
  ]
}

我的问题是我应该如何获取已经上传的文档的documentIds？有没有办法通过GUI找到这个？或者是一个API调用，它将返回类似于：

的内容

{
  "document_name" = "MyDocument1",
  "documentId" = "the_document_id_for_MyDocument1"
},

...

{
  "document_name" = "MyDocumentN",
  "documentId" = "the_document_id_for_MyDocumentN"
}

或者获取documentIds的唯一方法是创建一个新的集合并直接通过API调用上传所有文档，并在我将它们取回时跟踪documentIds？

Answer 1

使用GUI，执行以下步骤：

在＆＃34;组查询结果（聚合）＆＃34;中输入term(_id) 文本框。
在＆＃34;字段下返回＆＃34;，选择＆＃34;指定＆＃34;输入 extracted_metadata

请注意，查询和过滤器输入应保持为空

通过Discovery GUI工具

1 个答案: