Watson发现应用程序无法使用JSON

时间:2017-05-23 06:32:00

标签: json dataset ibm-watson watson-discovery data-collection

您好我正在尝试将wson文件作为数据集上传到watson发现控制台。通常,对于PDF和其他接受的文件格式,Discovery应用程序会自动创建数据丰富(关键字,实体,分类等)。但是,如果我上传JSON中的数据集,它就不会这样做。

是否需要遵循任何特定的JSON格式?我是对的,它会自动插入丰富的内容吗?

2 个答案:

答案 0 :(得分:1)

可能发生的事情

我猜你正在使用Watson Discovery提供的Default ConfigurationDefault Configuration将富集应用于输入数据中的单个字段,即名为text的字段。默认情况下,HTML,PDF和Microsoft Word的转换器将文档正文输出到JSON字段text。当您将JSON发送到Watson Discovery时,不会进行转换 - 字段名称会直接通过。

你可以尝试什么

  1. 调整输入JSON以使其具有名为text的顶级字段,其中包含您要丰富的文本。
  2. 制作并使用自定义配置,其中enrichmentssource_field下的一个或多个条目的值为{J}中您希望Watson Discovery丰富的字段的名称。
  3. Watson Discovery Tooling对于试验自定义配置非常有用。

    实施例

    要具体了解这一点。以下是enrichments的{​​{1}}部分:

    Default Configuration

    如果您的JSON在名为"enrichments": [{ "destination_field": "enriched_text", "source_field": "text", "enrichment": "alchemy_language", "options": { "extract": "keyword, entity, doc-sentiment, taxonomy, concept, relation", "sentiment": true, "quotations": true } }] 的字段中包含英文文本,并且您希望Watson Discovery为该字段提供丰富内容,则可以使用此配置:

    paragraphs

答案 1 :(得分:0)

您可以使用cURL上传内部界面。

参见一个例子(cURL) - 创建一个集合:

curl -X POST -u "{username}":"{password}" -H "Content-Type: application/json" -d '{
  "name": "test_collection",
  "description": "My test collection",
  "configuration_id": "{configuration_id}"
}' "https://gateway.watsonplatform.net/discovery/api/v1/environments/{environment_id}/collections?version=2016-12-01"

您将设置"Content-Type: application/json"。将usernamepasswordService Credentials一起插入。并在网址中设置您的enviromenment_id。

添加一些文件:

curl -X POST -u "{username}":"{password}" -F file=@sample1.html "https://gateway.watsonplatform.net/discovery/api/v1/environments/{environment_id}/collections/{collection_id}/documents?version=2016-12-01"

Obs。:要摄取的文件。支持的最大文件大小为 50兆字节。大于50兆字节的文件被拒绝。 API会检测文档类型,但如果不正确,您可以指定它。可接受的MIME类型值为application/json,application / msword,application / vnd.openxmlformats-officedocument.wordprocessingml.document,application / pdf,text / html和application / xhtml + xml。将多部分表单中的内容类型指定为type=

curl -X PUT -u "{username}":"{password}" -H "Content-Type: application/json" -d@my_config.json "https://gateway.watsonplatform.net/discovery/api/v1/environments/{environment_ID}/configurations/{Configuration_ID}?version=2016-12-01"

请参阅official API参考文档。