您好我正在尝试将wson文件作为数据集上传到watson发现控制台。通常,对于PDF和其他接受的文件格式,Discovery应用程序会自动创建数据丰富(关键字,实体,分类等)。但是,如果我上传JSON中的数据集,它就不会这样做。
是否需要遵循任何特定的JSON格式?我是对的,它会自动插入丰富的内容吗?
答案 0 :(得分:1)
我猜你正在使用Watson Discovery提供的Default Configuration
。 Default Configuration
将富集应用于输入数据中的单个字段,即名为text
的字段。默认情况下,HTML,PDF和Microsoft Word的转换器将文档正文输出到JSON字段text
。当您将JSON发送到Watson Discovery时,不会进行转换 - 字段名称会直接通过。
text
的顶级字段,其中包含您要丰富的文本。enrichments
下source_field
下的一个或多个条目的值为{J}中您希望Watson Discovery丰富的字段的名称。Watson Discovery Tooling对于试验自定义配置非常有用。
要具体了解这一点。以下是enrichments
的{{1}}部分:
Default Configuration
如果您的JSON在名为"enrichments": [{
"destination_field": "enriched_text",
"source_field": "text",
"enrichment": "alchemy_language",
"options": {
"extract": "keyword, entity, doc-sentiment, taxonomy, concept, relation",
"sentiment": true,
"quotations": true
}
}]
的字段中包含英文文本,并且您希望Watson Discovery为该字段提供丰富内容,则可以使用此配置:
paragraphs
答案 1 :(得分:0)
您可以使用cURL
上传内部界面。
参见一个例子(cURL) - 创建一个集合:
curl -X POST -u "{username}":"{password}" -H "Content-Type: application/json" -d '{
"name": "test_collection",
"description": "My test collection",
"configuration_id": "{configuration_id}"
}' "https://gateway.watsonplatform.net/discovery/api/v1/environments/{environment_id}/collections?version=2016-12-01"
您将设置"Content-Type: application/json"
。将username
和password
与Service Credentials
一起插入。并在网址中设置您的enviromenment_id。
添加一些文件:
curl -X POST -u "{username}":"{password}" -F file=@sample1.html "https://gateway.watsonplatform.net/discovery/api/v1/environments/{environment_id}/collections/{collection_id}/documents?version=2016-12-01"
Obs。:要摄取的文件。支持的最大文件大小为 50兆字节。大于50兆字节的文件被拒绝。 API会检测文档类型,但如果不正确,您可以指定它。可接受的MIME类型值为application/json
,application / msword,application / vnd.openxmlformats-officedocument.wordprocessingml.document,application / pdf,text / html和application / xhtml + xml。将多部分表单中的内容类型指定为type=
。
curl -X PUT -u "{username}":"{password}" -H "Content-Type: application/json" -d@my_config.json "https://gateway.watsonplatform.net/discovery/api/v1/environments/{environment_ID}/configurations/{Configuration_ID}?version=2016-12-01"
请参阅official API参考文档。