IBM Watson-提取关键字和概念

时间:2017-10-16 14:46:42

标签: ibm-cloud ibm-watson watson watson-discovery

我正在试图找出从大量文档中单独提取关键字和概念的正确方法。在DW上,建议使用IBM Watson- Knowledge Studio。 Knowledge Studio链接到Discovery,我似乎无法在Discovery API Reference中找到如何单独提取关键字和概念。我可以轻松地在宏观层面上查看概念,但我需要单独为每个文件提供关键字和概念。我的所有文件都已上传到Knowledge Studio。此外,我还将所有内容上传到Discovery。我无法根据单个文件提取信息。 API参考指南不包括为已上载的文件提取单个级别的信息。上周,我提交了一张支持票,响应是在Stackoverflow上发布问题以获得更多支持。在大批文件中单独查找每个文件的关键字和概念的正确方法是什么?发现还是NLU?

非常感谢任何指导。

1 个答案:

答案 0 :(得分:1)

我认为您应该尝试Natural Language Understanding服务。这是一个演示,允许您分析文本并提取概念和关键字https://natural-language-understanding-demo.mybluemix.net/

我建议您先read the documentation,然后查看API Reference,在那里您将找到如何调用方法来提取基于不同语言的关键字和概念。

您需要做的是循环浏览文件,阅读内容然后将其发送给NLU。

以下是如何分析文本以在Node.js中提取概念和关键字的示例:

const NaturalLanguageUnderstandingV1 = require('watson-developer-cloud/natural-language-understanding/v1.js');
const service = new NaturalLanguageUnderstandingV1({
  'username': '{username}',
  'password': '{password}',
  'version_date': '2017-02-27'
});

const parameters = {
  text: 'IBM is an American multinational technology company headquartered in Armonk, New York, United States, with operations in over 170 countries.',
  features: {
    keywords: {
      emotion: true,
      sentiment: true,
      limit: 2
    },
    concepts: {
      limit: 3
    }
  }
}

service.analyze(parameters, (err, response) => {
  if (err)
    console.log('error:', err);
  else
    console.log(JSON.stringify(response, null, 2));
});