如何使用Content Analytics Studio

时间:2017-03-12 11:48:14

标签: annotations uima watson-explorer

如果文本在一个句子或段落中包含多个术语,我正在寻找Watson Explorer Content Analytics Studio中的一种方法来生成相同类型的多个注释。 我没有通过一个注释,我可以让它选择所有“文本容器”,但它仍然产生一个注释。 我试过“在这个级别上解雇所有规则”,但这也没有给出理想的结果

以下一些样本

  

家庭作业将是“bonjour France”一书的第1,2和4章

     

重温“大历史”一书中第2章第2和第3段      

第1章至第3章的内容将成为测试的一部分

     

下周的作业是阅读教科书的第1,2和5页

到目前为止我所拥有的是以下帮助者(见截图)

enter image description here

第一行的预期结果是带有值/特征的SinglePieceOfContent类型的3个注释:

  1. 第1章书“bonjour France”
  2. 第2章书“bonjour France”
  3. 第4章书“bonjour France”
  4. 我想避免构建自定义注释器,但如果这是要走的路,我希望看到确认。

1 个答案:

答案 0 :(得分:1)

有两种方法可以做到这一点,两者都有点笨拙,可能无法使用您的特定数据。

第一种方法是您可以使用单个选择规则创建多个注释。因此,执行此操作的蛮力方法是使选择器看起来像这样(高级别,忽略干预令牌)。首先在一个句子中选择一个最大数量的注释,比如说5,然后:

Selection:
find   chapter chapter? chapter? chapter? chapter? book
rule   create 5 annotations, each with limited span over just the N they refer to and add book covered text as a feature to each. 

第二种方法是使用更新。创建标识每个章节的注释,并包含一个设置为"默认"的字符串功能手册。创建另一个标识书籍的注释。然后创建一个像这样的聚合规则:

selection:   chapter*  book
rule:    here just drag the value of book to update the feature value currently set to default. 

实际上没有创建规则,它是一个更新。更新可以一次处理多个注释。