我正在尝试使用NLU和WKS从文本文档中提取一些实体和关系。我取得了很好的结果,但是我想了解为什么Watson NLU在相似的文档中无法识别我的自定义模型的某些实体,例如:
Text 1 in Portuguese: "Dá à causa o valor de R$ 10.000,00" => DIDN´T WORK
Text 2 in Portuguese: "Dá à causa o valor de R$ 20.000,00" => WORKED!
Text 3 in Portuguese: "Dá à causa o valor de R$ 10.000,01" => WORKED!
Watson可以识别我在文本2和文本3上的实体和关系,但在文本1中却不然。同样的事情发生在:
Text 4 in Portuguese: "Dá à causa o valor esperado de R$ 20.000,00" => DIDN´T WORK
Text 5 in Portuguese: "Dá à causa o valor de R$ 20.000,00" => WORKED!
带有标签的文档样本:
数据集:
盲注集:10个文档(3%)
我已经使用过另一个分割。
我已经用这种情况标记了更多文档,但是并没有改善结果。另一个测试是将任何货币标记到文档中。
我该怎么做才能改善结果?