Question

我正在尝试使用NLU和WKS从文本文档中提取一些实体和关系。我取得了很好的结果，但是我想了解为什么Watson NLU在相似的文档中无法识别我的自定义模型的某些实体，例如：

Text 1 in Portuguese: "Dá à causa o valor de R$ 10.000,00" => DIDN´T WORK

Text 2 in Portuguese: "Dá à causa o valor de R$ 20.000,00" => WORKED!

Text 3 in Portuguese: "Dá à causa o valor de R$ 10.000,01" => WORKED!

Watson可以识别我在文本2和文本3上的实体和关系，但在文本1中却不然。同样的事情发生在：

Text 4 in Portuguese: "Dá à causa o valor esperado de R$ 20.000,00" => DIDN´T WORK

Text 5 in Portuguese: "Dá à causa o valor de R$ 20.000,00" => WORKED!

带有标签的文档样本：

数据集：

培训集：250个文档（85％）
测试集：35个文档（12％）
盲注集：10个文档（3％）
我已经使用过另一个分割。
所有文档均具有实体和关系，每个文档都有一个差异。

我已经用这种情况标记了更多文档，但是并没有改善结果。另一个测试是将任何货币标记到文档中。

我该怎么做才能改善结果？

在IBM Watson NLU中使用货币实体进行实体提取时得分较低

0 个答案: