什么是训练数据集的限制-Uima Ruta

时间:2016-09-12 04:38:14

标签: machine-learning uima ruta

Error Report在TextRuler视图中,训练数据中的输入数量是否有任何限制。因为它需要花费太多时间。有时它会生成规则,因为它显示了一些GC开销限制。

如果我尝试使用算法生成的脚本,则会显示一些错误。

ERROR:

13:45:09     HEY HOW ARE YOU

             I AM FINE

13:50:10     OK THEN

             BYE

生成的脚本:

Error in KEP,  line 160, "SCRIPT": found no viable alternative

1 个答案:

答案 0 :(得分:0)

关于错误:

错误表明SCRIPT未知。是否声明了SCRIPT类型? 结果规则可能只是规则,您需要添加导入才能构建正确的脚本。第160行的内容是什么?

关于TextRuler一般:

创建框架是为了在规则工程期间支持用户。它不是针对普通监督机器学习而优化的框架。因此,它没有针对运行时和内存使用进行优化。

算法为每个示例创建规则并尝试获得良好的覆盖率。因此,越多的例子,算法将采用的时间越长。

内存使用量不应该太高。这可能是可以解决的问题,但是现在没有人可以解决这个问题。

免责声明:我是UIMA Ruta的开发者