在TextRuler视图中,训练数据中的输入数量是否有任何限制。因为它需要花费太多时间。有时它会生成规则,因为它显示了一些GC开销限制。
如果我尝试使用算法生成的脚本,则会显示一些错误。
ERROR:
13:45:09 HEY HOW ARE YOU
I AM FINE
13:50:10 OK THEN
BYE
生成的脚本:
Error in KEP, line 160, "SCRIPT": found no viable alternative
答案 0 :(得分:0)
关于错误:
错误表明SCRIPT未知。是否声明了SCRIPT类型? 结果规则可能只是规则,您需要添加导入才能构建正确的脚本。第160行的内容是什么?
关于TextRuler一般:
创建框架是为了在规则工程期间支持用户。它不是针对普通监督机器学习而优化的框架。因此,它没有针对运行时和内存使用进行优化。
算法为每个示例创建规则并尝试获得良好的覆盖率。因此,越多的例子,算法将采用的时间越长。
内存使用量不应该太高。这可能是可以解决的问题,但是现在没有人可以解决这个问题。
免责声明:我是UIMA Ruta的开发者