应用错误收集

apache uima ruta-非英语句子处理

时间：2018-12-17 07:13:30

标签： apache uima ruta

我用两种不同的语言（英语，韩语）测试了RUTA脚本。我想得到按字分割的相同结果。但韩文句子未按单词拆分。

脚本：声明Last1; W {-> Last1};

文档：“这是一个示例。”

结果：这个，是，一种，样本

文档：“이것은다。”
结果： “”（什么都没有）

我想要得到的结果： 이것은，샘플입니다

结果一无所获。我想知道如何在Ruta中将非英语单词检测为单词。

希望您能帮忙！

1 个答案:

答案 0 :(得分：1)

我使用'split'解决了。

句子{-> SPLIT（SPACE）}；

（apache uima旋转核心2.6.1）

无论如何，我想知道如何使用保留关键字“ W”分隔unicode字。