apache uima ruta-非英语句子处理

时间:2018-12-17 07:13:30

标签: apache uima ruta

我用两种不同的语言(英语,韩语)测试了RUTA脚本。 我想得到按字分割的相同结果。但韩文句子未按单词拆分。

脚本:          声明Last1;          W {-> Last1};

文档:“这是一个示例。”

结果:    这个 ,    是,    一种 ,    样本

文档:“이것은다。”
结果:          “”(什么都没有)

我想要得到的结果:            이것은,샘플입니다

结果一无所获。我想知道如何在Ruta中将非英语单词检测为单词。

希望您能帮忙!

1 个答案:

答案 0 :(得分:1)

我使用'split'解决了。

句子{-> SPLIT(SPACE)};

(apache uima旋转核心2.6.1)

无论如何,我想知道如何使用保留关键字“ W”分隔unicode字。