我用两种不同的语言(英语,韩语)测试了RUTA脚本。 我想得到按字分割的相同结果。但韩文句子未按单词拆分。
脚本: 声明Last1; W {-> Last1};
文档:“这是一个示例。”
结果: 这个 , 是, 一种 , 样本
文档:“이것은다。”
结果:
“”(什么都没有)
我想要得到的结果: 이것은,샘플입니다
结果一无所获。我想知道如何在Ruta中将非英语单词检测为单词。
希望您能帮忙!
答案 0 :(得分:1)
我使用'split'解决了。
句子{-> SPLIT(SPACE)};
(apache uima旋转核心2.6.1)
无论如何,我想知道如何使用保留关键字“ W”分隔unicode字。