在Rapidminer中标记化之前处理文档时替换单词

时间:2018-03-09 02:22:08

标签: rapidminer

我有一组文档,想在标记化之前用一个单词替换一些单词集。

离。 "跟进" - >跟进,

 "Set up" --> Setup and 

  "with out" --> without

我尝试通过加载带有潜在单词的csv文件来使用Replace(字典)。但是不能在之后进行标记化。

enter image description here

我该怎么做?

谢谢,

1 个答案:

答案 0 :(得分:1)

看看Stem(词典)。这可以用来做你的伎俩。

干杯, 马丁