使用R中的tm包清理数据帧中的列

时间:2018-01-31 14:56:14

标签: r string tm

我希望使用tm包来更改数据帧的列,即我想使用content_transformer,removePunctuation等函数应用于数据帧的列。

例如,使用以下数据框

df <- data.frame(a=c("I love TEXTMINING","Here I GO, Again!!"))

我想让content_transformer将df $ a变为小写,并删除缩放以删除标点符号,使得输出看起来如下所示

                  a
1 i love textmining
2   here i go again

有没有办法专门使用tm包中的函数执行上述操作?

1 个答案:

答案 0 :(得分:2)

这里使用tm包就是一个例子:

aborted