我希望使用tm包来更改数据帧的列,即我想使用content_transformer,removePunctuation等函数应用于数据帧的列。
例如,使用以下数据框
df <- data.frame(a=c("I love TEXTMINING","Here I GO, Again!!"))
我想让content_transformer将df $ a变为小写,并删除缩放以删除标点符号,使得输出看起来如下所示
a
1 i love textmining
2 here i go again
有没有办法专门使用tm包中的函数执行上述操作?
答案 0 :(得分:2)
这里使用tm包就是一个例子:
aborted