尝试在R上运行tm
,但我无法摆脱–
作为字符串的情况。我已经尝试过"–
,"â€\“"
,'–'
。尝试在myStopwords <- c("issu","base","...")
答案 0 :(得分:0)
尝试使用gsub
函数来替换可打印字符以外的字符:[:alnum:]
,[:punct:]
和space
gsub("[^[:print:]]"," ",text)
答案 1 :(得分:0)
我们可以使用gsub
删除特定的单词:
string ="– test – data –" # This is your sample input
gsub("–","",string) # Remove †from your string
输出:
[1] " test data "