Question

我已经从我写给朋友的各种电子邮件中复制了文本，以便执行文本挖掘并查看wordcloud将如何产生。（使用的包是tm和wordcloud ）。但是，当我尝试将数据转储到csv文件并调用列＃34; letter_text＆＃34;：

df <- read.csv("Letter_Text.csv")

letter_text <- Corpus(VectorSource(df$letter_text))

我在运行wordcloud(letter_text)命令时遇到以下错误：

Error in strwidth(words[i], cex = size[i], ...) : invalid 'cex' value
In addition: Warning messages:
1: In max(freq) : no non-missing arguments to max; returning -Inf
2: In max(freq) : no non-missing arguments to max; returning -Inf

我想也许我超过了CSV格式的字符长度。所以，我把数据转储到一个文本文件中。 df <- read.table("Letter_Text.txt") 我仍然得到同样的错误。

有些东西告诉我，我在创建挖掘电子邮件文本数据的数据集时犯了一个错误。我该如何解决这个错误？或者更好的是有一种特殊的方法来使用您自己的数据为文本挖掘创建数据集吗？

请帮忙！

感谢。

将批量文本数据粘贴到CSV文件中以便在R中进行文本挖掘。但是我收到一个strwidth错误，指出无效＆＃39; cex＆＃39;值

0 个答案: