Question

提前感谢您的意见。

我的问题是edgar包的getSentimentCount(word.frq, words.list)功能。该函数应该读取word.list这是一个.txt文件，并比较另一个现有列表(word.frq)的内容，也就是.txt文件。

这适用于一个.txt文件，它在单词之间没有空格，但R仍然可以读取文件，就好像有（count＆gt; 1）。如果每个单词后面有一个新行，则可以读取另一个文件（count> 1），但会导致getSentimentCount(word.frq, words.list)函数出错。如果.txt文件被删除新行并且所有单词都放在一行（作为其他文件），则R只能读取一个单词（基本上是一行中的所有单词）和count = 1.

R有区别的不同类型的.txt文件吗？

LINK到两个.txt文件。 negwords.txt有效，litwords.txt会导致错误。

我很感激任何意见。

Answer 1

R只读取nospace txt中的一个单词这一事实是正常的：就R而言，这只是一个没有任何分隔符的字符串。

我在阅读其他文档时没有任何问题：

library(edgar)
wf <- getWordfrquency("R/litwords_space.txt")
neg <- readLines("R/negwords.txt")
wgs <- getSentimentCount(word.frq = wf, words.list = neg)

现在，您的单词列表只包含出现一次的单词，因此频率表将始终为1。

如果您正在进行文本挖掘和情感分析，我强烈建议您切换到tidytext包。

科林

Answer 2

已解决：函数getSentimentCount(word.frq, words.list)仅读取.txt (MS-DOS)。

埃德加包装| .txt文件问题

2 个答案: