提前感谢您的意见。
我的问题是edgar包的getSentimentCount(word.frq, words.list)
功能。该函数应该读取word.list
这是一个.txt文件,并比较另一个现有列表(word.frq)
的内容,也就是.txt文件。
这适用于一个.txt文件,它在单词之间没有空格,但R仍然可以读取文件,就好像有(count> 1)。如果每个单词后面有一个新行,则可以读取另一个文件(count> 1),但会导致getSentimentCount(word.frq, words.list)
函数出错。如果.txt文件被删除新行并且所有单词都放在一行(作为其他文件),则R只能读取一个单词(基本上是一行中的所有单词)和count = 1.
R有区别的不同类型的.txt文件吗?
LINK到两个.txt文件。 negwords.txt
有效,litwords.txt
会导致错误。
我很感激任何意见。
答案 0 :(得分:0)
R只读取nospace
txt中的一个单词这一事实是正常的:就R而言,这只是一个没有任何分隔符的字符串。
我在阅读其他文档时没有任何问题:
library(edgar)
wf <- getWordfrquency("R/litwords_space.txt")
neg <- readLines("R/negwords.txt")
wgs <- getSentimentCount(word.frq = wf, words.list = neg)
现在,您的单词列表只包含出现一次的单词,因此频率表将始终为1。
如果您正在进行文本挖掘和情感分析,我强烈建议您切换到tidytext
包。
科林
答案 1 :(得分:0)
已解决:函数getSentimentCount(word.frq, words.list)
仅读取.txt (MS-DOS)
。