我正在尝试使用一系列不同年份的数据对一系列csv文件进行情感分析。我想最终比较一下日期范围的看法。
我正在尝试在R中创建一个函数,以将年份应用于每个文件情感。
GetSentiment <- function(file){
fileName <- glue("C:/Documents/Project/", file, sep = "")
fileName <- trimws(fileName)
# read in the new file
fileText <- glue(read_file(fileName))
fileText <- gsub("\\$", "", fileText)
# tokenize
tokens <- data_frame(text = fileText) %>% unnest_tokens(word, text)
# get the sentiment from the first text:
sentiment <- tokens %>%
inner_join(get_sentiments("bing")) %>%
count(sentiment) %>% # count the
spread(sentiment, n, fill = 0) %>%
mutate(sentiment = positive - negative) %>%
mutate(file = file) %>%
mutate(year = as.numeric(str_match(file, "d{4}"))) %>% # add the year
return(sentiment)
我希望输出文件的正面和负面情绪,以及其文件名和年份(来自文件名)。反而我得到
return(。,情感)中的错误:不允许多参数返回