我正在尝试在R中学习文本挖掘。
在尝试浏览谷歌新闻和财经页面时,我遇到了使用tm.plugin.webmining软件包的问题(请参阅下面的代码和错误消息)。
我很感激能得到的任何帮助。
使用GoogleNewsSource
alienLanguage
答案 0 :(得分:0)
问题出在NASDAQ:TWTR
。从"Twitter"
中删除company
和从"TWTR"
删除symbol
可以解决错误。
company <- c("Microsoft", "Apple", "Google", "Amazon", "Facebook", "Netflix")
symbol <- c("MSFT", "AAPL", "GOOG", "AMZN", "FB", "NFLX")
download_articles <- function(symbol) {
WebCorpus(GoogleFinanceSource(paste0("NASDAQ:", symbol)))
}
stock_articles <- data_frame(company = company,
symbol = symbol) %>%
mutate(corpus = map(symbol, download_articles))
stock_articles
# # A tibble: 6 x 3
# company symbol corpus
# <chr> <chr> <list>
# 1 Microsoft MSFT <S3: WebCorpus>
# 2 Apple AAPL <S3: WebCorpus>
# 3 Google GOOG <S3: WebCorpus>
# 4 Amazon AMZN <S3: WebCorpus>
# 5 Facebook FB <S3: WebCorpus>
# 6 Netflix NFLX <S3: WebCorpus>