R中的Tm.plugin.webmining - 谷歌新闻提要

时间:2017-03-29 02:59:51

标签: r purrr

我正在尝试在R中学习文本挖掘。

在尝试浏览谷歌新闻和财经页面时,我遇到了使用tm.plugin.webmining软件包的问题(请参阅下面的代码和错误消息)。

我很感激能得到的任何帮助。

使用GoogleNewsSource

alienLanguage

1 个答案:

答案 0 :(得分:0)

问题出在NASDAQ:TWTR。从"Twitter"中删除company和从"TWTR"删除symbol可以解决错误。

company <- c("Microsoft", "Apple", "Google", "Amazon", "Facebook", "Netflix")
symbol <- c("MSFT", "AAPL", "GOOG", "AMZN", "FB", "NFLX")

download_articles <- function(symbol) {
  WebCorpus(GoogleFinanceSource(paste0("NASDAQ:", symbol)))
}
stock_articles <- data_frame(company = company,
                             symbol = symbol) %>%
  mutate(corpus = map(symbol, download_articles))
stock_articles
#     # A tibble: 6 x 3
#     company symbol          corpus
#       <chr>  <chr>          <list>
# 1 Microsoft   MSFT <S3: WebCorpus>
# 2     Apple   AAPL <S3: WebCorpus>
# 3    Google   GOOG <S3: WebCorpus>
# 4    Amazon   AMZN <S3: WebCorpus>
# 5  Facebook     FB <S3: WebCorpus>
# 6   Netflix   NFLX <S3: WebCorpus>