使用'rJava'和'tm.plugin.webmining'包进行文本挖掘问题

时间:2017-12-26 20:28:06

标签: r finance tm web-mining

如果我对这个主题的格式不正确,我很抱歉这是我第一次在社区发帖,我会尽力而为。我一直在研究这个问题,但一直在努力解决这个问题。我目前正在阅读“使用R:一种整洁的数据方法进行文本挖掘”这本书,我正在使用“tm.plugin.webmining”软件包来对财务文章进行情绪分析。最初的问题是,当我试图从库加载包时,它会报告和错误。

  

错误:'tm.plugin.webmining'的包或命名空间加载失败:   .onLoad在'rJava'的loadNamespace()中失败,详情:   call:dyn.load(file,DLLpath = DLLpath,...)   错误:无法加载共享对象'/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rJava/libs/rJava.so':   dlopen(/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rJava/libs/rJava.so,6):未加载库:@ rpath / libjvm.dylib   参考自:/Library/Frameworks/R.framework/Versions/3.4/Resources/library/rJava/libs/rJava.so   原因:未找到图像

在做了一些研究之后,我发现这与R和Java在mac OS High Sierra上的通信方式有关。所以为了解决这个问题,我遵循了本文的后续内容它似乎工作。一旦我解决了java和r的问题,我终于能够加载'tm.plugin.webmining'包了。但是当我试图从书中运行示例来加载语料库时,我收到了以下错误。

  

StartTag:元素名称无效   文档末尾的额外内容   mutate_impl(.data,dots)出错:   评估错误:1:StartTag:元素名称无效   2:文档末尾的额外内容

我似乎无法在任何地方找到相关信息,并且没有足够的经验来解决这个问题,所以任何洞察力或想法我可以尝试解决这个问题都非常感谢。下面我发布了我运行的代码给了我这个问题。提前谢谢。

`library(tm.plugin.webmining)

library(purrr)

library(dplyr)

company <- c("Microsoft", "Apple", "Google", "Amazon", 
"Facebook","IBM", "Yahoo", "Netflix") 
symbol <- c("MSFT", "AAPL", "GOOG", "AMZN", "FB", "IBM", "YHOO", 
"NFLX")

download_articles <- function( symbol) { 
WebCorpus(GoogleFinanceSource(paste0("NASDAQ:", symbol)))
}

stock_articles <- data_frame(company = company, symbol = symbol) %>% 
mutate(corpus = map(symbol, download_articles))`

1 个答案:

答案 0 :(得分:1)

我在执行代码时遇到了同样的问题,并找到了锻炼方法,如下所示:

library(tm.plugin.webmining)
library(purrr)

company <- c("Microsoft", "Apple", "Google",
             "Amazon", "Facebook", "Twitter",
             "IBM", "Yahoo", "Netflix")

symbol <- c("MSFT", "AAPL", "GOOG", "AMZN", "FB",
            "TWTR", "IBM", "YHOO", "NFLX")

download_articles <- function(symbol) {
  WebCorpus(YahooFinanceSource(paste0("NASDAQ:", symbol)))
}

stock_articles <- data_frame(company = company,
                             symbol = symbol) %>%
  mutate(corpus = map(symbol, download_articles))

在WebCorpus函数中,使用YahooFinanceSource()而不是GoogleFinanceSource()