如何让R一次读取数千个.txt文件(财务报告)?

时间:2018-03-23 01:44:02

标签: r

我是R的新手,希望能阅读所有以.txt格式显示的10-K财务报告,我希望它能一次阅读所有这些文件?

我试过了

dir<- "/Users/Documents/Edgar filings"
text = readtext(paste0(dir, "/ALL_2016/*.txt") 

然而,没有任何反应,我的意思是控制台部分没有产生输出,也没有错误。

我试图通过

只读取一份10-K报告
dir <- "/Users/Documents/Edgar filings"
text = readtext(paste0(dir, "/ALL_2016/10254_10-K_2016-03-11*.txt") 

但同样没有任何输出或任何错误消息。

我通过quanteda尝试过它

mycorpus <- corpus(textfile("~/ALL_10-K_2016/*.txt"))  

但这次它说“文本文件功能不适用于3.4.3”,即使我的R版本是3.4.4,我几周前更新了。

我也尝试使用list.files(),但我不知道如何创建循环编码,所以我只是卡住了!

如果有人请帮忙,我非常感谢。

1 个答案:

答案 0 :(得分:1)

以下是使用readCharvapply

的解决方案
  1. 存储文件夹路径(注意空格前的\
  2. path <- "/Users/Documents/Edgar\ filings"

    1. 存储完全指定的文件路径
    2. files <- file.path(path, list.files(path))

      1. 读入所有文件
      2. documents <- vapply(X=1:length(files), FUN=function(i){ readChar(files[i], file.info(files[i])$size) }, FUN.VALUE = character(1))