我是R的新手,希望能阅读所有以.txt格式显示的10-K财务报告,我希望它能一次阅读所有这些文件?
我试过了
dir<- "/Users/Documents/Edgar filings"
text = readtext(paste0(dir, "/ALL_2016/*.txt")
然而,没有任何反应,我的意思是控制台部分没有产生输出,也没有错误。
我试图通过
只读取一份10-K报告dir <- "/Users/Documents/Edgar filings"
text = readtext(paste0(dir, "/ALL_2016/10254_10-K_2016-03-11*.txt")
但同样没有任何输出或任何错误消息。
我通过quanteda尝试过它
mycorpus <- corpus(textfile("~/ALL_10-K_2016/*.txt"))
但这次它说“文本文件功能不适用于3.4.3”,即使我的R版本是3.4.4,我几周前更新了。
我也尝试使用list.files()
,但我不知道如何创建循环编码,所以我只是卡住了!
如果有人请帮忙,我非常感谢。
答案 0 :(得分:1)
以下是使用readChar
与vapply
:
\
) path <- "/Users/Documents/Edgar\ filings"
files <- file.path(path, list.files(path))
documents <- vapply(X=1:length(files), FUN=function(i){
readChar(files[i], file.info(files[i])$size)
}, FUN.VALUE = character(1))