您好我正在尝试使用R中的脚本打开从EDGAR数据库下载的大量txt文件。这些文件在mydocuments中被执行,并且按照每个公司和年份的CIK编号在子文件夹中进行组织。在每个子文件夹中都有许多txt文件,其名称类似于cik_8-K-year_month_date.txt。我正在尝试使用循环来打开每个文件,然后使用TM包来获取我感兴趣的术语。我尝试使用的代码如下:
for (i in 1:dim(CIK)) {
for(year in 1980:2017) {
for (m in 1:12) {
for (d in 1:30) {
if(is.na(cik[i])) {
} else {
mydata <- read_file("C:\\Documents\\Edgar filings\\as.integer(cik[i])_8-K_year\\as.integer(cik[i])_8-K_year-month[m]-day[d].txt")
tdm <- TermDocumentMatrix(mydata)
findAssocs(tdm, c("Chapter 11", "Chapter 7"), c(0.99, 0.99))
}
}
}
}
}
非常感谢任何帮助。感谢
答案 0 :(得分:1)
试试这段代码:
temp <- list()
for(i in 1:length(list.files())) {
temp[[i]] <- read_file(file.path(getwd(),list.files()[i]))
}