使用lapply或for循环为R中的转录创建数据帧列表

时间:2017-02-10 10:36:15

标签: r list for-loop lapply qdap

我正在尝试创建一个我想要运行文本挖掘分析的所有转录的列表。

我正在使用qdap使用以下代码读取转录:

read.transcript(transcript1_filename,col.names = c("Person","Dialogue"),skip = 5)

这会生成一个包含两列的数据框,一列标识发言者,另一列标识对话框。

我有很多转录,所以想要创建一个列表来进行进一步的分析。

我尝试过使用lapply:

transcript_files = list.files("~/Transcripts",full.names = TRUE)
my_list = list()
my_list= lapply(transcript_files,read.transcript(),col.names = c("Person","Dialogue"),skip = 5)

但这会产生以下错误:

Error in regexpr("\\.([[:alnum:]]+)$", x) : argument "file" is missing, with no default

我也尝试了一个for循环:

for(i in length(transcript_files)){
my_list[[i]] = read.transcript(transcript_files[i],col.names = c("Person","Dialogue"),skip = 5)
}

但由于某些原因,这只读取了最后一个文件,列表中的所有其他条目都是NULL。

不知道这里出了什么问题。

0 个答案:

没有答案