我正在尝试创建一个我想要运行文本挖掘分析的所有转录的列表。
我正在使用qdap使用以下代码读取转录:
read.transcript(transcript1_filename,col.names = c("Person","Dialogue"),skip = 5)
这会生成一个包含两列的数据框,一列标识发言者,另一列标识对话框。
我有很多转录,所以想要创建一个列表来进行进一步的分析。
我尝试过使用lapply:
transcript_files = list.files("~/Transcripts",full.names = TRUE)
my_list = list()
my_list= lapply(transcript_files,read.transcript(),col.names = c("Person","Dialogue"),skip = 5)
但这会产生以下错误:
Error in regexpr("\\.([[:alnum:]]+)$", x) : argument "file" is missing, with no default
我也尝试了一个for循环:
for(i in length(transcript_files)){
my_list[[i]] = read.transcript(transcript_files[i],col.names = c("Person","Dialogue"),skip = 5)
}
但由于某些原因,这只读取了最后一个文件,列表中的所有其他条目都是NULL。
不知道这里出了什么问题。