我创建了许多函数,我想在列表的子列表中应用(即嵌套列表)。
例如
# Getintervalduration
list.dur <- function(x){
# x is a (non nested...) list
dur <- x$xmax-x$xmin
return(dur)
}
所以我可以开始应用这个功能:
(1)我的列表中的简单数据框
list.dur(intrad_02.textgrid$phones)
(2)我列表中的所有数据框
lapply(intrad_02.textgrid, list.dur)
(3)我的主列表中的所有嵌套列表和列表中的数据框
durations <- lapply(txtgridnames,list.dur)
第三个例子是我想成功自动完成的事情。
目前,txtgridnames
或多或少与names(list)
相对应但我必须半自动修改它,因为:
R允许:
durations <- lapply(c(firstnestedlist, second.nested.list, etc.),list.dur)
但不幸的是不允许这样:
durations <- lapply(names(list.with.nested.lists.inside),list.dur)
当names(list)
可以改变或想要在不同的研究案例中复制时,这是一个问题。
目前,我的解决方案(思考这里)是写一个名称没有“引用”和coma作为eol的表,读取我刚刚用名称创建的文件,然后手动创建一个对象所有的名字。
write.table(x=names(corpus),file="txtgridnames.txt", quote=FALSE, row.names=FALSE, append=FALSE, eol=",",col.names=FALSE)
txtgridnames <- readLines("txtgridnames.txt")
txtgridnames
!手动复制输出!并手动粘贴,以便:
txtgridnames<-c(cnf_01_be,cnf_02_ch[...])
如何自动让R了解列表(名称(主列表)),即如何自动创建此对象“txtgridnames”?
以下是我正在处理的数据结构示例:(在主列表中构成我的语料库的24个子列表中约有502个数据帧)
以前的帖子还描述了我正在处理的数据类型(要知道xmin和xmax对应点击here
#-------------------------------------------
## Data structure example
$ cnf_01_be :List of 17
..$ phones :'data.frame': 2505 obs. of 3 variables:
.. ..$ xmin : num [1:2505] 0 0.427 0.472 0.512 0.562 ...
.. ..$ xmax : num [1:2505] 0.427 0.472 0.512 0.562 0.632 ...
.. ..$ value: chr [1:2505] "_" "v" "w" "a" ...
..$ syll :'data.frame': 1146 obs. of 3 variables:
.. ..$ xmin : num [1:1146] 0 0.427 0.562 0.752 0.952 ...
.. ..$ xmax : num [1:1146] 0.427 0.562 0.752 0.952 1.022 ...
.. ..$ value: chr [1:1146] "_" "vwa" "la" "do~k" ...
..$ delivery :'data.frame': 1146 obs. of 3 variables:
.. ..$ xmin : num [1:1146] 0 0.427 0.562 0.752 0.952 ...
.. ..$ xmax : num [1:1146] 0.427 0.562 0.752 0.952 1.022 ...
.. ..$ value: chr [1:1146] "_" "" "" "" ...
..$ link :'data.frame': 806 obs. of 3 variables:
.. ..$ xmin : num [1:806] 0 0.427 0.752 0.952 1.082 ...
.. ..$ xmax : num [1:806] 0.427 0.752 0.952 1.082 1.256 ...
.. ..$ value: chr [1:806] "_" "" "" "l" ...
..$ words :'data.frame': 806 obs. of 3 variables:
.. ..$ xmin : num [1:806] 0 0.427 0.752 0.952 1.082 ...
.. ..$ xmax : num [1:806] 0.427 0.752 0.952 1.082 1.256 ...
.. ..$ value: chr [1:806] "_" "voilà" "donc" "vous" ...
..$ POS :'data.frame': 806 obs. of 3 variables:
.. ..$ xmin : num [1:806] 0 0.427 0.752 0.952 1.082 ...
.. ..$ xmax : num [1:806] 0.427 0.752 0.952 1.082 1.256 ...
.. ..$ value: chr [1:806] "_" "VER:pres:entatif" "CON:coo" "PRO:sjt" ...
..$ discourse :'data.frame': 750 obs. of 3 variables:
.. ..$ xmin : num [1:750] 0 0.427 0.752 0.952 1.082 ...
.. ..$ xmax : num [1:750] 0.427 0.752 0.952 1.082 1.256 ...
.. ..$ value: chr [1:750] "SIL:l" "MD" "CON" "" ...
..$ disfluency :'data.frame': 806 obs. of 3 variables:
.. ..$ xmin : num [1:806] 0 0.427 0.752 0.952 1.082 ...
.. ..$ xmax : num [1:806] 0.427 0.752 0.952 1.082 1.256 ...
.. ..$ value: chr [1:806] "SIL:l" "" "" "" ...
..$ boundary-dismo:'data.frame': 750 obs. of 3 variables:
.. ..$ xmin : num [1:750] 0 0.427 0.752 0.952 1.082 ...
.. ..$ xmax : num [1:750] 0.427 0.752 0.952 1.082 1.256 ...
.. ..$ value: chr [1:750] "MAJ" "MAJ" "MINg" "" ...
..$ speaker :'data.frame': 1 obs. of 3 variables:
.. ..$ xmin : num 0
.. ..$ xmax : num 244
.. ..$ value: chr "1"
..$ ortho :'data.frame': 101 obs. of 3 variables:
.. ..$ xmin : num [1:101] 0 0.427 3.571 4.3 7.659 ...
.. ..$ xmax : num [1:101] 0.427 3.571 4.3 7.659 8.341 ...
.. ..$ value: chr [1:101] "_" "voilà donc vous avez bien perçu même intuitivement qu'y avait euh" "_" "des choses issues de radios commerciales ou de radios classiques etcaetera" ...
..$ rection :'data.frame': 117 obs. of 3 variables:
.. ..$ xmin : num [1:117] 0 0.427 0.752 0.952 7.659 ...
.. ..$ xmax : num [1:117] 0.427 0.752 0.952 7.659 8.341 ...
.. ..$ value: chr [1:117] "" "md" "md" "urv" ...
..$ sequences :'data.frame': 183 obs. of 3 variables:
.. ..$ xmin : num [1:183] 0 0.427 0.752 0.952 1.942 ...
.. ..$ xmax : num [1:183] 0.427 0.752 0.952 1.942 2.848 ...
.. ..$ value: chr [1:183] "" "md" "md" "SV" ...
..$ boundary :'data.frame': 0 obs. of 3 variables:
.. ..$ xmin : num(0)
.. ..$ xmax : num(0)
.. ..$ value: chr(0)
..$ contours :'data.frame': 1143 obs. of 3 variables:
.. ..$ xmin : num [1:1143] 0 0.427 0.562 0.752 0.952 ...
.. ..$ xmax : num [1:1143] 0.427 0.562 0.752 0.952 1.022 ...
.. ..$ value: chr [1:1143] "" "" "C" "" ...
..$ bdu-auto :'data.frame': 53 obs. of 3 variables:
.. ..$ xmin : num [1:53] 0 0.427 7.659 8.341 18.861 ...
.. ..$ xmax : num [1:53] 0.427 7.659 8.341 18.861 19.624 ...
.. ..$ value: chr [1:53] "" "bdu-1-c_C" "" "bdu-2-s_C" ...
..$ EPG :'data.frame': 54 obs. of 3 variables:
.. ..$ xmin : num [1:54] 0 0.427 0.952 8.341 8.806 ...
.. ..$ xmax : num [1:54] 0.427 0.952 8.341 8.806 19.624 ...
.. ..$ value: chr [1:54] "" "PGC-R" "" "PGC-R" ...
$ cnf_02_ch :List of 17
..$ phones :'data.frame': 2304 obs. of 3 variables:
.. ..$ xmin : num [1:2304] 0 0.001 0.219 0.866 0.886 ...
.. ..$ xmax : num [1:2304] 0.001 0.219 0.866 0.886 0.944 ...
.. ..$ value: chr [1:2304] "_" "n" "y" "m" ...
..$ syll :'data.frame': 1080 obs. of 3 variables:
.. ..$ xmin : num [1:1080] 0 0.001 0.866 1 1.089 ...
.. ..$ xmax : num [1:1080] 0.001 0.866 1 1.089 1.239 ...
.. ..$ value: chr [1:1080] "_" "na~" "m9~t" "" ...
..$ delivery :'data.frame': 1080 obs. of 3 variables:
.. ..$ xmin : num [1:1080] 0 0.001 0.866 1 1.089 ...
.. ..$ xmax : num [1:1080] 0.001 0.866 1 1.089 1.239 ...
.. ..$ value: chr [1:1080] "_" "" "" "" ...
..$ words :'data.frame': 784 obs. of 3 variables:
.. ..$ xmin : num [1:784] 0 0.219 0.866 1.089 1.239 ...
.. ..$ xmax : num [1:784] 0.219 0.866 1.089 1.239 1.691 ...
.. ..$ value: chr [1:784] "_" "humains" "maintenant" "la" ...
..$ link :'data.frame': 784 obs. of 3 variables:
.. ..$ xmin : num [1:784] 0 0.219 0.866 1.089 1.239 ...
.. ..$ xmax : num [1:784] 0.219 0.866 1.089 1.239 1.691 ...
.. ..$ value: chr [1:784] "_" "" "" "" ...
..$ POS :'data.frame': 784 obs. of 3 variables:
.. ..$ xmin : num [1:784] 0 0.219 0.866 1.089 1.239 ...
.. ..$ xmax : num [1:784] 0.219 0.866 1.089 1.239 1.691 ...
.. ..$ value: chr [1:784] "_" "ADJ:adj" "ADV:adv" "DET:def" ...
..$ disfluency :'data.frame': 785 obs. of 3 variables:
.. ..$ xmin : num [1:785] 0 0.219 0.866 1.089 1.239 ...
.. ..$ xmax : num [1:785] 0.219 0.866 1.089 1.239 1.691 ...
.. ..$ value: chr [1:785] "SIL:l" "" "" "CORR-B" ...
..$ discourse :'data.frame': 728 obs. of 3 variables:
.. ..$ xmin : num [1:728] 0 0.219 0.866 1.089 1.239 ...
.. ..$ xmax : num [1:728] 0.219 0.866 1.089 1.239 1.691 ...
.. ..$ value: chr [1:728] "SIL:l" "" "" "" ...
..$ boundary-dismo:'data.frame': 728 obs. of 3 variables:
[...]
提前致谢!
答案 0 :(得分:1)
假设你的列表结构有些规律,你可以使用melt
然后使用任何标准的“split / apply / combine”样式工具(我们在这里使用data.table
) 。另外,我修改了我正在申请的函数是xmin-xmax
的总和,这样输出就很好而简短:
library(data.table)
library(reshape2) # for `melt`
dt.mlt <- data.table(melt(my.list, id.vars=c("xmin", "xmax", "value")))
dt.mlt[, list(sum.duratin=sum(xmax - xmin)), by=list(L1, L2)]
产生:
L1 L2 sum.duratin
1: cnf_01ch phones -1.36252011
2: cnf_01ch words 0.21568715
3: cnf_01ch POS -0.40070784
4: cnf_01ch discourse -1.02992545
5: cnf_01ch link 1.50889336
6: cnf_01be phones -0.34931685
7: cnf_01be words -0.27385093
8: cnf_01be POS 0.70835139
9: cnf_01be discourse 0.84285652
10: cnf_01be link -2.76651670
11: cnf_01fr phones 0.02533455
12: cnf_01fr words 3.25470332
13: cnf_01fr POS 0.97342401
14: cnf_01fr discourse -1.00580501
15: cnf_01fr link -0.15233178
所以我将一个函数(或者在这种情况下只是sum(xmax - xmin)
)应用到我的嵌套列表my.list
中的每个数据帧,并将结果输出为前两列指示的数据框统计数据来自哪个数据框。这是我使用的数据(两个深层嵌套列表):
col.names <- c("phones", "words", "POS", "discourse", "link")
my.list <-
setNames(
replicate(
3,
setNames(
replicate(5, data.frame(xmin=runif(10), xmax=runif(10), value=runif(10)), s=F),
col.names
),
s=F
),
paste0(c("cnf_01"), c("ch", "be", "fr"))
)
请注意,我从 Joran to this question 的最新答案中偷了这个。
答案 1 :(得分:0)
结论:如果您有嵌套List,请进行嵌套lapply! _ 强>
lapply(yourdata, function(x) lapply(x, list.dur))