我有多个文件,我想基本上合并(.txt和.csv)。它们都是非常不同的表,所以我基本上希望有大约30张不同的表,然后能够保存那个文件并在以后编制索引。
我在尝试找到最有效的方法时遇到了麻烦,因为我的大多数搜索都试图将()文件合并在一起,这是不可能的,因为这个数据文件集合是唯一的。 / p>
最大的问题是每个数据框都不同,列名和行数不同,与已提出的类似问题不同。
将我拥有的表合并到一个数组中并保存它的最佳方法是什么?
编辑: 为了添加更多细节,我基本上有三种不同类型的数据框来自多个不同的文件:
.csv文件,表格标题为“X”“gene”“baseMean”“log2FoldChange”“lfcSE”“stat”
“pvalue”“padj”“TuLob”“TuDu”
一种带头文件的“.txt”文件“hgnc_symbol”“ensembl_gene_id”“ensembl_transcript_id”“ensembl_peptide_id”
“band”“chromosome_name”“start_position”“end_position”
“transcript_start”“transcript_end”“description”“go_id”
“name_1006”“transcript_source”“status”
和第二种.txt文件,标题为“hgnc_symbol”“ensembl_gene_id”“ensembl_transcript_id”“ensembl_peptide_id”
“band”“chromosome_name”“start_position”“end_position”
“transcript_start”“transcript_end”“description”“name_1006”
“transcript_source”“status”
同样,我不是要尝试合并这些表,只是将它们保存在一个堆栈或三维数组中作为一个文件,以便稍后打开并编入索引
答案 0 :(得分:0)
我认为您要做的是使用save
函数以R的内部格式保存数据。
df1 <- data.frame(x=rnorm(100))
df2 <- data.frame(y=rnorm(10), z=rnorm(10))
为我们提供两个具有不同列,行等的数据框。
save(df1, df2, file="agg.RData")
将其保存到agg.RData
你以后可以做一个
load("agg.RData")
head(df1)
...
另请参阅attach
,它只执行load
执行的操作,只是懒惰,因此只有在您尝试访问它们时才会加载对象。
最后,您可以通过指定load
:
agg <- new.env()
load("agg.RData", agg)
head(agg$df1)
...