我在单独的文件夹中有数千个文件。我需要把它们绑在一起。我知道如何使用list.files
中的R
函数阅读所有这些文件。但这个问题并不复杂。在将所有文件绑定到R中的单个文件之前,我需要编辑每个文件。以下是第一个文件的示例数据:
Data <- read.table(file=FileList[1], header=FALSE, sep=",")[,c(1,2,6)]
head(Data)
V1 V2 V6
20MICRONS 20110701 47.40
3IINFOTECH 20110701 47.30
3MINDIA 20110701 4184.75
A2ZMES 20110701 253.15
AANJANEYA 20110701 368.45
AARTIDRUGS 20110701 134.35
在此数据中,V1
是公司名称,V2
是日期(前四位代表年份,后两位代表月份,后两位代表显示日期),V6
是价格。整个列V2
中的日期相同,因为每个文件仅包含单日的数据。所以,我想首先将我的数据转换成以下格式:
Date 20MICRONS 3IINFOTECH 3MINDIA A2ZMES AANJANEYA AARTIDRUGS
20110701 47.40 47.30 4184.75 253.15 368.45 134.35
然后我想按公司名称将所有文件合并为单个数据文件。所以,我想要最终输出必须喜欢这个:
Date 20MICRONS 3IINFOTECH 3MINDIA A2ZMES AANJANEYA AARTIDRUGS
20110701 47.40 47.30 4184.75 253.15 368.45 134.35
20110702 48.95 50.23 4101.36 256.32 370.48 136.95
其中第二行表示来自第二个文件的数据(第一行是列名)。
另一个问题是每个文件中的行数可能不同。有可能一个文件包含1000行,而文件2可能包含1002.文件3可能包含“Wipro”(公司名称)的数据,该数据未包含在前两个文件中。所以,现在最终输出必须如下所示:
Date 20MICRONS 3IINFOTECH 3MINDIA A2ZMES AANJANEYA AARTIDRUGS Wipro
20110701 47.40 47.30 4184.75 253.15 368.45 134.35 NA
20110702 48.95 50.23 4101.36 256.32 370.48 136.95 NA
20110703 50 52 4000.32 250.32 372.36 152.32 326