如何合并多个数据集并将注释附加到新变量

时间:2013-08-22 07:51:50

标签: r merge dataset text-processing

我有多个数据集(数百),时间序列数据如下:

"File name";"18%MC001.TXT";"V 1.24"
"Title comment";"231020124070"
"Trigger Time";"'13-04-05 13:53:51"
"Ch";"A 1- 1";"A 1- 2";"A 1- 3";"A 1- 4";"A 1- 5";"A 1- 6";"A 1- 7";"A 1- 8";"A 1- 9";"A 1-10";"A 1-11";"A 1-12";"A 1-13";"A 1-14";"A 1-15";"A 2- 1";"A 2- 2";"A 2- 4";
"Mode";"Voltage";"Voltage";"Voltage";"Voltage";"Voltage";"Voltage";"Voltage";"Voltage";"Voltage";"Voltage";"Voltage";"Voltage";"Voltage";"Voltage";"Voltage";"Voltage";"Voltage";"Voltage";
"Range";"10V";"10V";"10V";"10V";"10V";"10V";"10V";"10V";"10V";"10V";"10V";"10V";"10V";"10V";"10V";"10V";"10V";"10V";
"Comment";"Prove1";"Prove1";"Prove2";"Prove2";"Prove3";"Prove3";"Prove4";"Prove4";"Prove5";"Prove5";"Prove6";"Prove6";"Prove7";"Prove7";"Prove8";"Prove8";"Prove9";"Prove9";
"Scaling";"Off";"Off";"Off";"Off";"Off";"Off";"Off";"Off";"Off";"Off";"Off";"Off";"Off";"Off";"Off";"Off";"Off";"Off";
"Ratio";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";" 1.00000E+00";
"Offset";" 0.00000E+00";" 0.00000E+00";" 0.00000E+00";" 0.00000E+00";" 0.00000E+00";" 0.00000E+00";" 0.00000E+00";" 0.00000E+00";" 0.00000E+00";" 0.00000E+00";" 0.00000E+00";" 0.00000E+00";" 0.00000E+00";" 0.00000E+00";" 0.00000E+00";" 0.00000E+00";"-3.00000E+00";"-3.00000E+00";
"Time";"1-1[V]";"1-2[V]";"1-3[V]";"1-4[V]";"1-5[V]";"1-6[V]";"1-7[V]";"1-8[V]";"1-9[V]";"1-10[V]";"1-11[V]";"1-12[V]";"1-13[V]";"1-14[V]";"1-15[V]";"2-1[V]";"2-2[V]";"2-4[V]";"Event";
 0,000000000E+00; 8,69500E-01; 4,80350E+00; 3,76000E-01; 7,34950E+00; 5,60750E+00; 4,66450E+00; 8,31600E+00; 8,13950E+00; 6,66050E+00; 9,69700E+00; 1,81750E+00; 1,10900E+00; 6,82400E+00; 4,04900E+00; 9,82150E+00; 6,98000E+00; 2,94750E+00; 4,08750E+00;0;
 1,000000000E+01; 8,69500E-01; 4,80350E+00; 3,76000E-01; 7,34950E+00; 5,60750E+00; 4,66500E+00; 8,31600E+00; 8,13950E+00; 6,66050E+00; 9,69700E+00; 1,81700E+00; 1,10900E+00; 6,82400E+00; 4,04900E+00; 9,82150E+00; 6,98000E+00; 2,94750E+00; 4,08800E+00;0;

每个数据集都有一个唯一的日期时间值(Trigger Time),该值被视为注释。每个数据集还有一个Time变量,表示自Trigger Time中的日期时间以来经过的时间。我想要做的是计算每个观察的日期时间,以便我可以使用 R 统计数据将数据绘制为时间序列。有没有办法实现这个目标?合并数据集并附加注释不一定必须在 R 中完成。

我使用list.filesllply函数as suggested by Matt Bogard in this blog post R 统计信息中的所有文件导入了数据。以下是我在下面的示例中使用的数据集的link

require(plyr)
filenames <- list.files(path = "C:/Users/bys/Desktop/log-trykk-vinkelrett/data-test/", full.names = TRUE)
import.list <- llply(filenames, read.csv)

以下是使用dput的{​​{3}}。

我想我需要做类似于link the output from import.list的事情,但到目前为止,我尝试提取Trigger Time并为每个观察添加Trigger Time的新变量都是不成功的。

使用Open Refine解决问题会导致程序在每次尝试加载所有数据集时崩溃。 R 可能不是处理文本文件的最佳工具,但我没有使用Python,Ruby或类似语言的经验。

0 个答案:

没有答案