我有一个程序可以检查CSV文件中的数据 - 这些文件通常有5组不同的观察长度。当我运行少于5组(比如4组)的数据时,剩余组的数据仍然会出现在计算中。典型的数据集将如下所示,称之为" A":
Group 1 Group 2 Group 3 Group 4 Group 5
2548.64 2879.32 2964.61 2567.65 2548.69
2635.78 2954.37 3215.49 2867.98 2897.65
2534.61 2497.64 3015.87 2345.98 2478.66
2897.91 3159.67 2467.99 2599.08 2499.37
3079.97 2664.82 2311.64 2849.78 2888.54
2864.55 2999.15 2657.81
2499.88 2754.65
3097.45 2665.39
非典型数据集将如下所示,称之为" B":
Group 1 Group 2 Group 3 Group 4
2651.32 2941.3 2848.97 2599.11
2864.22 2489.67 2957.34 2987.46
2687.22 2999.25 3102.87
2956.34 2677.1 2877.61
2488.77
如果我在B上进行任何操作,来自A组5的数据将填写"缺失"来自B的数据。在运行B之前,从A中清除数据的最佳方法是什么?
答案 0 :(得分:0)
您没有指定哪些对象包含Group 1-5数据,因此我假设您在读取“A”csv文件后,为每个组创建一个单独的对象,称为g1
,g2
,g3
,g4
,g5
。然后,当您读入“B”csv文件时,您还为每个组创建一个单独的对象,并回收您在“A”,g1
,g2
,{{1}中使用的名称},g3
。在这种情况下,您可以在读取“B”中的数据之前使用g4
函数清除“A”中的信息。
rm()