我有超过200个CSV文件。每个文件都有150多列和1000行。每个文件都按产品名称命名。 每个文件都为数据集提供了不同列中不同类别的不同项的标记。其中一列是整个类别中每个项目的总使用量。以下是数据集的示例:
Values A B C
1 Y
2 Y
3 Y Y
4 Y
昨天我问了一个问题,我收到了关于如何获得以下结果的帮助。
Count Sum
A 2 4
B 1 2
C 2 7
基本上我希望Count Column给我A,B和C的“y”数,以及Sum列,每次在A列中有“Y”时,我会从Usage列中得到总和,B和C
现在我对第2步有疑问 - 我已将所有文件都放入文件夹中。我想要做的是使用上面的结果,将其应用于每个文件,然后按文件和类别分组答案。例如
File 1 Count A Sum A Count B Sum B Count C Sum C
File 2 Count A Sum A Count B Sum B Count C Sum C and so on.
我怎样才能在R中这样做?我搜索了论坛,发现循环很有帮助,但我不确定如何将结果合并为一个。