Question

我试图找出一种更好的方法从大量文件中提取数据，对某些数据运行额外的计算，最后将其格式化为电子表格应用程序可读的内容。以下是我目前的做法，但我确信必须有一个更简单的方法。

首先，我创建一个定义来搜索文件并提取数据。我使用定义，因为有时数据将从几个位置编译。我是通过混合使用正则表达式来完成这一切的。如果需要，可以采用不同的格式。结果如下：

RawData=
[[M1,A1,305.91,288.12,Variable_M1_A1],
[M1,A2,319.07,303.70,Variable_M1_A2],
[M2,A1,237437.32,191460.91,Variable_M2_A1],
[M2,A2,270773.28,192581.05,Variable_M2_A2]]

我希望对某些数据进行组织，以便从变量A和M创建网格，然后将列中的数据放在正确的网格位置。实际上看起来像一个简单的二维矩阵，第一行和第一列表示变量。

csv文件应该是什么样的：

Placeholder,A1,A2
M1,Variable_M1_A1,Variable_M1_A2
M2,Variable_M2_A1,Variable_M2_A2

我目前正在做的是创建一个空矩阵（在本例中为3x3），调用Result然后运行以下代码。当变量匹配时，它基本上遍历所有行和所有变量，它从ResultData中为Result矩阵分配一个值。

MVar=[M1,M2]
AVar=[A1,A2]
for a in range(len(RawData):
    for b in range(len(MVar)):
        for c in range(len(AVar)):
            if RawData[a][0]==Mvar[b] and RawData[a][1]==AVar[c]:
                Result[b+1][c+1]=RawData[a][4]

我编写了一段代码，它将采用RawData矩阵并根据M1和A1的所有可能组合创建Result矩阵。如果我想将其输出到.csv，我只需使用csv.writer。因此，如果我只想组织已经存在的数据，这将非常有用。但是，当我想用数据进行计算时 - 例如生成另一个基于RawData中未在矩阵中结束的值的列 - 变得很困难。例如，获取csv文件输出的样子：

Placeholder,A1,A2,NewA
M1,Variable_M1_A1,Variable_M1_A2,(RawData[0][3]*RawData[1][2]) 
M2,Variable_M2_A1,Variable_M2_A2,(RawData[2][3]*RawData[3][2])

请注意，计算数据需要相同的M值但A值不同。虽然可以做到这一点，但很快就会变得非常复杂。

有更简单的方法吗？

编辑：使用以下方法自动生成M和A列表：

 [MethodList[i] for i,x in enumerate(MethodList) if x not in MethodList[i+1:]]

这似乎更容易使用，但它仍然是一个卷积过程！

Answer 1

这是用for循环和相应的if条件完成的。我仍然相信有更好的方法，但完全有可能这样做。

有效地将数据组织成可读的.csv格式

1 个答案: