我有一个pandas
DataFrame
,其中的行表示对称矩阵分量。
sxx syy szz sxy syz sxz
NodeID time
1500000 20921.0 2504729.0 -16524560.0 -3966213.0 5058878.0 8026349.0 390275.7
20923.0 2541577.0 -16459500.0 -3930280.0 5047995.0 8019404.0 393201.3
20925.0 2582004.0 -16384690.0 -3891037.0 5035703.0 8011226.0 396850.2
20927.0 2618859.0 -16313310.0 -3855520.0 5024095.0 8003384.0 400578.7
20933.0 2703961.0 -16133460.0 -3773937.0 4995101.0 7985394.0 411183.2
矩阵如下所示。
[[sxx, sxy, sxz],
[sxy, syy, syz],
[sxz, syz, szz]]
从每一行计算特征值的最快方法是什么?
我尝试在每一行上“应用” np.linalg.eigvalsh
。但是,当我接近一百万行时,它花费了相当长的时间。
修改
要提供完整的上下文,我还应该提到此DataFrame
是对象定义的一部分。 object.df
是DataFrame
。下面是相关代码。
def s1(self):
"""Returns the first principal stress for every node every timepoint"""
return self.df.apply(principal, axis=1, label="s1")
def principal(s, label):
principals = np.linalg.eigvalsh(
np.array(
[s.sxx, s.sxy, s.sxz, s.sxy, s.syy, s.syz, s.sxz, s.syz, s.szz]
).reshape(3, 3)
)
if label.lower() == "s3":
return principals[0]
elif label.lower() == "s2":
return principals[1]
elif label.lower() == "s1":
return principals[2]
else:
raise ValueError("Invalid Input, choose from s1, s2, or s3.")
答案 0 :(得分:2)
您可以设置列的顺序以生成视图,然后使用.values
(比np.array(..)
更快)将其传递到数组,然后将eigvalsh
应用于{{1 }}数组:
(n, 3, 3)