Question

我正在将以下代码应用于numpy数组：

mad_array = []
for j in data:
    df = pd.DataFrame(j)
    print(j)
    mad_array.append(df.mad())

print(mad_array)

输出数组如下：

[0    10.0   dtype: float64, 
 0    18.875 dtype: float64, 
 0    18.375 dtype: float64]

是否有一种方法可以剥离输出中附加的0 （不确定来自哪里）和datatype属性，因此我的输出数组看起来像：

[10.0 18.875 18.375]

我不确定这是来自numpy还是DataFrame的行为。

Answer 1

您可以使用df.mad().values返回系列/数据框的值。零是来自系列/数据帧的索引，而dtype是系列/数据帧的字符串表示。通过使用values属性从mad（）方法转换返回的数据帧/序列，您只附加了结构的值部分。

Answer 2

根据评论的建议使用

df.mad().values

摆脱dataType和0 index

您的mad_array数组现在应如下所示：

[array([10.]), array([18.875]), array([18.375])]

像这样选择每个数组的第一个索引

(df.mad().values)[0]

结果

[10.0, 18.875, 18.375]