应用数据框方法后,在numpy数组末尾有额外的数据类型

时间:2019-02-09 23:45:29

标签: python numpy dataframe

我正在将以下代码应用于numpy数组:

mad_array = []
for j in data:
    df = pd.DataFrame(j)
    print(j)
    mad_array.append(df.mad())

print(mad_array) 

输出数组如下:

[0    10.0   dtype: float64, 
 0    18.875 dtype: float64, 
 0    18.375 dtype: float64]

是否有一种方法可以剥离输出中附加的0 (不确定来自哪里)datatype属性,因此我的输出数组看起来像:

[10.0 18.875 18.375]

我不确定这是来自numpy还是DataFrame的行为。

2 个答案:

答案 0 :(得分:2)

您可以使用df.mad().values返回系列/数据框的值。零是来自系列/数据帧的索引,而dtype是系列/数据帧的字符串表示。通过使用values属性从mad()方法转换返回的数据帧/序列,您只附加了结构的值部分。

答案 1 :(得分:1)

根据评论的建议使用

df.mad().values

摆脱dataType0 index

您的mad_array数组现在应如下所示:

[array([10.]), array([18.875]), array([18.375])]

像这样选择每个数组的第一个索引

(df.mad().values)[0]

结果

[10.0, 18.875, 18.375]