我有一个包含十列和超过1000行数据的Dataframe。我循环遍历每个标题并计算两个标题之间的差异。这导致数据帧是一列和N行。我想根据某些标准运行统计数据。比如给我一组大于零的数据的统计数据。 所以样本是这样的。
TempDF = df[Header] - df[SecondHeader]
if (TempDF.median()>TempDF.mean()):
print (df(TempDF[]>0).describe())
这会生成一个Key Error : True
并且不会向我显示任何内容..请帮助..我正在尝试根据特定条件生成有关结果数据框的统计信息。
我想知道如何实现这一目标。谢谢。
答案 0 :(得分:2)
您没有正确过滤Series对象。以下是如何执行此操作的示例:
from pandas import DataFrame
df = DataFrame([[1111,22,33],[140,25,36],[47,58,69]])
df.columns=['Header','SecondHeader','ThirdHeader']
TempDF = df['Header'] - df['SecondHeader']
if TempDF.median() < TempDF.mean():
print TempDF[TempDF>0].describe()