使用pandas基于Cover_Type计算数据

时间:2015-03-07 17:36:21

标签: pandas entropy

我在Excel工作表中有以下数据!enter image description here

我需要计算给定cover_type的给定高程发生的次数。例如,elevation = 1905对cover_type = 6发生两次,对cover_type = 3发生一次。我需要做同样的Aspect,Slope,Horizo​​ntal_Distance_To_Hydrology,Vertical_Distance_To_Hydrology,Horizo​​ntal_Distance_To_Roadways,Hillshade_9am,Hillshade_Noon,Hillshade_3pm,Horizo​​ntal_Distance_To_Fire_Points,Soil,Wilderness_Area。

我将使用计数来计算每列的熵。我需要执行这个公式。 enter image description here

1 个答案:

答案 0 :(得分:0)

您可以执行以下操作

import pandas as pd
df = pd.read_csv('train_data.csv')
grouped = df[['elevation','cover_type']].groupby(['elevation','cover_type'], as_index = False, sort = False)['cover_type'].count()