我在Excel工作表中有以下数据!
我需要计算给定cover_type的给定高程发生的次数。例如,elevation = 1905对cover_type = 6发生两次,对cover_type = 3发生一次。我需要做同样的Aspect,Slope,Horizontal_Distance_To_Hydrology,Vertical_Distance_To_Hydrology,Horizontal_Distance_To_Roadways,Hillshade_9am,Hillshade_Noon,Hillshade_3pm,Horizontal_Distance_To_Fire_Points,Soil,Wilderness_Area。
我将使用计数来计算每列的熵。我需要执行这个公式。
答案 0 :(得分:0)
您可以执行以下操作
import pandas as pd
df = pd.read_csv('train_data.csv')
grouped = df[['elevation','cover_type']].groupby(['elevation','cover_type'], as_index = False, sort = False)['cover_type'].count()