Question

我在Excel工作表中有以下数据！ enter image description here

我需要计算给定cover_type的给定高程发生的次数。例如，elevation = 1905对cover_type = 6发生两次，对cover_type = 3发生一次。我需要做同样的Aspect，Slope，Horizontal_Distance_To_Hydrology，Vertical_Distance_To_Hydrology，Horizontal_Distance_To_Roadways，Hillshade_9am，Hillshade_Noon，Hillshade_3pm，Horizontal_Distance_To_Fire_Points，Soil，Wilderness_Area。

我将使用计数来计算每列的熵。我需要执行这个公式。 enter image description here

Answer 1

您可以执行以下操作

import pandas as pd
df = pd.read_csv('train_data.csv')
grouped = df[['elevation','cover_type']].groupby(['elevation','cover_type'], as_index = False, sort = False)['cover_type'].count()

使用pandas基于Cover_Type计算数据

1 个答案: