我的数据有一个“国家/地区”列和一个“点击广告”列,该列具有针对客户广告偏好的布尔值。我想对列表进行分组,以查看基于国家/地区的点击次数。然后,我想减少(4,8)点击,代表每个国家/地区的最高点击。我想剪切这些行并创建一个新列表,同时保留行的所有功能
ad_country=ad_data.groupby('Country')
Country_sum=[]
for i in range(4,8):
if ad_country['Clicked on Ad']==i:
Country_sum.append(iloc[ad_country])
示例
每日>>>>>年龄>>每日互联网使用情况>>>国家>>>>单击广告(布尔值)
68.95 >>>>>> 35 >>>>>> 256.09 >>>>>>>>>突尼斯>>>>>>>>>>>> 0
75,78 >>>>>> 28 >>>>>>>> 214.9 >>>>>>>>>>墨西哥>>>>>>>>>>>>>> 1
我的结果应该有一个数据框,其中包含以国家/地区名称作为索引的行,同时总点击了广告功能总计和其他功能(尽管对于分析而言并不重要)在列中的总计值。
答案 0 :(得分:0)
ad_country = ad_data.groupby('Country')['Clicked on Ad']。sum()
我可以使用groupby和sum()获得国家列表。我还可以看到最大样本数w count()
我仍在寻找是否可以对groupby对象进行切片,以获得value_counts()之类的最大计数。