嗨,我有一个熊猫矩阵,需要在上面找到百分数。 目的是找出用户在某个日期使用了多少产品。基本上是为了找出该日期是什么日期,该用户使用了类别的百分比。
What I got Excel to do 我通过使用类别中每个用户的外观计数并将其除以该类别的总ID的计数来在Excel中完成这项工作
我不知道该如何在Pandas中表示或如何工作以在文档中查找如何做到这一点。您能帮我在《熊猫矩阵》中获得类似的东西吗?
我正在处理的个领域: “类别”,“ ID”,“用户”,“发生时间”
数量不多是因为我被困住了,到目前为止,我有:
func = lambda x: 100*x.count()/df.shape[1]
counts = df.pivot_table(index=["Category", 'User', 'ID'], values = ["Occurred On"], aggfunc=func, margins=True, fill_value=0)
print(counts)
有人可以指出我需要阅读文档或此处其他文章的正确方向,以了解如何在此矩阵上进行数学运算吗?
编辑#1:数据框如下所示:
TextFileReader = pd.read_csv(csv_input, sep=',', names = ['Category', 'ID', 'User', 'Occurred On'])
lookup = pd.read_csv('lookup.csv', sep=',')
df= pd.merge(lookup, keep, left_on='user', right_on='user', how='inner')
数据帧输出:
Category User ID #Count Occurred On #%
Category 1 ___________________... 1@work.com 1543841 16.666667
1543842 16.666667
1543843 16.666667
1543844 16.666667
1543845 16.666667
1543846 16.666667
1543847 16.666667
1543848 16.666667
1543849 16.666667
1543850 16.666667
1543851 16.666667
1543852 16.666667
1543853 16.666667
1543854 16.666667
1543855 16.666667
1543856 16.666667
1543857 16.666667
1543858 16.666667
1543859 16.666667
1543860 16.666667
1543861 16.666667
1543862 16.666667
1543863 16.666667
Category2 ... b@work.com 6064691 16.666667
6064692 16.666667
6064693 16.666667
6064694 16.666667