熊猫总数矩阵百分比

时间:2019-01-14 18:23:47

标签: python pandas dataframe pivot-table pandas-groupby

嗨,我有一个熊猫矩阵,需要在上面找到百分数。 目的是找出用户在某个日期使用了多少产品。基本上是为了找出该日期是什么日期,该用户使用了类别的百分比。

What I got Excel to do 我通过使用类别中每个用户的外观计数并将其除以该类别的总ID的计数来在Excel中完成这项工作

我不知道该如何在Pandas中表示或如何工作以在文档中查找如何做到这一点。您能帮我在《熊猫矩阵》中获得类似的东西吗?

我正在处理的

个领域: “类别”,“ ID”,“用户”,“发生时间”

数量不多是因为我被困住了,到目前为止,我有:

func = lambda x: 100*x.count()/df.shape[1]

counts = df.pivot_table(index=["Category", 'User', 'ID'], values = ["Occurred On"], aggfunc=func, margins=True, fill_value=0)
print(counts)

有人可以指出我需要阅读文档或此处其他文章的正确方向,以了解如何在此矩阵上进行数学运算吗?

编辑#1:数据框如下所示:

 TextFileReader = pd.read_csv(csv_input, sep=',',  names = ['Category', 'ID', 'User', 'Occurred On'])

lookup = pd.read_csv('lookup.csv', sep=',')
df= pd.merge(lookup, keep, left_on='user', right_on='user', how='inner')

数据帧输出:

Category                                                        User       ID #Count      Occurred On #%
Category 1 ___________________...                              1@work.com  1543841       16.666667
                                                                           1543842       16.666667
                                                                           1543843       16.666667
                                                                           1543844       16.666667
                                                                           1543845       16.666667
                                                                           1543846       16.666667
                                                                           1543847       16.666667
                                                                           1543848       16.666667
                                                                           1543849       16.666667
                                                                           1543850       16.666667
                                                                           1543851       16.666667
                                                                           1543852       16.666667
                                                                           1543853       16.666667
                                                                           1543854       16.666667
                                                                           1543855       16.666667
                                                                           1543856       16.666667
                                                                           1543857       16.666667
                                                                           1543858       16.666667
                                                                           1543859       16.666667
                                                                           1543860       16.666667
                                                                           1543861       16.666667
                                                                           1543862       16.666667
                                                                           1543863       16.666667
Category2 ...                                                   b@work.com 6064691       16.666667
                                                                           6064692       16.666667
                                                                           6064693       16.666667
                                                                           6064694       16.666667

0 个答案:

没有答案