熊猫加总%栏

时间:2018-09-20 21:18:37

标签: pandas jupyter-notebook

我当前的数据框如下:

df0:

reqs    code    hostname    file_path   filename    extension   date
51723330    404 services.compay.com /folderA/folderB/   JPG     2018-09-13 
50927945    404 services.company2.com   /folderA/folderB/   GIF     2018-09-15 
50781228    404 services.companyB.com   /folderA/folderB/   JPG     2018-09-14 
50554338    404 services.companyC.com   /folderA/folderB/...    

我想做的就是得到一个像这样的表,其中有一个列是基于请求数的请求百分比(%reqs)

    reqs    code    hostname    file_path   filename    extension   date        %reqs
    51723330    404 services.compay.com /folderA/folderB/   JPG     2018-09-13  12%
    50927945    404 services.company2.com   /folderA/folderB/   GIF     2018-09-15  10%
    50781228    404 services.companyB.com   /folderA/folderB/   JPG     2018-09-14  11%
    50554338    404 services.companyC.com   /folderA/folderB/...                    10%
...
..
.

我尝试遵循此步骤,但有些迷路: Pandas percentage of total with groupby

df1 = df0.groupby(['code','hostname','file_path','filename','file_extension','date']).agg({'reqs': 'sum'})
df2 = df1.groupby(level=0).apply(lambda x: 100* x/float(x.sum()))

看起来好像也代表了%,我想我还需要一步,一旦得到%,就需要将其合并回df0 这产生了一些奇怪的结果。

0 个答案:

没有答案