Question

我当前的数据框如下：

df0：

reqs    code    hostname    file_path   filename    extension   date
51723330    404 services.compay.com /folderA/folderB/   JPG     2018-09-13 
50927945    404 services.company2.com   /folderA/folderB/   GIF     2018-09-15 
50781228    404 services.companyB.com   /folderA/folderB/   JPG     2018-09-14 
50554338    404 services.companyC.com   /folderA/folderB/...

我想做的就是得到一个像这样的表，其中有一个列是基于请求数的请求百分比（％reqs）

    reqs    code    hostname    file_path   filename    extension   date        %reqs
    51723330    404 services.compay.com /folderA/folderB/   JPG     2018-09-13  12%
    50927945    404 services.company2.com   /folderA/folderB/   GIF     2018-09-15  10%
    50781228    404 services.companyB.com   /folderA/folderB/   JPG     2018-09-14  11%
    50554338    404 services.companyC.com   /folderA/folderB/...                    10%
...
..
.

我尝试遵循此步骤，但有些迷路： Pandas percentage of total with groupby

df1 = df0.groupby(['code','hostname','file_path','filename','file_extension','date']).agg({'reqs': 'sum'})
df2 = df1.groupby(level=0).apply(lambda x: 100* x/float(x.sum()))

看起来好像也代表了％，我想我还需要一步，一旦得到％，就需要将其合并回df0 这产生了一些奇怪的结果。

熊猫加总％栏

0 个答案: