我当前的数据框如下:
df0:
reqs code hostname file_path filename extension date
51723330 404 services.compay.com /folderA/folderB/ JPG 2018-09-13
50927945 404 services.company2.com /folderA/folderB/ GIF 2018-09-15
50781228 404 services.companyB.com /folderA/folderB/ JPG 2018-09-14
50554338 404 services.companyC.com /folderA/folderB/...
我想做的就是得到一个像这样的表,其中有一个列是基于请求数的请求百分比(%reqs)
reqs code hostname file_path filename extension date %reqs
51723330 404 services.compay.com /folderA/folderB/ JPG 2018-09-13 12%
50927945 404 services.company2.com /folderA/folderB/ GIF 2018-09-15 10%
50781228 404 services.companyB.com /folderA/folderB/ JPG 2018-09-14 11%
50554338 404 services.companyC.com /folderA/folderB/... 10%
...
..
.
我尝试遵循此步骤,但有些迷路: Pandas percentage of total with groupby
df1 = df0.groupby(['code','hostname','file_path','filename','file_extension','date']).agg({'reqs': 'sum'})
df2 = df1.groupby(level=0).apply(lambda x: 100* x/float(x.sum()))
看起来好像也代表了%,我想我还需要一步,一旦得到%,就需要将其合并回df0 这产生了一些奇怪的结果。