我有一个名为relevant_URT_data的pandas Dataframe,如下所示:
测试MRN编号ResCat
12 AP支付付款详情URT INC3778700 0
33 AP付款付款明细NaN INC3783080 0
72 AP支付付款明细URT INC3782671 0
150 AP质量保证付款状态URT INC3778770 0
178 PR HBS查询NaN INC3776742 1
192 AP质量保证付款状态NaN INC3778547 0
315 AP质量保证付款状态URT INC3780548 0
328 PR会计W-2表格URT INC3782016 0
355 AP一般提交付款发票URT INC3781884 0
374 AP一般查询NaN INC3775944 0
我使用以下代码通过测试对数据进行分组 - 请参见下图。
test_breakdown = relevant_URT_data[["test","MRN","Number"]] \
.groupby("test") \
.agg({'MRN':'count', 'Number':'size'}) \
.rename(columns={'MRN':'URT Use Count','Number':'Number'})
测试URT使用计数号码AP Connexxus接入请求9 9
AP支付付款细节28 35
AP一般查询1 7
AP一般提交发票付款25 27
AP一般WebNow / Invoice Copies 0 4
AP MyExpense访问请求3 3
AP MyExpense授权委托访问0 1
AP MyExpense Inquiry 2 8
AP质量保证付款状态56 71
控制器办公室综合医疗中心7 10
公共会计W-2表格6 9
公共住房管理局查询0 17
公共住房管理局时间表计算0 2
公关处理和生产付款细节0 1
公关就业验证如何申请VOE 1 1公关就业证明书VOE 2 4
我的目标是在分组数据集中再添加2列:
1)显示'URT Use Count'除以'Number'的列(我想要数字的百分比是MRN) 2)显示ResCat == 0除以数字的列(我想要ResCat等于0的数字的百分比)
这是我希望输出看起来的最佳状态 - 下面显示了两个新列:
测试URT使用计数数量百分比_使用Same_Day_Percentage
AP Connexxus访问请求9 9 100%55%
AP支付付款细节28 35 80%77%
AP一般查询1 7 14%92%
AP一般提交付款发票25 27 92%97%
AP一般WebNow /发票复制0 4 0%19%
AP MyExpense访问请求3 3 100%50 %
AP MyExpense授权授权访问0 1 0%50%
AP MyExpense Inquiry 2 8 25%77%
AP质量保证付款状态56 71 79%88%
控制器办公室综合医疗中心7 10 70%20%
公关会计W-2表格6 9 67%20%
公关HBS咨询0 17 0%100%
公关HBS时间表计算0 2 0% 45%
公关处理和生产直接存款2 2 100%99%
公关处理和生产付款细节0 1 0%15%
公关就业验证如何申请VOE 1 1 100% 12%作为公共就业证明书写的VOE 2 4 50%22%
有关创建这些计算字段的任何说明都非常有用。
答案 0 :(得分:1)
IIUC需要:
onScroll