我想帮助获得具有多个索引(或我认为是多个索引)的数据框中两组的比率。我在下面的字典中粘贴了数据框的一小部分。
我想要为值变量“ Tristeza Aparente”获得每个用户的“基础”组与“ t2”组的比率。因此,例如,对于用户21,该比率为4(基础为4,t2为1)。在此数据框中,每个用户都属于安慰剂组或治疗组,并且每个时间段都有两行。
因此,一个具体的问题是:如何为每个用户创建一个新列,以获取时间段之间的值之比?我对Pandas中的多索引有点陌生,还不太清楚如何获得组之间不同值的函数。我查看了有关此主题的其他Stackoverflow问题,而我的情况有所不同。 (最终,我将通过比较安慰剂和治疗来进行分组,但现在我只希望能够获得每个用户的比率)。
谢谢,如果有任何疑问,请通知我!
{'01. Tristeza Aparente': {0: 4.0,
1: 4.0,
2: 4.0,
4: 1.0,
41: 4.0,
42: 2.0,
43: 4.0,
44: 1.0},
'groupedit': {0: 'placebo',
1: 'placebo',
2: 'placebo',
4: 'placebo',
41: 'treatment',
42: 'treatment',
43: 'treatment',
44: 'treatment'},
'subjectedit': {0: 1.0,
1: 1.0,
2: 2.0,
4: 3.0,
41: 20.0,
42: 20.0,
43: 21.0,
44: 21.0},
'testday': {0: 'Basal',
1: 't2',
2: 'Basal',
4: 'Basal',
41: 'Basal',
42: 't2',
43: 'Basal',
44: 't2'}}
答案 0 :(得分:1)
pivot_table
的{{1}}汇总数据,将piv
和basal
分为几列,以便可以将这些列名彼此分开得到想要的比例t2