熊猫群体比例

时间:2020-11-10 18:59:34

标签: pandas

我想帮助获得具有多个索引(或我认为是多个索引)的数据框中两组的比率。我在下面的字典中粘贴了数据框的一小部分。

我想要为值变量“ Tristeza Aparente”获得每个用户的“基础”组与“ t2”组的比率。因此,例如,对于用户21,该比率为4(基础为4,t2为1)。在此数据框中,每个用户都属于安慰剂组或治疗组,并且每个时间段都有两行。

因此,一个具体的问题是:如何为每个用户创建一个新列,以获取时间段之间的值之比?我对Pandas中的多索引有点陌生,还不太清楚如何获得组之间不同值的函数。我查看了有关此主题的其他Stackoverflow问题,而我的情况有所不同。 (最终,我将通过比较安慰剂和治疗来进行分组,但现在我只希望能够获得每个用户的比率)。

谢谢,如果有任何疑问,请通知我!

{'01. Tristeza Aparente': {0: 4.0,
  1: 4.0,
  2: 4.0,
  4: 1.0,
  41: 4.0,
  42: 2.0,
  43: 4.0,
  44: 1.0},
 'groupedit': {0: 'placebo',
  1: 'placebo',
  2: 'placebo',
  4: 'placebo',
  41: 'treatment',
  42: 'treatment',
  43: 'treatment',
  44: 'treatment'},
 'subjectedit': {0: 1.0,
  1: 1.0,
  2: 2.0,
  4: 3.0,
  41: 20.0,
  42: 20.0,
  43: 21.0,
  44: 21.0},
 'testday': {0: 'Basal',
  1: 't2',
  2: 'Basal',
  4: 'Basal',
  41: 'Basal',
  42: 't2',
  43: 'Basal',
  44: 't2'}}

1 个答案:

答案 0 :(得分:1)

  1. 您可以通过用户使用名为pivot_table的{​​{1}}汇总数据,将pivbasal分为几列,以便可以将这些列名彼此分开得到想要的比例
  2. 然后,执行所需的计算
  3. 最后,将结果合并回原始数据框

t2