我通过其API(远程控制)从Lime Survey检索调查结果:
我设法让它进入DataFrame。但它每行只有一列:
数据如下所示。
我希望能够按问题和类别获取数据的平均值。从下面的例子中,q10 [wor1],q10 [wor2] ,. 。 。,q10 [wor7]给出了属于类别q10的7个问题。
如何首先分别选择wor1,wor2,...,wor7的所有数据,以便我可以对每个问题进行统计。
然后如何为q10 *选择所有数据,以便我可以为整个组做统计数据?
即使没有尝试将类别与问题分开,我也无法选择所有' q10 [wor1]'数据
答案 0 :(得分:1)
查看jq - https://stedolan.github.io/jq/
您可以将df ['responses'] json传递给jq并提取必填字段并将其创建为单独的df列。
然后你可以从df获得列的平均值。