如何从DataFrame中选择数据列

时间:2018-02-14 23:13:06

标签: python python-3.x pandas limesurvey

我通过其API(远程控制)从Lime Survey检索调查结果:

enter image description here

我设法让它进入DataFrame。但它每行只有一列:

enter image description here

数据如下所示。

enter image description here

我希望能够按问题和类别获取数据的平均值。从下面的例子中,q10 [wor1],q10 [wor2] ,. 。 。,q10 [wor7]给出了属于类别q10的7个问题。

如何首先分别选择wor1,wor2,...,wor7的所有数据,以便我可以对每个问题进行统计。

然后如何为q10 *选择所有数据,以便我可以为整个组做统计数据?

即使没有尝试将类别与问题分开,我也无法选择所有' q10 [wor1]'数据

1 个答案:

答案 0 :(得分:1)

查看jq - https://stedolan.github.io/jq/

您可以将df ['responses'] json传递给jq并提取必填字段并将其创建为单独的df列。

然后你可以从df获得列的平均值。