Question

我正在尝试将shapiro-wilk测试应用于我的数据框，该数据框基于两个分类变量分为几组：

df.groupby(['category 1', 'category 2']).apply(stats.shapiro)

这将导致错误，提示它无法将字符串转换为浮点型。我用来拆分数据框的只有两个非数字列。

我该如何解决？

编辑：

示例数据：

cat1    cat2    purchases    sales
A       B       20           25
C       A       30           45
B       B       35           20
A       A       40           50

我想获取每个数字列的shapiro统计信息和p值，而不必编写每个类别的所有可能组合。

Answer 1

这应该有效：

df.groupby(['cat1', 'cat2'])['purchases','sales'].apply(stats.shapiro)

熊猫groupby并将功能应用于数字列

1 个答案: