Question

我有一个看起来像这样的DataFrame df_things，我想在训练之前预测分类的质量

A    B     C      CLASS
-----------------------
al1  bal1  cal1   Ship
al1  bal1  cal1   Ship
al1  bal2  cal2   Ship
al2  bal2  cal2   Cow
al3  bal3  cal3   Car
al1  bal2  cal3   Car
al3  bal3  cal3   Car

我想按类对行进行分组，以便对功能的分布有所了解。我这样做（例如，在“ B”栏上），

df_B = df_things.groupby('CLASS').B.value_counts()

这给了我结果

CLASS  B 
-------------
ship   bal1  2 
       bal2  1
cow    bal2  2
car    bal2  1
       bal3  2

我想要做的是仅可视化具有多个值的组，使其看起来像这样：

CLASS  B 
-------------
ship   bal1  2 
       bal2  1
car    bal2  1
       bal3  2

我有点困惑，有什么想法吗？

Answer 1

您可以使用:来过滤groupby计数超过1的组。

nunique

Answer 2

来自set FileSize=98888765 for /f "tokens=*" %%a in ('powershell %FileSize% / 1048576') do ( for /f "tokens=1,2 delims=," %%i in ('echo/%%a') do ( set _Size_=%%j set _SizeDec=000%_Size_:~0,3% set "_SizeMB=%%i,%_SizeDec:~3%" ) ) echo/%_SizeMB%

的解决方案

crosstab

Pandas GroupBy-仅显示具有多个唯一特征值的组

2 个答案: