我有一个看起来像这样的DataFrame df_things
,我想在训练之前预测分类的质量
A B C CLASS
-----------------------
al1 bal1 cal1 Ship
al1 bal1 cal1 Ship
al1 bal2 cal2 Ship
al2 bal2 cal2 Cow
al3 bal3 cal3 Car
al1 bal2 cal3 Car
al3 bal3 cal3 Car
我想按类对行进行分组,以便对功能的分布有所了解。我这样做(例如,在“ B”栏上),
df_B = df_things.groupby('CLASS').B.value_counts()
这给了我结果
CLASS B
-------------
ship bal1 2
bal2 1
cow bal2 2
car bal2 1
bal3 2
我想要做的是仅可视化具有多个值的组,使其看起来像这样:
CLASS B
-------------
ship bal1 2
bal2 1
car bal2 1
bal3 2
我有点困惑,有什么想法吗?
答案 0 :(得分:2)
您可以使用:
来过滤groupby
计数超过1的组。
nunique
答案 1 :(得分:2)
来自set FileSize=98888765
for /f "tokens=*" %%a in ('powershell %FileSize% / 1048576') do (
for /f "tokens=1,2 delims=," %%i in ('echo/%%a') do (
set _Size_=%%j
set _SizeDec=000%_Size_:~0,3%
set "_SizeMB=%%i,%_SizeDec:~3%"
)
)
echo/%_SizeMB%
crosstab