我想为1,2和3 weight_cat
值绘制三个箱图(这些是它唯一的不同值)。这些箱图应显示重量类别(weight_cat
)的依赖性高度。
所以我有这样一个数据帧:
print data.head(5)
Height Weight weight_cat
Index
1 65.78331 112.9925 1
2 71.51521 136.4873 2
3 69.39874 153.0269 3
4 68.21660 142.3354 2
5 67.78781 144.2971 2
下面的代码终于吃掉了我所有的ram。这是不正常的,我相信:
Seaborn.boxplot(x="Height", y="weight_cat", data=data)
这里有什么问题?这是manual的链接。数据帧的形状是(25000,4)。这是指向csv file。
的链接这是您获取相同数据的方法:
data = pd.read_csv('weights_heights.csv', index_col='Index')
def weight_category(weight):
newWeight = weight
if newWeight < 120:
return 1
if newWeight >= 150:
return 3
else:
return 2
data['weight_cat'] = data['Weight'].apply(weight_category)