使用心脏病的日期,我已经将年龄数据分为几组,并且根据该年龄组的“诊断”计数进行衡量。我正在尝试与Seaborn合作,然后训练我的模型。我可以执行常规的.plot,但不能执行lmplot或scatterplot。
bins = [0, 25, 50, 75,100]
ag['binned'] = pd.cut(ag['age'], bins)
ag
age Diagnosis binned
1 67 1 (50, 75]
2 67 1 (50, 75]
6 62 1 (50, 75]
...
s = ag.groupby(pd.cut(ag['age'], bins=bins)).size()
new = s.to_frame()
s
age
(0, 25] 0
(25, 50] 29
(50, 75] 109
(75, 100] 1
dtype: int64
s.index
CategoricalIndex([(0, 25], (25, 50], (50, 75], (75, 100]], categories=[(0, 25], (25, 50], (50, 75], (75, 100]], ordered=True, name='age', dtype='category')
s.plot(x=s.index, y='categories')
这是可行的,我得到了图形
g = sns.lmplot(x=s.index, y="categories", data=s)
这引发错误
TypeError:无法将op gt 的分类与标量进行比较, 这不是类别。