我是python的初学者。这是https://github.com/minsuk-heo/kaggle-titanic/blob/master/titanic-solution.ipynb(第12行)中代码的摘录。我试图用它了解条形图:
def bar_chart(feature):
survived = train[train['Survived']==1][feature].value_counts()
dead = train[train['Survived']==0][feature].value_counts()
df = pd.DataFrame([survived,dead])
df.index = ['Survived','Dead']
df.plot(kind='bar',stacked=True, figsize=(10,5))
答案 0 :(得分:0)
@Pranjal首先尝试学习python模块(在这里是熊猫),然后再跳到任何挑战(例如kaggle的泰坦尼克号)。
要回答您的问题,请考虑您要的行-
Line 2: survived = train[train['Survived']==1][feature].value_counts()
Line 3: dead = train[train['Survived']==0][feature].value_counts()
train['Survived']==1
代码导致一个布尔(真/假)熊猫系列。结果为True
,其中列Survived
的值等于1
,否则等于False
。生成序列后,会将其馈送到外部train
,并且仅保留映射到True
的行,而其他行将被删除。接下来,从结果数据框中仅选择feature
列,并返回包含唯一值计数的对象。同样,继续执行第3行。
提示:train
数据框没有发生永久更改。