我一直在探索titanic dataset。我正在努力创造一个
dataframe
将在两个不同的专栏中分别为那些在泰坦尼克号沉没中幸存下来的人和那些没有幸存下来的人的年龄。
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')
whole = pd.concat([train, test])
df = pd.DataFrame({'survived': whole['Age'][whole['Survived'] == 1],
'died': whole['Age'][whole['Survived'] == 0]})
但我收到此错误
pandas.indexes.base.InvalidIndexError:重新索引仅对有效 唯一值的索引对象
我做错了什么?
答案 0 :(得分:2)
在代码中进行此更改
whole = pd.concat([train, test]).reset_index(drop=True)