保持良好的工作。到目前为止,你已经帮助了我所需要的一切,所以我希望你能再次做到这一点。
我有一个包含7-8列的csv文件,并且在一个特定的列中。
“Cabin”是它的名称,其值与A-T不同,但与数字不同(不是全部)。
IE A,A23,A43,B,B34,B45等...
我想将该列重新制作成(A,B,C,D,E ......等)..
知道怎么做python?
for dataset in full_set:
dataset.loc[ dataset['Cabin'] = 'NOCABIN','Cabin']=0
dataset.loc[ dataset['Cabin'] < 'B', 'Cabin']=1
dataset.loc[(dataset['Cabin'] >= 'B') & (dataset['Cabin'] < 'C'), 'Cabin'] = 2
dataset.loc[(dataset['Cabin'] >= 'C') & (dataset['Cabin'] < 'D'), 'Cabin'] = 3
答案 0 :(得分:0)
您可以使用.get
在给定位置提取字符串。
# sample data
df = pd.DataFrame({'codes': ['A','A23','A43','B','B34' ,'B45','E33']})
## extract code
df['new_codes'] = df['codes'].str.get(0)
print(df)
codes new_codes
0 A A
1 A23 A
2 A43 A
3 B B
4 B34 B
5 B45 B
6 E33 E