我开始学习熊猫并尝试分析数据
所以在我的数据中有一个包含几个国家的列国家,我只想取第一个值并将其更改为新列。
第一个索引的一个示例包含哥伦比亚,墨西哥,美国,而我只想获取第一个哥伦比亚[0]并删除另一个contry [1:x],这可能吗?
我尝试了一些类似loc,iloc或drop()的方法,但是我死了,所以我在这里问
答案 0 :(得分:1)
您可以使用Series.str.split
:
df['country'] = df['country'].str.split(',').str[0]
例如,考虑df下面的内容:
In [1520]: df = pd.DataFrame({'country':['Colombia, Mexico, US', 'Croatia, Slovenia, Serbia', 'Denmark', 'Denmark, Brazil']})
In [1521]: df
Out[1521]:
country
0 Colombia, Mexico, US
1 Croatia, Slovenia, Serbia
2 Denmark
3 Denmark, Brazil
In [1523]: df['country'] = df['country'].str.split(',').str[0]
In [1524]: df
Out[1524]:
country
0 Colombia
1 Croatia
2 Denmark
3 Denmark
答案 1 :(得分:0)
使用.str.split()
:
df['country'] = df['country'].str.split(',',expand=True)[0]