Question

我开始学习熊猫并尝试分析数据

所以在我的数据中有一个包含几个国家的列国家，我只想取第一个值并将其更改为新列。

第一个索引的一个示例包含哥伦比亚，墨西哥，美国，而我只想获取第一个哥伦比亚[0]并删除另一个contry [1：x]，这可能吗？

我尝试了一些类似loc，iloc或drop（）的方法，但是我死了，所以我在这里问

Answer 1

您可以使用Series.str.split：

df['country'] = df['country'].str.split(',').str[0]

例如，考虑df下面的内容：

In [1520]: df = pd.DataFrame({'country':['Colombia, Mexico, US', 'Croatia, Slovenia, Serbia', 'Denmark', 'Denmark, Brazil']})

In [1521]: df
Out[1521]: 
                     country
0       Colombia, Mexico, US
1  Croatia, Slovenia, Serbia
2                    Denmark
3            Denmark, Brazil

In [1523]: df['country'] = df['country'].str.split(',').str[0]

In [1524]: df
Out[1524]: 
    country
0  Colombia
1   Croatia
2   Denmark
3   Denmark

Answer 2

使用.str.split()：

df['country'] = df['country'].str.split(',',expand=True)[0]

删除值熊猫列

2 个答案: