如何在熊猫中拆分列值?

时间:2020-05-12 11:23:12

标签: python pandas dataframe

enter image description here

我正尝试训练一种ML模型来根据电影标题预测书籍类型,但是由于每部电影都混合了类型,因此我的模型的准确性非常低,因为它无法正确匹配类型。 我只想保留“类型”列中显示的第一个类型。我该如何实现? 我尝试过

df['Genre'].split(',')[0]

但这似乎不起作用。

3 个答案:

答案 0 :(得分:2)

df['Top_Genre'] = df['Genre'].str.split(pat = ",", expand=True)[0]

答案 1 :(得分:1)

df['Genre'] = [ data.split(',')[0] for data in df['Genre']]

我希望这可以为您提供帮助

答案 2 :(得分:0)

您可以编写一个函数来执行此操作,只要Genre列具有一串Genre字符串

def get_first_genre(x):
    return x.Genre.split(',')[0]

df["firstGenre"] = df.apply(get_first_genre, axis=1)