我的数据集中的一列有"关键字"存储的值如下:
monster|dna|tyrannosaurus rex|velociraptor|island
我想将每个关键字拆分为(|)管道并将其存储为新行,以便稍后我可以使用 groupby 来查看基于关键字。
我得到的最远的是:
dfn = df['keywords'].str.split('|',expand=True)
但是这会将它们存储为新列,而不是新行,并且这仅将这些值存储在新数据帧中。我仍然需要将它重新放回原始数据帧,然后删除包含关键字集群的原始行。
答案 0 :(得分:1)
您可以在stack
split
dfn = df['keywords'].str.split('|',expand=True).stack()