Pandas - 拆分数据框中列的每个元素并添加到列表中

时间:2017-11-11 23:20:32

标签: python pandas split

所以我的数据框有一个如下所示的列:

fruitList = ['apple','banana','pear','apple','peach','blueberry','durian','peach','banana','grape','orange']

等等。我想创建一个结束列表,我可以在其中获得以下列表:

 fruitList.extend(df['Fruit'].iloc[0].split(';'))
 #fruitList = ['apple','banana']

我该怎么做?我设法为以下一行执行此操作:

fruitList

但当然,这只适用于一行......我如何概括这一点?我的计划只是计算水果并获得十大水果数量。我的最终目标只是保留那些包含前10名成果的行...但是为了实现这一目标,我首先想出=SUMIFS(K:K,H:H,TODAY())

2 个答案:

答案 0 :(得分:2)

.parent

请参阅Microsft Azure Notebook中的完整代码。

答案 1 :(得分:1)

除了srodriguex回答:

from collections import Counter

all = df.Fruit.str.split(';').sum()
c = Counter(all)
c.most_common(3)

现在,如果你想获得行:

df[df['Fruit'].str.contains("peach")]

并获得指数:

list(df[df['Fruit'].str.contains("apple")].index)

结果

[('apple', 3), ('peach', 2), ('pear', 1)]


                         Fruit
1              pear;apple;peach
2  blueberry;durian;apple;peach


[1, 2]