Question

所以我的数据框有一个如下所示的列：

fruitList = ['apple','banana','pear','apple','peach','blueberry','durian','peach','banana','grape','orange']

等等。我想创建一个结束列表，我可以在其中获得以下列表：

 fruitList.extend(df['Fruit'].iloc[0].split(';'))
 #fruitList = ['apple','banana']

我该怎么做？我设法为以下一行执行此操作：

fruitList

但当然，这只适用于一行......我如何概括这一点？我的计划只是计算水果并获得十大水果数量。我的最终目标只是保留那些包含前10名成果的行...但是为了实现这一目标，我首先想出=SUMIFS(K:K,H:H,TODAY())？

Answer 1

.parent

请参阅Microsft Azure Notebook中的完整代码。

Answer 2

除了srodriguex回答：

from collections import Counter

all = df.Fruit.str.split(';').sum()
c = Counter(all)
c.most_common(3)

现在，如果你想获得行：

df[df['Fruit'].str.contains("peach")]

并获得指数：

list(df[df['Fruit'].str.contains("apple")].index)

结果

[('apple', 3), ('peach', 2), ('pear', 1)]


                         Fruit
1              pear;apple;peach
2  blueberry;durian;apple;peach


[1, 2]