所以我的数据框有一个如下所示的列:
fruitList = ['apple','banana','pear','apple','peach','blueberry','durian','peach','banana','grape','orange']
等等。我想创建一个结束列表,我可以在其中获得以下列表:
fruitList.extend(df['Fruit'].iloc[0].split(';'))
#fruitList = ['apple','banana']
我该怎么做?我设法为以下一行执行此操作:
fruitList
但当然,这只适用于一行......我如何概括这一点?我的计划只是计算水果并获得十大水果数量。我的最终目标只是保留那些包含前10名成果的行...但是为了实现这一目标,我首先想出=SUMIFS(K:K,H:H,TODAY())
?
答案 0 :(得分:2)
.parent
请参阅Microsft Azure Notebook中的完整代码。
答案 1 :(得分:1)
除了srodriguex回答:
from collections import Counter
all = df.Fruit.str.split(';').sum()
c = Counter(all)
c.most_common(3)
现在,如果你想获得行:
df[df['Fruit'].str.contains("peach")]
并获得指数:
list(df[df['Fruit'].str.contains("apple")].index)
结果
[('apple', 3), ('peach', 2), ('pear', 1)]
Fruit
1 pear;apple;peach
2 blueberry;durian;apple;peach
[1, 2]