我有100个独特的类别,需要累积到5个以上。最终数据框将汇总美国,意大利,晚餐,亚洲,比萨,其他。
完成后应该看起来像这样(多90行)。
data = [{'Venue_Category': 'Italian'},
{'Venue_Category': 'Pizza'},
{'Venue_Category': 'Pasta'},
{'Venue_Category': 'Park'},
{'Venue_Category': 'Gym'},
{'Venue_Category': 'School'}]
df = pd.DataFrame(data)
,因此“比萨饼,意大利文,意大利面”将全部称为“比萨饼”,“公园,体育馆,学校”将被称为“其他”。这只是我无法工作的其中两个例子。我有一个较长的列表要迭代。这是我尝试过的,但出现错误:
pizza=['Italian', 'Pizza', 'Pasta']
other=['Park', 'Gym', 'School']
rollup=[]
for row in df['Venue_Category']:
if row in pizza:
rollup.append["Pizza"]
if row in other:
rollup.append["Other"]
test['Roll-up'] = rollup