我正在尝试使用excel在看起来像这样的路线列表(起点城市/州和终点城市/州)中找到最常见的路线:
SACRAMENTO CA SANTA FE SPRINGS CA
FRESNO CA SAN DIEGO CA
FIONA TX LOS ANGELES CA
ELMWOOD PARK NJ MORENO VALLEY CA
RICHMOND CA VERNON CA
TORRANCE CA OKLAHOMA CITY OK
LOUISVILLE KY MANCHESTER PA
SAN DIEGO CA PHOENIX AZ
SAN DIEGO CA FRESNO CA
SAN DIEGO CA CONLEY GA
WACO TX COMMERCE CA
MARSHVILLE NC HARRINGTON DE
SYRACRUSE NY SOUTH WINDSOR CT
CARTHAGE MO GORDONSVILLE VA
NEW BERLIN NY FORT WORTH TX
HERMITAGE PA CARROLLTON TX
BETHLEHEM PA COTTONWOOD AL
SAN DIEGO CA OREGON CITY OR
SAN DIEGO CA KENT WA
... and so on
我正在尝试使用excel来执行此操作,因为我认为它可以用于数据透视表,但我不确定。如果归结为它,我也可以使用python。我正在寻找有关如何使用excel或如何在Python中设置算法的提示。谢谢您的帮助。
答案 0 :(得分:1)
这将为您提供所需的内容:
df = df.groupby(['Col1', 'Col2']).size().reset_index(name='Freq')
#Col1 and #Col2 is the name columns of your df