Question

我正在尝试使用excel在看起来像这样的路线列表（起点城市/州和终点城市/州）中找到最常见的路线：

SACRAMENTO  CA   SANTA FE SPRINGS   CA
FRESNO  CA   SAN DIEGO  CA
FIONA   TX   LOS ANGELES    CA
ELMWOOD PARK    NJ   MORENO VALLEY  CA
RICHMOND    CA   VERNON     CA
TORRANCE    CA   OKLAHOMA CITY  OK
LOUISVILLE  KY   MANCHESTER     PA
SAN DIEGO   CA   PHOENIX    AZ
SAN DIEGO   CA   FRESNO     CA
SAN DIEGO   CA   CONLEY     GA
WACO    TX   COMMERCE   CA
MARSHVILLE  NC   HARRINGTON     DE
SYRACRUSE   NY   SOUTH WINDSOR  CT
CARTHAGE    MO   GORDONSVILLE   VA
NEW BERLIN  NY   FORT WORTH     TX
HERMITAGE   PA   CARROLLTON     TX
BETHLEHEM   PA   COTTONWOOD     AL
SAN DIEGO   CA   OREGON CITY    OR
SAN DIEGO   CA   KENT   WA
... and so on

我正在尝试使用excel来执行此操作，因为我认为它可以用于数据透视表，但我不确定。如果归结为它，我也可以使用python。我正在寻找有关如何使用excel或如何在Python中设置算法的提示。谢谢您的帮助。

Answer 1

这将为您提供所需的内容：

df = df.groupby(['Col1', 'Col2']).size().reset_index(name='Freq') 
#Col1 and #Col2 is the name columns of your df

尝试在路线列表中查找前10条最常见的路线

1 个答案: