通过数据框进行高效搜索

时间:2018-11-19 05:07:30

标签: python pandas dataframe

我正在尝试搜索大型数据框以查找特定日期。该日期在data_value列中可能有多个值。找到日期后,我将从与该数据关联的一组可能值中提取最大值。

有没有办法使它更有效?现在它运行缓慢。

max_temps = []
for date in dates:
    value = data_w[data_w['Date']==date]['Data_Value'].max()
    max_temps.append(value)

1 个答案:

答案 0 :(得分:1)

如果我正确理解了您的问题,那么您需要这样,

temp=data_w[data_w['Date'].isin(dates)]
print temp.groupby('Date')['Data_Value'].max()

说明:

首先在大型数据框中应用isin,然后应用groupby并从其中删除max