我正在尝试搜索大型数据框以查找特定日期。该日期在data_value
列中可能有多个值。找到日期后,我将从与该数据关联的一组可能值中提取最大值。
有没有办法使它更有效?现在它运行缓慢。
max_temps = []
for date in dates:
value = data_w[data_w['Date']==date]['Data_Value'].max()
max_temps.append(value)
答案 0 :(得分:1)
如果我正确理解了您的问题,那么您需要这样,
temp=data_w[data_w['Date'].isin(dates)]
print temp.groupby('Date')['Data_Value'].max()
说明:
首先在大型数据框中应用isin
,然后应用groupby
并从其中删除max