我有2个数据帧,如下面的代码所示。两者的日期相同。我需要能够识别第二个数据帧中的值小于同一日期的第一个值。根据这些数据,我应该得到值为33的1/1/2008,以及35等的1/4/2008,因为它小于第一个数据帧中的相应值。我能够得到一个布尔值,但无法从第二个数据帧中获取实际值。
import pandas as pd
import numpy as np
data1 = {'Date': {1: '1/1/2008',
2: '1/2/2008',
3: '1/3/2008',
4: '1/4/2008',
5: '1/5/2008',
6: '1/6/2008',
7: '1/7/2008',
8: '1/8/2008',
9: '1/9/2008',
10: '1/10/2008'
},
'windspeed': {1: '36',
2: '38',
3: '40',
4: '39',
5: '45',
6: '33',
7: '31',
8: '39',
9: '41',
10: '37'}}
df1 = pd.DataFrame(data1)
data2 = {'Date': {1: '1/1/2008',
2: '1/2/2008',
3: '1/3/2008',
4: '1/4/2008',
5: '1/5/2008',
6: '1/6/2008',
7: '1/7/2008',
8: '1/8/2008',
9: '1/9/2008',
10: '1/10/2008'
},
'windspeed': {1: '33',
2: '39',
3: '42',
4: '35',
5: '43',
6: '40',
7: '39',
8: '37',
9: '44',
10: '35'}}
df2 = pd.DataFrame(data2)
答案 0 :(得分:3)
设置索引(用于对齐)并比较 -
i = df1.set_index('Date')
j = df2.set_index('Date')
j[i.windspeed > j.windspeed]
windspeed
Date
1/1/2008 33
1/4/2008 35
1/5/2008 43
1/8/2008 37
1/10/2008 35
如果日期列不相同,您可以先使用align
-
i, j = i.align(j)
然后,重复相同的比较+过滤步骤。如果您希望Date
作为另一列,请在结果上调用reset_index
-
j[i.windspeed > j.windspeed].reset_index()
Date windspeed
0 1/1/2008 33
1 1/4/2008 35
2 1/5/2008 43
3 1/8/2008 37
4 1/10/2008 35
答案 1 :(得分:1)
df1.windspeed=df1.windspeed.astype(int)
df2.windspeed=df2.windspeed.astype(int)
df1.set_index('Date').windspeed.gt(df2.set_index('Date').windspeed)
Out[247]:
Date
1/1/2008 True
1/2/2008 False
1/3/2008 False
1/4/2008 True
1/5/2008 True
1/6/2008 False
1/7/2008 False
1/8/2008 True
1/9/2008 False
1/10/2008 True
Name: windspeed, dtype: bool
更新
df1[df1.set_index('Date').windspeed.gt(df2.set_index('Date').windspeed).values]
Out[250]:
Date windspeed
1 1/1/2008 36
4 1/4/2008 39
5 1/5/2008 45
8 1/8/2008 39
10 1/10/2008 37