识别第二个数据帧中的行,其值小于第一个

时间:2018-01-06 21:42:55

标签: python pandas dataframe

我有2个数据帧,如下面的代码所示。两者的日期相同。我需要能够识别第二个数据帧中的值小于同一日期的第一个值。根据这些数据,我应该得到值为33的1/1/2008,以及35等的1/4/2008,因为它小于第一个数据帧中的相应值。我能够得到一个布尔值,但无法从第二个数据帧中获取实际值。

import pandas as pd
import numpy as np

data1 = {'Date': {1: '1/1/2008',
  2: '1/2/2008',
  3: '1/3/2008',
  4: '1/4/2008',
  5: '1/5/2008',
  6: '1/6/2008',
  7: '1/7/2008',
  8: '1/8/2008',
  9: '1/9/2008',
 10: '1/10/2008'
   },
 'windspeed': {1: '36',
  2: '38',
  3: '40',
  4: '39',
  5: '45',
  6: '33',
  7: '31',
  8: '39',
  9: '41',
 10: '37'}}

df1 = pd.DataFrame(data1)

data2 = {'Date': {1: '1/1/2008',
  2: '1/2/2008',
  3: '1/3/2008',
  4: '1/4/2008',
  5: '1/5/2008',
  6: '1/6/2008',
  7: '1/7/2008',
  8: '1/8/2008',
  9: '1/9/2008',
 10: '1/10/2008'
  },
 'windspeed': {1: '33',
  2: '39',
  3: '42',
  4: '35',
  5: '43',
  6: '40',
  7: '39',
  8: '37',
  9: '44',
 10: '35'}}

df2 = pd.DataFrame(data2)

2 个答案:

答案 0 :(得分:3)

设置索引(用于对齐)并比较 -

i = df1.set_index('Date')
j = df2.set_index('Date')

j[i.windspeed > j.windspeed]

          windspeed
Date               
1/1/2008         33
1/4/2008         35
1/5/2008         43
1/8/2008         37
1/10/2008        35

如果日期列不相同,您可以先使用align -

i, j = i.align(j)

然后,重复相同的比较+过滤步骤。如果您希望Date作为另一列,请在结果上调用reset_index -

j[i.windspeed > j.windspeed].reset_index()

        Date windspeed
0   1/1/2008        33
1   1/4/2008        35
2   1/5/2008        43
3   1/8/2008        37
4  1/10/2008        35

答案 1 :(得分:1)

df1.windspeed=df1.windspeed.astype(int)
df2.windspeed=df2.windspeed.astype(int)
df1.set_index('Date').windspeed.gt(df2.set_index('Date').windspeed)
Out[247]: 
Date
1/1/2008      True
1/2/2008     False
1/3/2008     False
1/4/2008      True
1/5/2008      True
1/6/2008     False
1/7/2008     False
1/8/2008      True
1/9/2008     False
1/10/2008     True
Name: windspeed, dtype: bool

更新

df1[df1.set_index('Date').windspeed.gt(df2.set_index('Date').windspeed).values]
Out[250]: 
         Date  windspeed
1    1/1/2008         36
4    1/4/2008         39
5    1/5/2008         45
8    1/8/2008         39
10  1/10/2008         37