基于日期的Python VLOOKUP - 熊猫

时间:2017-04-06 14:42:49

标签: python excel pandas dataframe membership

pandas df出现问题,尝试根据日期获取“计数”列,代码应搜索日期列中的“日期范围”,如果存在,则应复制“计数”进入相应日期的“帖子”栏 例如:date_range value = 16/02/2017 - 代码在“Dates”列中搜索16/02/2017并使“Posts”等于该Date的“Count”值 - 如果date_range值没有出现 - 帖子应该= 0。

数据示例:

Dates     Count date_range  Posts
0   07/02/2017  1   16/12/2016  (should = 5)   
1   01/03/2017  1   17/12/2016  
2   15/02/2017  1   18/12/2016  
3   23/01/2017  1   19/12/2016  
4   28/02/2017  1   20/12/2016  
5   09/02/2017  2   21/12/2016  
6   20/03/2017  2   22/12/2016  
7   16/12/2016  5   

我的代码如下所示:

    DateList = df['Dates'].tolist()

    for date in df['date_range']:
        if str(date) in DateList:
            df['Posts'] = df['Count']
        else:
            dates_df['Posts'] = 0

然而,这会使数据映射错误的值为“帖子”

希望我能正确解释这个!在此先感谢您的帮助!

1 个答案:

答案 0 :(得分:1)

您可以先为dict创建匹配值,然后map创建date_range列:

print (df)
        Dates  Count  date_range
0  07/02/2017      1  16/12/2016
1  01/03/2017      1  17/12/2016
2  15/02/2017      1  18/12/2016
3  23/01/2017      1  19/12/2016
4  28/02/2017      1  07/02/2017 <-change value for match
5  09/02/2017      2  21/12/2016
6  20/03/2017      2  22/12/2016
7  16/12/2016      5  22/12/2016

d = df[df['Dates'].isin(df.date_range)].set_index('Dates')['Count'].to_dict()
print (d)
{'16/12/2016': 5, '07/02/2017': 1}

df['Posts'] = df['date_range'].map(d).fillna(0).astype(int)
print (df)
        Dates  Count  date_range  Posts
0  07/02/2017      1  16/12/2016      5
1  01/03/2017      1  17/12/2016      0
2  15/02/2017      1  18/12/2016      0
3  23/01/2017      1  19/12/2016      0
4  28/02/2017      1  07/02/2017      1
5  09/02/2017      2  21/12/2016      0
6  20/03/2017      2  22/12/2016      0
7  16/12/2016      5  22/12/2016      0