Pandas - Python - 如何根据另外两个内容更改一列的内容?

时间:2015-02-20 20:06:01

标签: python string datetime pandas

我有两个字符串列和一个日期时间列:

我想检查第一个字符串列是否是某个值 然后检查datetime列是否在某个特定日期之前 然后将第三个字符串列更新为新值。

我可以创建一个变量来提供与datetime列匹配的日期:

import time
june2014 = time.strptime('01-06-14','%d-%m-%y')

我正在寻找可以做到这一点的语法?

1 个答案:

答案 0 :(得分:1)

您应该提供真实数据,但以下情况应该有效:

df.loc[(df['str1'] == some_string) & (df['time'] < june2014 ), 'str2'] = some_new_str_val

这使用loc执行标签索引,然后使用&的2个条件,因为我们正在比较数组和括号,因为运算符优先。

示例:

In [4]:
# create some dummy data
import datetime as dt
df = pd.DataFrame({'str1':['hello', 'python', 'goodbye'], 'str2':['','',''], 'date':[dt.datetime(2013, 3, 4), dt.datetime.now(), dt.datetime(2014,7,14)]})
df

Out[4]:
                        date     str1 str2
0        2013-03-04 00:00:00    hello     
1 2015-02-20 20:19:34.224030   python     
2        2014-07-14 00:00:00  goodbye     

In [7]:
# create our date for comparison
june2014 = dt.datetime(2014, 6, 1)
df.loc[(df['str1'] == 'hello') & (df['date'] < june2014 ), 'str2'] = 'updated'
df

Out[7]:
                        date     str1     str2
0        2013-03-04 00:00:00    hello  updated
1 2015-02-20 20:19:34.224030   python         
2        2014-07-14 00:00:00  goodbye