我有一个缺少日期值的数据框,如何用9999-01-01 00:00:00
替换它们?
import pandas as pd
df = pd.read_excel('sample-data.xlsx',converters={'sample_date':str})
df['sample_date']
output of df['sample_date']:
0 2017-11-08 00:00:00
1 2016-08-03 00:00:00
2 2015-09-29 00:00:00
3 NaT
4 2015-09-29 00:00:00
5 NaT
if df['sample_date'] == "" or df['sample_date'] == None or df['sample_date'] == "NaT" or df['sample_date'] == "NaN":
df['sample_date'] == "9999-01-01 00:00:00"
我遇到类似The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
答案 0 :(得分:1)
尝试使用熊猫fillna()
函数在数据框中填充NaT值。
df['sample_date'] = df['sample_date'].fillna('9999-01-01 00:00:00')
我不知道这是否适用于NaT
值,但是如果我的记忆正确,它将起作用。
答案 1 :(得分:1)
您可能正在寻找.fillna()函数。
df['sample_date'] =df['sample_date'].fillna("9999-01-01 00:00:00")