new_df['year'].describe()
count 10866.000000
mean 2004.009939
std 14.958790
min 1968.000000
25% 1996.000000
50% 2006.000000
75% 2012.000000
max 2067.000000
Name: year, dtype: float64
似乎错误的年份值是+ 100年(即2067应该是1967年)。因此,对于2018年以上的值,如何在保持其余值不受影响的情况下[年 - 100]?
答案 0 :(得分:1)
您可以使用pd.DataFrame.loc
:
new_df.loc[new_df['year'] > 2018, 'year'] -= 100