我有一个包含几列的数据集(称为df
)。其中的一列是date
列,该列的格式为“ d-MON-yy”或“ dd-MON-yy”,具体取决于日期是否小于10(例如,9月1日98年10月15日)或NA
。
我试图将其更改为日期类型值,但我只需要年份。具体来说,yy位数小于20的所有日期均来自本世纪,而yy位数大于或等于20的所有日期均为1900年代。我想最后输入一年中的四个数字。
由于我只对年份感兴趣,所以我不介意返回数字值的解决方案。
最后,我还要过滤掉仅在NA
变量上具有date
的行。
我对R很陌生,我试图通过一些我在这里没有找到答案的方法使它起作用。
谢谢。