我遇到了一些数据质量问题以及随后的数据格式化问题。
数据是20111021格式的DOB,但有些条目是以下之一 - '0''101''10101'。
我可以在DOB是这样的数据步骤中删除数据行,还是DOB不是8个数字?如果是这样,怎么样?
答案 0 :(得分:7)
data clean ;
set dirty ;
if input(DOB,??yymmdd8.) then output ;
run ;
基本上,尝试将DOB转换为基于yymmdd8的SAS日期。格式。如果成功,则输出该行。 ?? ??抑制转换失败的行的日志错误。