R:包含非日期类条目的日期列

时间:2018-06-25 03:50:26

标签: r date dataframe data-cleaning

我的数据框中有一个日期列,其中既包含日期又包含非日期类条目(例如2<1U+5C0F><U+65F6><U+524D><U+53D1><U+5E03>2017-11-18

如何确定哪些行包含日期,哪些行包含字符?

1 个答案:

答案 0 :(得分:1)

在基数R中,您可以将greplsubset一起使用

# Sample data
df <- data.frame(
    date = c("2<1U+5C0F><U+65F6><U+524D><U+53D1><U+5E03>", "2017-11-18"))

subset(df, !grepl("U\\+", date))
#        date
#2 2017-11-18

这假定所有非日期条目都包含字符串"U+"