我知道这可能是重复的,但我无法应用或完全理解我读过的类似问题。
我有一个等级应该有数字条目的列。但是,在数据输入手动过程中,该列的某些行具有一些非数字条目。这些条目包括文本或文本和数字的组合。有什么方法可以找到任何不仅仅包含数字的条目吗?我怀疑我需要正则表达式,但我不确定。
我的专栏如下:
grades <- c(12, "missing", 20, 10, "accommodated-18", 13, "accommodated-20", 20, "sick", 17)
我知道有些行中有“缺失”和“容纳”字样,所以我可以使用grep找到它们。
grades_missing <- grep(pattern = "missing", x = grades)
grades_missing_index <- as.vector(grades_missing)
missing <- grades_missing[isbn_missing_index,]
它返回给我所有在其中缺少单词的行。同样地,我为“容纳”做了这个。但是如果有更多非完全数字条目并且我不知道它们,我怎么能找到它们?例如,我需要一些能告诉我2,5,7,9行有非数字条目的东西。 (然后通过使用矢量索引,我将能够看到它们。(类似于我之前做过的事情)。
有什么想法吗?
答案 0 :(得分:2)
你可以尝试
which(!grepl('^[0-9]',grades))
检查哪些条目不仅包含数字字符。它输出
2 5 7 9
希望这有帮助!