在应该包含使用R的数字的列中查找非数字条目

时间:2018-04-18 17:06:29

标签: r regex

我知道这可能是重复的,但我无法应用或完全理解我读过的类似问题。

我有一个等级应该有数字条目的列。但是,在数据输入手动过程中,该列的某些行具有一些非数字条目。这些条目包括文本或文本和数字的组合。有什么方法可以找到任何不仅仅包含数字的条目吗?我怀疑我需要正则表达式,但我不确定。

我的专栏如下:

grades <- c(12, "missing", 20, 10, "accommodated-18", 13, "accommodated-20", 20, "sick", 17)

我知道有些行中有“缺失”和“容纳”字样,所以我可以使用grep找到它们。

grades_missing <- grep(pattern = "missing", x = grades)
grades_missing_index <- as.vector(grades_missing)
missing <- grades_missing[isbn_missing_index,]

它返回给我所有在其中缺少单词的行。同样地,我为“容纳”做了这个。但是如果有更多非完全数字条目并且我不知道它们,我怎么能找到它们?例如,我需要一些能告诉我2,5,7,9行有非数字条目的东西。 (然后通过使用矢量索引,我将能够看到它们。(类似于我之前做过的事情)。

有什么想法吗?

1 个答案:

答案 0 :(得分:2)

你可以尝试

which(!grepl('^[0-9]',grades))

检查哪些条目不仅包含数字字符。它输出

2 5 7 9

希望这有帮助!