当我在Auto
包中的ISLR
数据集中读到时,乍一看似乎有397个观察结果。我使用tail()
函数确定了这一点。实际上有392个观察结果。我怎样才能整齐地找出哪些观察结果丢失了?我需要一种方法来检查输出最左边的数字序列。
答案 0 :(得分:1)
nrow(Auto)
表示确实存在392个观察结果,?Auto
也是如此:
392辆汽车的汽油里程,马力和其他信息。
文档也说
原始(原文如此)数据包含408个观测值,但有16个观测值 删除了缺失值。
只是猜测,但大概有5个缺失的观察结果在数据的“主体”内,而其他11个结果在最后......看看行数是非连续的,试试
setdiff(1:397,rownames(Auto))
[1] 33 127 331 337 355
不太直接有用,但
which(diff(as.numeric(rownames(Auto)))>1)
也可能很方便。