确定数据集的长度

时间:2016-07-18 03:28:17

标签: r

当我在Auto包中的ISLR数据集中读到时,乍一看似乎有397个观察结果。我使用tail()函数确定了这一点。实际上有392个观察结果。我怎样才能整齐地找出哪些观察结果丢失了?我需要一种方法来检查输出最左边的数字序列。

1 个答案:

答案 0 :(得分:1)

nrow(Auto)表示确实存在392个观察结果,?Auto也是如此:

  

392辆汽车的汽油里程,马力和其他信息。

文档也说

  

原始(原文如此)数据包含408个观测值,但有16个观测值        删除了缺失值。

只是猜测,但大概有5个缺失的观察结果在数据的“主体”内,而其他11个结果在最后......看看行数是非连续的,试试

setdiff(1:397,rownames(Auto))
[1]  33 127 331 337 355

不太直接有用,但

which(diff(as.numeric(rownames(Auto)))>1)

也可能很方便。