当前,我有16383个43维数据。看起来像这样:
Response0me ReleaseDate date MicrosoftWindows PlayStation4 ………
Prison Architect 2015-10-06 0:00 2015-10-07 0:00 2015-10-06 0:00 2016-06-28 0:00
Prison Architect 2015-10-06 0:00 2015-10-08 0:00 2015-10-06 0:00 2016-06-28 0:00
Prison Architect 2015-10-06 0:00 2015-10-09 0:00 2015-10-06 0:00 2016-06-28 0:00
TIS-100 2015-07-20 0:00 2015-07-21 0:00 2015-07-20 0:00
TIS-100 2015-07-20 0:00 2015-07-22 0:00 2015-07-20 0:00
TIS-100 2015-07-20 0:00 2015-07-23 0:00 2015-07-20 0:00
如您所见,对于每个Response0me
,都有一个ReleaseDate, MicrosoftWindows, PlayStation4
,依此类推,但是有很多date
。所以我想看这个数据集如下:
Response0me ReleaseDate MicrosoftWindows
Prison Architect 2015-10-06 0:00 2015-10-06 0:00
TIS-100 2015-07-20 0:00
简而言之,我想删除(实际上不是删除或删除,但不会在控制台上显示)无意义的数据,然后缩写行,仅查看选定的数据。有什么办法可以做到吗?
答案 0 :(得分:0)
您可以使用HDA-Intel - HDA Intel PCH
。最后的unique(df[, -3])
将取消选择-3
变量(位于第三位置),仅留下不经常更改的变量。之后,date
将删除重复的观察值。如果要排除更多变量,可以执行unique
。
另外,您可以使用dplyr:
unique(df[, c(3, ...)])