Question

我是初学R学习者，如果我说一些不连贯的话，请耐心等待。

我有一个大的矢量变量，只包含5000个元素，并且想知道它们是什么，知道有几个重复。 An introduction to R除了基本数据结构之外似乎没有说什么，我也不知道R是否提供内置的此功能。

如果没有这样的＆＃34;数据结构＆＃34;，是否有一些内置函数可以过滤掉矢量或列表中的重复元素？

Answer 1

要删除向量中多次出现的值，请使用duplicated()

一个例子是

x <- c(1,2,3,3,4,5,5,6)
x[!duplicated(x)]
# [1] 1 2 3 4 5 6

这将返回x重复的所有值!。

这也适用于更复杂的数据结构，如data.frames。有关详细信息，请参阅?duplicated。

unique(x)提供向量中出现的所有值。

table(x)在向量x

中显示unqiue值及其出现次数

table(x)
# x
# 1 2 3 4 5 6 
# 1 1 2 1 2 1

Answer 2

unique（）函数可以正常工作。

唯一（“矢量名称”）

Answer 3

如果你想要数据结构，R有所谓的＆＃34;数据框＆＃34;你可以用它做任何你想做的事情，例如你甚至可以忽略重复的行。您可以使用nameofdataframe <- as.data.frame(data)将数据转换为数据框，然后使用函数unique(nameofdataframe)删除重复项