Question

我有一个大约的整数向量。 18000观察。起初它是一个列表，但是当我尝试使用一些绘图函数时，我得到了一些错误，所以我把它改成了一个整数向量，如下所示：

输入：

var number = 150
var percent= 10
var result = 0
for (var index = 0; index < number; index++) {
   const calculate = index / number * 100
   if (calculate == percent) result += index
}
return result

输出：

data <- read.csv("gumdrops.csv")
head(data)

输入：

X01 X02 X03 X04 X05 X06 
  0   0   1   0   0   2

输出：

str(data_new)

输入：

Named int [1:18828] 0 0 1 0 0 2 3 0 0 0 ...
 - attr(*, "names")= chr [1:18828] "X01" "X02" "X03" "X04" ...

输出上面的最后一行代码：

output for the last line of code above

data_new样本集[0:20]：

summary(data)
data_new <- unlist(data)
plot(data_new)

我是数据分析的新手，我看到图中有两个不同的集群。但我不知道该怎么做或为什么有两个集群。

有什么想法吗？或者有关如何更好地理解图表的任何建议？

Answer 1

你弄平了你的数据。为什么呢？

您所看到的可能是因为X01 X02 X03 X04 X05 X06的分布不同。这并不奇怪，因为您通常不能假设不同的属性具有相同的分布。

我假设您要么只绘制单个变量，或者例如X01与X02的散点图。

如何弄清楚为什么我的情节中有两个小组

1 个答案: