如何弄清楚为什么我的情节中有两个小组

时间:2018-02-20 19:04:01

标签: r plot graph

我有一个大约的整数向量。 18000观察。 起初它是一个列表,但是当我尝试使用一些绘图函数时,我得到了一些错误,所以我把它改成了一个整数向量,如下所示:

输入:

var number = 150
var percent= 10
var result = 0
for (var index = 0; index < number; index++) {
   const calculate = index / number * 100
   if (calculate == percent) result += index
}
return result

输出:

data <- read.csv("gumdrops.csv")
head(data)

输入:

X01 X02 X03 X04 X05 X06 
  0   0   1   0   0   2 

输出:

str(data_new)

输入:

Named int [1:18828] 0 0 1 0 0 2 3 0 0 0 ...
 - attr(*, "names")= chr [1:18828] "X01" "X02" "X03" "X04" ...

输出上面的最后一行代码:

output for the last line of code above

data_new样本集[0:20]:

summary(data)
data_new <- unlist(data)
plot(data_new)

我是数据分析的新手,我看到图中有两个不同的集群。但我不知道该怎么做或为什么有两个集群。

有什么想法吗?或者有关如何更好地理解图表的任何建议?

1 个答案:

答案 0 :(得分:0)

你弄平了你的数据。为什么呢?

您所看到的可能是因为X01 X02 X03 X04 X05 X06的分布不同。这并不奇怪,因为您通常不能假设不同的属性具有相同的分布。

我假设您要么只绘制单个变量,或者例如X01与X02的散点图。