我有一个大约的整数向量。 18000观察。 起初它是一个列表,但是当我尝试使用一些绘图函数时,我得到了一些错误,所以我把它改成了一个整数向量,如下所示:
输入:
var number = 150
var percent= 10
var result = 0
for (var index = 0; index < number; index++) {
const calculate = index / number * 100
if (calculate == percent) result += index
}
return result
输出:
data <- read.csv("gumdrops.csv")
head(data)
输入:
X01 X02 X03 X04 X05 X06
0 0 1 0 0 2
输出:
str(data_new)
输入:
Named int [1:18828] 0 0 1 0 0 2 3 0 0 0 ...
- attr(*, "names")= chr [1:18828] "X01" "X02" "X03" "X04" ...
输出上面的最后一行代码:
data_new样本集[0:20]:
summary(data)
data_new <- unlist(data)
plot(data_new)
我是数据分析的新手,我看到图中有两个不同的集群。但我不知道该怎么做或为什么有两个集群。
有什么想法吗?或者有关如何更好地理解图表的任何建议?
答案 0 :(得分:0)
你弄平了你的数据。为什么呢?
您所看到的可能是因为X01 X02 X03 X04 X05 X06的分布不同。这并不奇怪,因为您通常不能假设不同的属性具有相同的分布。
我假设您要么只绘制单个变量,或者例如X01与X02的散点图。