所以我有一个看起来像这样的数据集
Lot.Area Neighborhood
3901 NridgHt
8400 Nonemes
7200 CollgCr
7017 SawyerW
15259 NridgHt
4280 Sawyer
20064 ClearCr
我想从这些数据中创建一个散点图,以便邻域名称在底部,而lot.areas在y轴上。
我已经尝试过plot(dataSet)
了,这让我很接近,但它在底部给了我多个值,如图所示 -
我想要类似于上面的内容,但我希望底部只有7个桶,而不是现在的大量数据。
我该怎么做?
所以我尝试了Julian Urbano的答案,我得到了这个
为什么有这么多不同的x值?怎么知道哪个点对应哪个邻居?
答案 0 :(得分:1)
你可以这样做:
plot(as.integer(t$Neighborhood),t$Lot.Area, axes=F, ylab="Lot Area", xlab="")
axis(1, labels=unique(t$Neighborhood),
at=as.integer(unique(t$Neighborhood)), las=2)
axis(2)
box()
答案 1 :(得分:0)
每个街区都有一个值,它看起来不太好看。
以下是带有R数据集的boxplot
的示例。
boxplot(Sepal.Width ~ Species, data = iris, ylab = "Sepal.Width")
这里有stripchart
您的数据。
stripchart(Lot.Area~Neighborhood, data = dat, vertical = TRUE)