ggplot + r面板数据图表中的数据太多+交互点+选择特定变量

时间:2013-05-15 03:19:34

标签: r ggplot2 na

如果有人可以提供帮助,我会有一些问题。 我有一个面板数据,例如:

Country Name    Year    GDP    PPP    HHH
USA             1960    7       9      10
Uk              1960    9       10     NA
World           1960    7       5      3
Africa          1960    3       7      NA

很少有问题,请耐心等待。

我正在使用ggplot2,例如

ggplot(data, aes(x=Year, y=GDP, colour=Country Name)) + geom_point() 

但是这个图表有太多的国家/地区名称(大约150个国家/地区名称)所以所有内容都是群集且无法读取的,即使我按R放大R也是如此。

问题1:如何从上面的ggplot中省略世界和非洲等数据?

问题2:图表上的点可以是交互式的,如果我触摸一个点,它会显示哪个国家/地区?或者是否有更好的图形包下载,没有我没有mathematica。或者我可以为ggplot指定不同的颜色,但我确实有很多国家可以立即处理。

问题3:如何使图表更具可读性?

问题4:NA值在R中扮演什么角色,是否需要省略?他们会造成任何问题吗?

问题5:我可以向国家/地区添加趋势线,还是只添加+ geom_line()

问题6:我如何添加另一个变量,如GDP和PPP +年份和国家名称?

提前感谢您的帮助

1 个答案:

答案 0 :(得分:2)

Q1:通过对data.frame进行子集化

Q2:link。是的,您可以指定颜色。阅读文档。

问题3:使用不同类型的情节(散点图除外)?通过面对你的情节?

问题4:ggplot2会自动删除带有警告的NA值。下次试试看看会发生什么。

问题5:是的,你可以。使用geom_smooth(method=lm,se=FALSE)。再次阅读文档。

问题6:融化你的data.frame。并使用变量名作为分组变量。这是推荐的方式。您也可以执行+ geom_point(aes(y=PPP),shape=2)

之类的操作

此网站不鼓励每篇文章提出多个问题。在提出问题之前,您还应该阅读文档并进行一些基础研究(搜索网站和网站)。