我有一个大的散点图,大约有100,000(x,y)个点。 x坐标是从(1到~100,000)的数字集合 - 换句话说,没有2个点具有相同的x坐标。 y大部分是常数(值约为50-70),但有一些关键的“区域”,其中y值达到~120或下降到~20。我如何在统计上区分这些区域?
哪些R功能最合适?
答案 0 :(得分:1)
你的零假设是什么?或者你究竟想要测试/展示什么?
一种可能性(一旦你弄清楚在null之下测试/假设的假设)就是使用以下方法:
Buja, A., Cook, D. Hofmann, H., Lawrence, M. Lee, E.-K., Swayne, D.F and Wickham, H. (2009) Statistical Inference for exploratory data analysis and model diagnostics Phil. Trans. R. Soc. A 2009 367, 4361-4383 doi: 10.1098/rsta.2009.0120
R的TeachingDemos包中的vis.test
函数(和相关函数)有助于实现上述方法。