我有一组数据,我想知道这个数据集是否具有逻辑分布。 当我对我的数据集做直方图时(参见http://imageshack.us/photo/my-images/593/histogram.png/上的直方图),它似乎有一个逻辑分布,但是为了确保我想测试R中的逻辑分布。所以我的问题是:有没有办法测试您的数据以进行后勤分配?您是如何做到这一点的?
附加信息:数据集包含8544项。数据是2个地理点之间的水平距离(km)。
感谢您的关注
桑德
答案 0 :(得分:7)
在R中,您可以使用ks.test
或chisq.test
函数(可能还有其他函数)来测试假设的分布。请注意,这些测试(以及其他测试)都是排除测试,非重要结果并不保证数据来自给定的分布,只是您不能排除它。还要注意,样本大小为8544,这些测试很可能会被制服,这意味着它有能力找到轻微的无意义差异,即使它“足够接近”,你也可能拒绝零假设。此外,您基于先查看数据而决定分配的事实可能会导致结果偏差。
另一种方法可以让您更好地了解逻辑分布是否“足够接近”而不是完全是在TeachingDemos包中使用vis.test
函数(请务必阅读帮助中引用的文章)页面以了解测试以及您正在做出的假设。)
最重要的是理解导致数据的科学,物流分配是否有科学意义?还有哪些其他发行版可以推理?还要了解您尝试使用数据回答哪些问题以及对分布的答案有何影响(例如,CLT将允许您使用法线来回答某些问题,而不是其他问题,甚至使用正态分布虽然数据来自后勤或类似的东西)。