我使用MASS包中的kde2d函数为数据集中的每对数字列生成2D内核密度分布。
这需要以下参数:
kde2d(x, y, h, n=25, lims = c(range(x), range(y)))
其中n是“每个方向上的网格点数。可以是标量或长度为2的整数向量”。
我想为每对列优化网格的尺寸。目前,我使用的固定尺寸为10x10。有没有人知道优化网格大小的公式,以便我可以为每对列生成最佳密度估计?
由于
答案 0 :(得分:1)
此函数中的参数n
不会影响您的密度估算,只会影响图形表示,即它应仅取决于您要创建的图的大小,而不取决于数据。
另一方面,您的密度估计确实受到选择og bandwith h
的影响。要选择最佳带宽,您需要知道(或假设)数据的分布