我有离散的经验数据,形成带有间隙的直方图。即没有对某些值进行观察。但实际上,这些价值观可能会发生。 这是散点图的图。
所以我的问题是,我应该在xaxis值之间进行插值,以便为直方图制作容器?如果是这样,你会建议什么是最佳做法?
此致
答案 0 :(得分:2)
不要这样做。
有了这么多的样本点,如果分布平滑,获得空仓的概率(p值)非常低。有一些潜在的原因,他们是空的,你可能想调查。我可以想到两种可能性:
您的数据实际上是离散的(可能有人在数据收集过程中四舍五入到一个显着的数字,或ADC中的量化误差很大),然后单位转换导致不规则的间隙。如果.12
实际上在计算机内表示为.13
,则即使从.12
和.11111111198
转换为12,13也可能导致此问题。但是这会在相邻的垃圾箱中翻倍并且间隙会有规律地间隔,所以我怀疑这是原因。 (例如,如果对每个数据点进行了128次伯努利硬币翻转实验的试验,并且有人将每个系列中的头部百分比记录到最接近的1%,则可以乘以1.28 /%来尝试恢复实际头数,但有28个空箱)
您的发行版有真正的情况。因为每个空箱后频率显着降低,所以我赞成这种解释。
但这些只是为你自己的调查提出建议。