我正在处理一个非常难以处理的数据集:鱼幼虫密度。它是半连续的数据,具有90%的零和右偏分布,具有非常大的值。
一个问题是我的零点有两个来源:对与错,或结构与抽样。
我看到了可以处理这两种类型的零的模型,称为零膨胀模型,但仅用于计数数据。我没有看到可以处理假零的半连续数据模型。这些模型是具有对数正态或伽马分布的两部分模型,并且所有模型都假定为零。
有什么帮助吗?
这是我的数据集的一部分:我的回答是鱼幼虫密度(Dprochilodus)。而且我有很多零,但是我不能假设它们都是零。我想告诉的是:当我有零时,这并不意味着没有幼虫。可能是因为我无法采样/检测到它们。 Here对于真零和假零的不同模型有一些解释
ponto Dprochilodus periodo Dif_his.y temp
Length:574 Min. : 0.0000 I :278 Min. :0.01571 Min. :21.00
Class :character 1st Qu.: 0.0000 II:296 1st Qu.:0.09738 1st Qu.:24.00
Mode :character Median : 0.0000 Median :0.22505 Median :27.00
Mean : 0.5949 Mean :0.25405 Mean :26.87
3rd Qu.: 0.0000 3rd Qu.:0.40296 3rd Qu.:29.01
Max. :134.7469 Max. :0.89746 Max. :33.00