当仅提供样本的最大值时,我正在测试“最大似然法”。我假设样本来自高斯分布。
首先,我生成10.000个均值= 2.45&sd = 1的随机数
library(tidyverse)
set.seed(91)
n <- 10000
mean <- 2.45
sd <- 1
random_numbers <- rnorm(n, mean, sd)
然后我提取最大值,我认为那是我知道的唯一值。
maximum <- random_numbers[which.max(random_numbers)]
然后,我使用不同的平均值估算该最大值的密度值。我使用公式:
mean_space <- seq(0, 10, by = 0.01)
densities <- n * (pnorm(maximum, mean_space, sd)^(n-1)) * dnorm(maximum,
mean_space,1)
df <- data.frame(x = mean_space, y = densities)
g <- ggplot(df, aes(x = x, y = y)) +
geom_line() +
geom_vline(xintercept = mean)
print(g)
df %>% filter(y == max(y))
但是,我得到的密度值大于1,我认为这是不正确的。