Question

我希望运行一系列多项式logit（每个感兴趣的协变量600ish），并从每一个中收集z统计量（我不在乎这些记录的顺序）。

这些口号在我的一小部分数据上运行（共享组ID）。这些口头涉及的结局数目（n）有所不同，并且将从每个口头收集（n-1）个z统计信息。每个mlogit的格式为：y = a + _b * x + \ epsilon，其中y可以取2到9个值（在我的数据中），尽管平均值为3.7。

我认为将这些z统计信息从mlogit中拉出会遇到困难，因为我无法直接调用z统计信息矩阵。我的解决方案是根据e（V）和e（b）矩阵构造z-stats。对于Mlogit的每次迭代，我都会构造一个z-stats矩阵；然后，我将其附加到以前的z-stats矩阵（从而建立一个所有计算的矩阵）。不幸的是，我的代码似乎无法正确执行此操作。

症状如下。矩阵mat_covariate包含许多缺失值（在我完成的故障排除中，矩阵值的一半以上缺失）。它还包含许多零（可能，但不太可能-尤其是以此速度计，约为16％）。如所写，代码尚未抑制我运行的mlogits，因此我可以返回并检查是什么使它成为矩阵。每个mlogit最多记录一个值，但是这些值通常被记录多次。 40％的木log没有记录。

相关的循环如下：

local counter = 1
forvalues i = 1/`times' {
    preserve
    keep if group_id==`i'
    foreach covariate in `covariates' {
        if `counter' == 1 {
            mlogit class `covariate'
            sum outcomes_n, meanonly
            local max = `r(max)'
            local max_minus = `max' - 1
            matrix mat_`covariate' = J(`max_minus',1,0)
            forvalues j = 1/`max_minus' {
                mat V = e(V)
                mat b = e(b)
                local z = b[1+2*(`j'-1),1] / ( V[1+2*(`j'-1),1+2*(`j'-1)] ) ^ (.5)

                matrix mat_`covariate'[`j',1] = `z'
            }
        }
        else {
            mlogit class `covariate'
            sum outcomes_n, meanonly
            local max `r(max)'
            local max_minus = `max' - 1
            matrix mat_`covariate'_temp = J(`max_minus',1,0)
            forvalues j = 1/`max_minus' {
                mat V = e(V)
                mat b = e(b)
                local z = b[1+2*(`j'-1),1] / ( V[1+2*(`j'-1),1+2*(`j'-1)] ) ^ (.5)
                matrix mat_`covariate'_temp[`j',1] = `z'
                matrix mat_`covariate' = mat_`covariate' \ mat_`covariate'_temp
            }
            matrix mat_`covariate' = mat_`covariate' \ mat_`covariate'_temp
        }
    }
    local counter = `counter'+1
    restore
}

为什么我在循环中做了一些事情的一些原因。我相信这些东西都可以，但是它们不是我的第一个本能，而且我不清楚为什么我的第一个本能不起作用。如果有一种更简单/更优雅的方法来解决这些问题，那将是一个不错的奖励：

if / else（和计数器）的主要用途是解决以下问题：在尚未定义矩阵时，我无法将矩阵定义为其自身的函数。
我为max定义了一个局部变量，为（max-1）定义了一个局部变量。 forvalues循环将不接受“ 1 /（`max'-1）{”，但我不确定为什么。

我创建了一些示例数据，可用于复制此问题。以下是.do文件的代码，该文件设置数据，循环的本地变量，上述循环，并通过显示相关矩阵来演示症状：

clear all
version 14

//================== sample data: ================== 
set obs 500
set seed 12345

gen id = _n

gen group_id = .
replace group_id = 1 if id <= 50
replace group_id = 2 if id <= 100 & missing(group_id)
replace group_id = 3 if id <= 150 & missing(group_id)
replace group_id = 4 if id <= 200 & missing(group_id)
replace group_id = 5 if id <= 250 & missing(group_id)
replace group_id = 6 if id <= 325 & missing(group_id)
replace group_id = 7 if id <= 400 & missing(group_id)
replace group_id = 8 if id <= 500 & missing(group_id)

gen temp_subgroup_id = .
replace temp_subgroup_id = floor((3)*runiform() + 2) if group_id < 6
replace temp_subgroup_id = floor((4)*runiform() + 2) if group_id < 8 & missing(temp_subgroup_id)
replace temp_subgroup_id = floor((5)*runiform() + 2) if missing(temp_subgroup_id)

egen subgroup_id = group(group_id temp_subgroup_id)

bysort subgroup_id : gen subgroup_size = _N
bysort group_id subgroup_id : gen tag = (_n == 1)
bysort group_id : egen outcomes_n = total(tag)

gen binary_x = floor(2*runiform())


//================== locals: ================== 
local covariates binary_x
local times = 8
// times is equal to the number of group_ids

//================== loop in question: ================== 
local counter = 1
forvalues i = 1/`times' {
    preserve
    keep if group_id==`i'
    foreach covariate in `covariates' {
        if `counter' == 1 {
            mlogit subgroup_id `covariate'
            sum outcomes_n, meanonly
            local max = `r(max)'
            local max_minus = `max' - 1
            matrix mat_`covariate' = J(`max_minus',1,0)
            forvalues j = 1/`max_minus' {
                mat V = e(V)
                mat b = e(b)
                local z = b[1+2*(`j'-1),1] / ( V[1+2*(`j'-1),1+2*(`j'-1)] ) ^ (.5)

                matrix mat_`covariate'[`j',1] = `z'
            }
        }
        else {
            mlogit subgroup_id `covariate'
            sum outcomes_n, meanonly
            local max `r(max)'
            local max_minus = `max' - 1
            matrix mat_`covariate'_temp = J(`max_minus',1,0)
            forvalues j = 1/`max_minus' {
                mat V = e(V)
                mat b = e(b)
                local z = b[1+2*(`j'-1),1] / ( V[1+2*(`j'-1),1+2*(`j'-1)] ) ^ (.5)
                matrix mat_`covariate'_temp[`j',1] = `z'
                matrix mat_`covariate' = mat_`covariate' \ mat_`covariate'_temp
            }
            matrix mat_`covariate' = mat_`covariate' \ mat_`covariate'_temp
        }
    }
    local counter = `counter' + 1
    restore
}

//================== symptoms: ================== 
matrix list mat_binary_x

我正在尝试找出代码中的错误，但是无法找到问题（尽管我发现了其他一些较小的错误，但是没有一个对主要问题有影响-我会如果有多个错误，请不要感到惊讶。

Answer 1

考虑当i == 1和max_minus == 2时最简单的情况：

preserve
keep if group_id == 1

summarize outcomes_n, meanonly           
local max = `r(max)'
local max_minus = `max' - 1

mlogit subgroup_id binary_x

matrix V = e(V)
matrix b = e(b)

这将产生以下结果：

. matrix list V

symmetric V[6,6]
                       1:          1:          2:          2:          3:          3:
                                               o.          o.                        
                binary_x       _cons    binary_x       _cons    binary_x       _cons
  1:binary_x   .46111111
     1:_cons       -.225        .225
2:o.binary_x           0           0           0
   2:o._cons           0           0           0           0
  3:binary_x    .2111111  -.09999999           0           0   .47896825
     3:_cons  -.09999999   .09999999           0           0  -.24285714   .24285714


. matrix list b

b[1,6]
             1:          1:          2:          2:          3:          3:
                                     o.          o.                        
      binary_x       _cons    binary_x       _cons    binary_x       _cons
y1   .10536052  -.22314364           0           0   .23889194  -.35667502


. local j = `max_minus'

. display "z = `= b[1+2*(`j'-1),1] / ( V[1+2*(`j'-1),1+2*(`j'-1)] ) ^ (.5)'"
z = .

缺少z的值，因为您正在将行中的值除矩阵e(b)不存在。换句话说，你的循环是设置不正确并替换错误的值。

从mlogit收集z统计信息时，矩阵的单元格意外丢失

1 个答案: