是否可以在RStan中更有效地执行以下计算?
我只提供了所需的最少编码量:
parameters {
real beta_0;
real beta_1;
}
model {
vector [n] p_i = exp(beta_0 + beta_1*x)/[1 + exp(beta_0 + beta_1*x)];
y ~ bernoulli(p_i);
/* Likelihood:
for(i in 1:n){
p_i[i] = exp(beta_0 + beta_1*x[i])/(1 + exp(beta_0 + beta_1*x[i]));
y[i] ~ bernoulli(p_i[i]);
*/}
// Prior:
beta_0 ~ normal(m_beta_0, s_beta_0);
beta_1 ~ normal(m_beta_1, s_beta_1);
}
我获得以下错误消息:“矩阵表达式元素必须为row_vector类型,行向量表达式元素必须为int或real,但找到的类型为vector的元素”。如果我使用for循环(已注释掉),则代码可以正常工作,但我想限制在我的代码中使用for循环。在上面的代码中,x是长度为n的向量。
另一个例子:
parameters {
real gamma1;
real gamma2;
real gamma3;
real gamma4;
}
model {
// Likelihood:
real lambda;
real beta;
real phi;
for(i in 1:n){
lambda = exp(gamma1)*x[n_length[i]]^gamma2;
beta = exp(gamma3)*x[n_length[i]]^gamma4;
phi = lambda^(-1/beta);
y[i] ~ weibull(beta, phi);
}
//y ~ weibull(exp(gamma1)*x^gamma2, exp(gamma3)*x^gamma4); //cannot raise a vector to a power
// Prior:
gamma1 ~ normal(m_gamma1, s_gamma1);
gamma2 ~ normal(m_gamma2, s_gamma2);
gamma3 ~ normal(m_gamma3, s_gamma3);
gamma4 ~ normal(m_gamma4, s_gamma4);
}
上面的代码有效,但是注释掉的似然计算不起作用,因为我“无法将向量提升为幂”(但是您可以在R中使用)。我想再一次不想被迫用于循环。在上面的代码中,n_length是长度为n的向量。
最后一个例子。如果要从R的正态分布中提取10000个样本,只需指定
rnorm(10000, mu, sigma)
但是在RStan中,我将不得不使用for循环,例如
parameters {
real mu;
real sigma;
}
generated quantities {
vector[n] x;
for(i in 1:n) {
x[i] = normal_rng(mu, sigma);
}
}
我可以做些什么来加快我的RStan示例的速度吗?
答案 0 :(得分:0)
这行代码:
vector [n] p_i = exp(beta_0 + beta_1*x)/[1 + exp(beta_0 + beta_1*x)];
在Stan语言中不是有效的语法,因为方括号仅用于索引。可能是
vector [n] p_i = exp(beta_0 + beta_1*x) ./ (1 + exp(beta_0 + beta_1*x));
使用元素除法运算符,或者更好的是
vector [n] p_i = inv_logit(beta_0 + beta_1*x);
在这种情况下,y ~ bernoulli(p_i);
可能会起作用。更好的是,只是做
y ~ bernoulli_logit(beta_0 + beta_1 * x);
,它将以数值稳定的方式为您完成转换。您还可以使用bernoulli_logit_glm
,它相对于大型数据集来说要快一些。
在Stan 2.19.x中,我认为您可以从生成的数量块中的概率分布中提取N个值。但是您太担心for
循环了。 Stan程序被转换为C ++,其中的循环很快,并且Stan语言中几乎所有接受向量输入并产生向量输出的功能实际上都涉及到C ++中的相同循环,就像您自己完成循环一样。