具有多个自变量的中断时间序列的R模型

时间:2018-07-01 14:39:03

标签: r

比方说,我有一个文章列表的数据集,并且在该文章发表后的十年内,与每篇文章相关的引用数量均被拆分。例如:

Article ID      Year1   Year2    Year3
1               5       3        10 
2               2       2        8 
3               1       1        1
4               3       1        6

我正在尝试衡量特定事件前后(与该文章相关的专利的授予)的平均被引次数,以查看一旦获得专利,被引次数是增加还是减少已被授予。

过去,我在StackOverflow上搜索时,发现本文在此处引用(https://stats.stackexchange.com/questions/61393/statistical-test-for-a-significant-change-in-time-series-sales-trend-after-pol)(用于评估公共卫生干预措施的中断时间序列回归:教程)。本文建议使用具有3个变量的ITS模型:

T-自研究开始以来经过的时间

X-指示干预期的虚拟变量

Y-结果(在这种情况下,是专利授予后引用次数的变化)。

Bernal等人接着使用以下R模型显示吸烟禁令的影响:

model1 <- glm(aces ~ offset(log(stdpop)) + smokban + time, family=poisson, data)

我的问题是我是否可以引入其他虚拟变量(例如作者数,位置等)。如果这是一个非常愚蠢的问题,我感到抱歉,但是我在统计方面并不出色。谢谢!

0 个答案:

没有答案