比方说,我有一个文章列表的数据集,并且在该文章发表后的十年内,与每篇文章相关的引用数量均被拆分。例如:
Article ID Year1 Year2 Year3
1 5 3 10
2 2 2 8
3 1 1 1
4 3 1 6
我正在尝试衡量特定事件前后(与该文章相关的专利的授予)的平均被引次数,以查看一旦获得专利,被引次数是增加还是减少已被授予。
过去,我在StackOverflow上搜索时,发现本文在此处引用(https://stats.stackexchange.com/questions/61393/statistical-test-for-a-significant-change-in-time-series-sales-trend-after-pol)(用于评估公共卫生干预措施的中断时间序列回归:教程)。本文建议使用具有3个变量的ITS模型:
T-自研究开始以来经过的时间
X-指示干预期的虚拟变量
Y-结果(在这种情况下,是专利授予后引用次数的变化)。
Bernal等人接着使用以下R模型显示吸烟禁令的影响:
model1 <- glm(aces ~ offset(log(stdpop)) + smokban + time, family=poisson, data)
我的问题是我是否可以引入其他虚拟变量(例如作者数,位置等)。如果这是一个非常愚蠢的问题,我感到抱歉,但是我在统计方面并不出色。谢谢!