我是将面板数据整体缩放还是将其分组?

时间:2019-05-18 15:30:17

标签: scale panel-data standardized

我正在运行一个面板回归估计在给定公司的glassdoor.com上测得的员工满意度变化(等级1至5)对股票价格的影响(由Fama-French调整)。我确实有一个由50家公司和43个季度组成的小组,因为我对这一变化感兴趣,因此两个时间序列都先求差(即x =(在Q2中进行评级-在Q1中进行评级)和y =(在Q2中进行评级-在Q1中进行评级) ))。我现在想标准化我的数据。我的问题是我应该对整个数据集进行标准化还是应该先按季度对它进行分组,然后对其进行标准化?

general_reviews <- read.csv("reviews_ general.csv")
#Importing the data
general_data <- pdata.frame(general_reviews, index = c("company","Year_Quarter", "Type"))
#Data is a panel with company as the entity and Year_Quarter the time
general_data <- general_data %>% mutate(alpha = as.numeric(as.character(alpha))) %>% group_by(company) %>% mutate(A1d = dplyr::lead(alpha, 1) - alpha)
#Building the first difference as I am interested in the change.

#Do I use:
general_data <- general_data %>% mutate(A1s = scale(alpha))
#or:
general_data <- general_data %>% group_by(Year_Quarter) %>% mutate(A1s = scale(alpha))

0 个答案:

没有答案