我的数据集包含feedbackDate
和子类别(问题)和位置(6个月数据)等信息。时间计算是通过将问题的子类别与其feebackDate
进行交叉制表,然后计算每对交叉列表问题的Pearson相关性得分。请参阅以下代码
#weekly correlation
require(ISOweek)
datacfs_date$FeedbackWeek <- ISOweek(datacfs_date$FeedbackDate)
raw_timecor_matrix <- table(datacfs_date$SubCategory, datacfs_date$FeedbackWeek)
raw_timecor_matrix <- t(raw_timecor_matrix)
timecor_matrix <- cor(raw_timecor_matrix)
#Invert correlation to get distance matrix
inverse_tcc <- 1-timecor_matrix
现在问题是如何每两周和每月计算一次,而不是六个月数据的每周相关性。
答案 0 :(得分:0)
只需制作标签,例如
datacfs_date$FeedbackMonth<-paste0(year(datacfs_date$FeedbackDate),"-M",month(datacfs_date$FeedbackDate))
datacfs_date$FeedbackBiWeek<-paste0(year(datacfs_date$FeedbackDate),"-W",(ceiling(week(datacfs_date$FeedbackDate)/2)*2)-1,":",(ceiling(week(datacfs_date$FeedbackDate)/2)*2))
并关联这些