使用gtrends r软件包时遇到了一些麻烦。我正在使用“ R Studio版本3.1.1”运行“ R Studio版本1.1.463”。
当我搜索一个特定的关键字时,有时历史记录的匹配会发生很大变化。这是一个示例:
library(gtrendsR)
cr_br_prev1<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev1$interest_over_time$hits)
cr_br_prev2<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev2$interest_over_time$hits)
cr_br_prev3<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev3$interest_over_time$hits)
这个简单代码的答案如下:
> library(gtrendsR)
>
> cr_br_prev1<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev1$interest_over_time$hits)
[1] 0 0 24 46 24 24
>
> cr_br_prev2<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev2$interest_over_time$hits)
[1] 0 0 24 46 24 24
>
> cr_br_prev3<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev3$interest_over_time$hits)
[1] 70 34 51 100 67 35
如您所见,每个搜索的配置完全相同。但是,命中系列在第三个变化(我只显示了带有“ head”功能的第一个术语,但是在“命中”的整个历史系列中都有变化)。对于我也在做的其他搜索,这种情况是随机发生的,甚至要求提供另一种输出,例如“ interest_by_region $ hits”选项。
我在Google趋势网站上搜索了数据的构建方式,并且我了解,一旦“点击数”显示相对受欢迎程度或将其标准化为0- 100但是,数据结构是否应该像我的示例那样改变?
我失去了什么吗?
我非常感谢您!
非常感谢!
答案 0 :(得分:1)
我也有同样的担忧。您的代码实际上没有缺陷。 Google似乎随机提取了实际搜索频率的一个子集,以计算索引以提高响应速度。但是,《金融》杂志上的一篇著名论文(请参阅Da et al.(2011)第1467页脚注4显示,如果您更长时间跨度,则此问题将无关紧要。 老实说,当您仅请求短时间跨度时,此问题就很严重。对于您而言,我仍然没有解决方案。