gtrends r软件包-点击次数随时间变化有时

时间:2019-01-03 13:13:47

标签: r gtrendsr

使用gtrends r软件包时遇到了一些麻烦。我正在使用“ R Studio版本3.1.1”运行“ R Studio版本1.1.463”。

当我搜索一个特定的关键字时,有时历史记录的匹配会发生很大变化。这是一个示例:

library(gtrendsR)

cr_br_prev1<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev1$interest_over_time$hits)

cr_br_prev2<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev2$interest_over_time$hits)

cr_br_prev3<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev3$interest_over_time$hits)

这个简单代码的答案如下:

> library(gtrendsR)
> 
> cr_br_prev1<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev1$interest_over_time$hits)
[1]  0  0 24 46 24 24
> 
> cr_br_prev2<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev2$interest_over_time$hits)
[1]  0  0 24 46 24 24
> 
> cr_br_prev3<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev3$interest_over_time$hits)
[1]  70  34  51 100  67  35

如您所见,每个搜索的配置完全相同。但是,命中系列在第三个变化(我只显示了带有“ head”功能的第一个术语,但是在“命中”的整个历史系列中都有变化)。对于我也在做的其他搜索,这种情况是随机发生的,甚至要求提供另一种输出,例如“ interest_by_region $ hits”选项。

我在Google趋势网站上搜索了数据的构建方式,并且我了解,一旦“点击数”显示相对受欢迎程度或将其标准化为0- 100但是,数据结构是否应该像我的示例那样改变?

我失去了什么吗?

我非常感谢您!

非常感谢!

1 个答案:

答案 0 :(得分:1)

我也有同样的担忧。您的代码实际上没有缺陷。 Google似乎随机提取了实际搜索频率的一个子集,以计算索引以提高响应速度。但是,《金融》杂志上的一篇著名论文(请参阅Da et al.(2011)第1467页脚注4显示,如果您更长时间跨度,则此问题将无关紧要。 老实说,当您仅请求时间跨度时,此问题就很严重。对于您而言,我仍然没有解决方案。