Question

使用gtrends r软件包时遇到了一些麻烦。我正在使用“ R Studio版本3.1.1”运行“ R Studio版本1.1.463”。

当我搜索一个特定的关键字时，有时历史记录的匹配会发生很大变化。这是一个示例：

library(gtrendsR)

cr_br_prev1<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev1$interest_over_time$hits)

cr_br_prev2<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev2$interest_over_time$hits)

cr_br_prev3<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
head(cr_br_prev3$interest_over_time$hits)

这个简单代码的答案如下：

> library(gtrendsR)
> 
> cr_br_prev1<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev1$interest_over_time$hits)
[1]  0  0 24 46 24 24
> 
> cr_br_prev2<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev2$interest_over_time$hits)
[1]  0  0 24 46 24 24
> 
> cr_br_prev3<-gtrends(keyword = c("Previdência"), geo = "BR", time = "2015-01-01 2018-12-26", gprop = c("web"),category = 37)
> head(cr_br_prev3$interest_over_time$hits)
[1]  70  34  51 100  67  35

如您所见，每个搜索的配置完全相同。但是，命中系列在第三个变化（我只显示了带有“ head”功能的第一个术语，但是在“命中”的整个历史系列中都有变化）。对于我也在做的其他搜索，这种情况是随机发生的，甚至要求提供另一种输出，例如“ interest_by_region $ hits”选项。

我在Google趋势网站上搜索了数据的构建方式，并且我了解，一旦“点击数”显示相对受欢迎程度或将其标准化为0- 100但是，数据结构是否应该像我的示例那样改变？

我失去了什么吗？

我非常感谢您！

非常感谢！

Answer 1

我也有同样的担忧。您的代码实际上没有缺陷。 Google似乎随机提取了实际搜索频率的一个子集，以计算索引以提高响应速度。但是，《金融》杂志上的一篇著名论文（请参阅Da et al.(2011)第1467页脚注4显示，如果您更长时间跨度，则此问题将无关紧要。老实说，当您仅请求短时间跨度时，此问题就很严重。对于您而言，我仍然没有解决方案。

gtrends r软件包-点击次数随时间变化有时

1 个答案: