按国家/地区标准化Google结果的数量

时间:2012-03-10 17:51:05

标签: normalization web-traffic

我试图想象某些国家某些短语的重要性。我收集的数据是Google针对不同国家/地区的不同字词的结果数。例如,与埃及相比,英国的“小红帽”或类似的东西。由于我只会使用英语作为搜索词(十几个国家,即时搜索,不能免费使用谷歌翻译),我需要根据当地英语网站的数量将结果标准化。

E.g。如果在埃及,我获得“美国派”的10000个结果,而美国我得到100万个结果,但埃及有大约10万个英文网站,我会得出结论,“美国派”在埃及比在我们。

我只需要一些好的方法来估算每个国家/地区有多少英文网站。任何想法?
到目前为止,我尝试使用“the”作为标准化术语进行标准化,但结果似乎是扭曲的。

0 个答案:

没有答案