计算N条款的GoogleShare

时间:2010-01-02 13:22:52

标签: math logic

我需要指导如何计算多个术语的GoogleShare

例如,请使用以下基本术语:

  • “汤姆克鲁斯” = 12,000,000页
  • “John Travolta” = 4,900,000页

现在,如果我们添加第二个术语:

  • “汤姆克鲁斯” + “科学论坛” = 784,000页
  • “John Travolta” + “科学论坛” = 331,000页

因此,汤姆克鲁斯和科学教的GoogleShare(784000 * 100/12000000)= 6.53%,而John Travolta和Scientology的GoogleShare是(331000 * 100/4900000)= 6.76%


现在,如果我们在查询中添加第三个术语:

  • “汤姆克鲁斯” + “科学论坛” + “StackOverflow” = 100页
  • “John Travolta” + “科学论坛” + “StackOverflow” = 181页

我现在应该如何计算GoogleShare百分比?

// Tom Cruise
100 * 100 / 784000 = 0.01% // StackOverflow / Scientology
// or...
100 * 100 / 12000000 = 0.00083% // StackOverflow / Tom Cruise

// John Travolta
181 * 100 / 331000 = 0.05% // StackOverflow / Scientology
// or...
181 * 100 / 4900000 = 0.00369% // StackOverflow / John Travolta

约翰特拉沃尔塔在SO社区中的科学家数量似乎是汤姆克鲁斯的5倍。

计算N个条款的GoogleShare的正确方法是什么?

3 个答案:

答案 0 :(得分:1)

这取决于。首先,让我们为GoogleShare的内容奠定一些基础。

考虑您的搜索

"Tom Cruise" + "Scientology"
"John Travolta" + "Scientology"

您在此处计算GoogleShare时的计算结果是"Scientology"的搜索结果占"Tom Cruise"的百分比,而"Scientology"的搜索百分比也包含"John Travolta" }}。所以计算它的方法如下:

Google search for "Scientology": 4,730,000 hits

比较:

Google search for "Tom Cruise" and "Scientology": 825,000 hits
Google search for "John Travolta" and "Scientology": 340,000 hits

因此,"Tom Cruise"的{​​{1}} GoogleShare为17.44%。 "Scientology"的{​​{1}} GoogleShare为7.18%。我们说相对于"John Travolta"的{​​{1}}与"Scientology"相关联的"Tom Cruise""Scientology"相关联。因此,我们注意到您对"John Travolta"的GoogleShare与"Scientology""Tom Cruise"的GoogleShare的初步计算不正确。关键是要弄清楚你的基本搜索是什么(这里是"John Travolta")以及你希望看到它们在这个空间中的份额是什么(这里是"Scientology"与{{1} }})。

现在考虑一下搜索

"Scientology"

"Tom Cruise"

有两种方法可以查看此内容。您是在尝试衡量("John Travolta" + "Scientology" + "Tom Cruise" + keyword )空间中"Scientology" + "John Travolta" + keyword. "Tom Cruise"的份额,还是在尝试衡量"John Travolta"的份额? "Scientology"空格中的{keyword?这些是不同的。

"Tom Cruise"

如果您希望{(1}}和keyword的份额位于("Scientology" + Google search for "Scientology" + "StackOverflow": 34,300 Google search for "Tom Cruise" and "Scientology" and "StackOverflow": 1,360 Google search for "John Travotla" and "Scientology" and "StackOverflow": 1,660 )的空间中,您可以计算:

"Tom Cruise"

如果您希望"John Travolta""Scientology"的份额在"StackOverflow"的空间内进行计算:

"Tom Cruise": 1360 / 34300 = 3.97%
"John Travolta": 1660 / 34300 = 4.84%

你知道,这完全取决于你的基本搜索是什么以及你正在尝试找到它们在这个基本术语中的份额。在第一个版本中,我们的基本搜索是"Tom Cruise" + "StackOverflow",我们会看到"John Travolta" + "StackOverflow""Scientology"共享此空间的内容。在第二个版本中,我们的基本搜索是"Tom Cruise" + "StackOverflow": 1360 / 4730000 = .0029% "John Travolta" + "StackOverflow" : 1660 / 4730000 = .0035% ,我们会看到"Scientology" + "StackOverflow""Tom Cruise"在此空间中的共享。

答案 1 :(得分:1)

我没有看到N个术语和2个术语之间的区别。每当您有超过1个学期时,您就隐含地使用GoogleShare 关于某些初始搜索字词。对于任何N> = 2,对于窄查询的每个子集,都有多个GoogleShares。

您声明“GoogleShare for Tom Cruise and Scientology”为6.53%,但这有点误导,因为“”一词往往暗示某种对称性,您可以切换“汤姆克鲁斯“和”科学教派“没有改变意义。实际情况并非如此,因为您的初始任期仅为“汤姆克鲁斯”。

或许对你计算得分的更好描述是说“汤姆克鲁斯已经''科学教''谷歌分享6.53%。”这消除了所有歧义,因为现在我们知道“汤姆克鲁斯”与“科学论派”一词同时出现6.53%而不是相反(即科学论派6.53%提到汤姆克鲁斯)。

当你这样想的时候,对N个术语的相应概括就会出现。只需在“ has / have ”之前粘贴您想要的任何初始术语,以及您喜欢的其他缩小术语。根据您给出的数字,您可以说“John Travolta的Scientology引用的Stack Overflow GoogleShare为0.05%”或“John Travolta的科学论+ Stack Overflow GoogleShare为0.00369%”。选择哪种方式在上下文中提供更多信息。

答案 2 :(得分:0)

这取决于你所追求的。第一个数字是衡量Stack Overflow作为所有结果的一部分被提及的一个衡量标准,显示了Tom Cruise和Scientology,第二个数字衡量了Stack Overflow和Scientology在所有结果中被提及的频率,显示了Tom Cruise