Python - 使用谷歌自定义搜索引擎的字数

时间:2018-01-16 07:19:26

标签: python google-search

我正在使用python使用自定义Google引擎进行搜索。我能够使用结果[“searchInformation”] [“totalResults”]找到搜索结果的总数。我如何计算特定单词在搜索中出现的次数?

1 个答案:

答案 0 :(得分:0)

调查API在搜索后返回的参数我没有在可访问的字段中找到类似于自动字数的内容。但是我找到了一个可能对你有用的解决方法;您可以从结果转储文件中执行字数统计的手动例程。

由于文件受到您可以搜索的最大页数的限制,我建议您使用适合您的最大数量(我的数字是11,因搜索到搜索而异)。

如果将这些结果转储到json文件中,您将能够执行以下代码的单词计数(它在linux shell中,尽管您也可以在python中实现它):

cat data.json | tr -s "," "\n" | grep -e "title" -e "snippet" | grep -c '<your word>'

其中:

  • 'data.json':是包含API搜索结果的转储文件。
  • 'tr -s&#34;,&#34; &#34; \ n&#34;':为每个列出的行进行行分隔。
  • 'grep -e&#34; title&#34; -e&#34; snippet&#34;':仅过滤“title”或“snippet”的行(结果的标题和说明,没有元数据)
  • 'grep -c&#39;&#39;':计算引入的单词