虽然可以在视图源中看到,但无法在Google搜索中删除元素

时间:2016-11-25 02:44:59

标签: python web-scraping beautifulsoup

如果谷歌搜索中的某个词

,我正在尝试废弃定义

https://www.google.co.in/search?q=define%20subtle#cns=1

虽然当我查看页面的来源但仍无法废弃它们时,可以看到所有含义和示例。

<div class="vk_gy">"his language expresses rich and subtle meanings"</div>

可以在源代码中看到,但是soup.find(“div”,class _ ='vk_gy')返回NONE。

1 个答案:

答案 0 :(得分:0)

确保将完整的html字符串加载到漂亮的汤中。你是如何抓住HTML的?谷歌不喜欢你刮他们的网页。如果你可以将完整加载的html导入到python中,你会发现你的命令应该可行。这是我的输出:

>>> print(soup.find("div", class_='vk_gy').prettify())
<div class="xpdxpnd vk_gy" data-mh="-1">
 <span>
  adjective:
  <b>
   subtle
  </b>
 </span>
 <span>
  ; comparative adjective:
  <b>
   subtler
  </b>
 </span>
 <span>
  ; superlative adjective:
  <b>
   subtlest
  </b>
 </span>
</div>