我正试图从其类值包含compText的元素中提取文本。问题是它提取了我想要的文本以外的所有内容。
当我在开发人员工具中使用CSS选择器时,它可以正确识别该元素。
当输入的查询没有结果时,我正在尝试抓取Yahoo SERP中显示的文本。
代码如下:
import requests
from bs4 import BeautifulSoup
url = "http://search.yahoo.com/search?p="
query = '"based specialty chemicals. Blocks. Organosilicone. Reference"'
r = requests.get(url + query)
soup = BeautifulSoup(r.text, "html.parser")
for EachPart in soup.select('div[class*="compText"]'):
print (EachPart.text)
怎么了?
Thx,
编辑:提取的文本似乎是我在SERP上可以找到的“有机硅树脂”一词的定义。
EDIT2:这是我收到的文字的摘要:“由'Specialty Chemicals'成员公司(其中许多是中小企业)创建和生产的产品源于原始的不断创新。它们推动了碳,资源高效和知识型未来经济。”和使用浏览器
时SERP的屏幕截图