使用BS4从列表中获取价值

时间:2019-05-22 02:28:22

标签: python html web-scraping beautifulsoup

使用BS4解析网站以提取一些部件号和详细信息。 我可以找到类“ manufDetaiList”,其中包含我要从站点检索的值。然后,我无法从这些字段中检索实际值: pdpProductBrandName-Stronghand工具 pdpProductSKUvalue -02139254 pdpProductMPN -MST327

我已经阅读了许多BS4入门教程,但是找不到所需的东西来帮助提取值。

In [11]:page.find_all (class_= 'manufDetailList')
Out[11]: [<div class="manufDetailList">
  <ul>
 <li>Stronghand Tools</li>
 <input name="pdpProductBrandName" type="hidden" value="Stronghand Tools"/>
 <li>BW#:<span class="hobsondata">02139254</span></li>
 <input name="pdpProductSKU" type="hidden" value="02139254"/>
 <li>Mfr#:<span class="hobsondata">MST327</span></li>
 <input name="pdpProductMPN" type="hidden" value="MST327"/>
 <input name="categoryName" type="hidden" value="Tools - Hand, Measuring &amp; Precision/Clamps – Magnetic/Corner – Pre Tooling"/>
 <li>UNSPSC#:<span class="hobsondata">27112121</span></li>
 </ul>
 </div>]

1 个答案:

答案 0 :(得分:1)

您需要A.convertTo(B,CV_8U,255.0/(Max-Min),-255.0*Min/(Max-Min)); 属性,并且可以使用value属性匹配所需的元素

name

其他人的想法相同。

如果需要,您可以添加父类

soup.select_one('[name="pdpProductBrandName"]')['value']

了解CSS属性选择器heresoup.select_one('.manufDetailList [name="pdpProductBrandName"]')['value'] 代表属性选择器。