在python 3.6中使用beautifulsoup4抓取产品信息的网站时

时间:2019-08-26 18:00:58

标签: web-scraping beautifulsoup python-3.6

我没有得到如何仅抓取文本的信息,下面是我编写的用于抓取itemTitle和itemPrice的代码。如果这看起来很愚蠢,对不起,我是新手。

  

输入:

i_price = soup.find_all('span',{'class':'_89yzn'})
i_name = soup.find_all('span',{'class': ['_2tW1I']} )

for name,price in zip(i_name, i_price):
  print(name)
  print(price)
  

输出:

<span class="_2tW1I" data-aut-id="itemTitle">Wedding dress</span>
<span class="_89yzn" data-aut-id="itemPrice">Rs 4,000</span>

我只希望显示文本,否则看起来很难看。

1 个答案:

答案 0 :(得分:0)

IIUC:

i_price = soup.find_all('span',{'class':'_89yzn'})
i_name = soup.find_all('span',{'class': ['_2tW1I']} )

for name,price in zip(i_name, i_price):
  print(name.text)
  print(price.text)
相关问题