Question

我没有得到如何仅抓取文本的信息，下面是我编写的用于抓取itemTitle和itemPrice的代码。如果这看起来很愚蠢，对不起，我是新手。

输入：

i_price = soup.find_all('span',{'class':'_89yzn'})
i_name = soup.find_all('span',{'class': ['_2tW1I']} )

for name,price in zip(i_name, i_price):
  print(name)
  print(price)

输出：

<span class="_2tW1I" data-aut-id="itemTitle">Wedding dress</span>
<span class="_89yzn" data-aut-id="itemPrice">Rs 4,000</span>

我只希望显示文本，否则看起来很难看。

Answer 1

IIUC：

i_price = soup.find_all('span',{'class':'_89yzn'})
i_name = soup.find_all('span',{'class': ['_2tW1I']} )

for name,price in zip(i_name, i_price):
  print(name.text)
  print(price.text)

在python 3.6中使用beautifulsoup4抓取产品信息的网站时

1 个答案: