我只想从yahoo财务页面抓取一家公司的业务摘要,例如https://in.finance.yahoo.com/quote/AAPL?p=AAPL 业务摘要是右侧网页上公司资料下方的信息。 我可以看到它是在“ p”类中定义的。但它完全嵌套在div中。我无法使用漂亮的汤导航到它。
我尝试过
article_text = ''
article = soup.findAll('p', {'class': 'businessSummary Mt(10px) 0v(h)
Tov(e)'})
import pdb; pdb.set_trace()
for element in article:
article_text += '\n' + ''.join(element.findAll(text = True))
print article_text
但是它没有返回段落文本。
预先感谢。我无法粘贴网页的源检查。无法格式化以易于阅读的方式粘贴到此处。