网页抓取时我无法从表中检索所有行

时间:2021-01-09 20:58:28

标签: python-3.x beautifulsoup

这是我的代码。我实际上想从与主机联系的表中提取所有行。但我只能从表中检索一行。 for 循环不起作用。或者也许我没有很好地理解它。我是网络抓取的新手。

抓取自:HYBRID Analysis 使用以下代码:

import requests
from bs4 import BeautifulSoup

url = "https://www.hybrid-analysis.com/sample/a1b38a18decb253708e0198bfaaed97ef1c16fc061f1dc8c1ba00e98ef77092e/5ff1a85664a2e10f370a6c02"
r = requests.session()
page = r.get(url, headers = {'User-Agent': 'Mozilla/5.0'})
soup = BeautifulSoup(page.content, 'html.parser')
id1 = soup.find(id = 'contacted-hosts')
class1 = id1.find_all(class_='table table-striped small')

soup.find('div',{'class':'modal-dialog modal-xl'}).decompose()
soup.find('button',{'class':'btn btn-danger btn-xs btn-labeled smallest'}).decompose()
soup.find('div',{'class':'modal fade bs-example-modal-lg sample-network-traffic-modal'}).decompose()

#print(class1[0].find(class_='warning').get_text())
host1 = [item.find(class_='warning').get_text().strip().replace("\n", "") for item in class1]
print(host1)

结果:https://i.stack.imgur.com/n2uLO.png

0 个答案:

没有答案
相关问题