import pandas as pd
import requests
from bs4 import BeautifulSoup
page = requests.get('https://www.adityaispat.com/vision-mission.html', verify=False)
#url = "https://www.aarti-industries.com/csr/"
#page = requests.get(url)
soup = BeautifulSoup(page.text, 'html.parser')
print(soup.find(class_="text").text)
or
print(soup.find('td', attrs={'class': 'text'}).text)
答案 0 :(得分:0)
您问题的简单答案是newCount
方法返回类型为find()
的对象,而您正尝试从中读取NoneType
。为防止这种情况,值得首先检查text
是否给出任何结果。
find()
另一个答案是问题:您想找到什么?也许您的班级和/或要搜索的属性定义不正确。
在您看来,问题的真正根源是result = soup.find(class_="text")
if result:
print(result.text)
else
# other action
部分。如果选中request
,您会注意到它返回406,这意味着请求不成功。
基于此solution,您需要使用其他User-Agent。还记得检查请求是否成功。简单的方法是使用page.status_code
属性。
ok