我正在使用Python来抓取特定表中的数据并将其保存到一个文件中,该文件将填充来自多个网页(化合物)的相同表格。但是,我在使用BeautifulSoup识别合适的表时遇到了困难。 以下是相关的HTML代码:
Table Identifier HTML from Website
以下是我的代码的相关部分:
url2="https://chem.nlm.nih.gov/chemidplus/rn/50-00-0"
r=requests.get(url2)
html=r.content
soup=BeautifulSoup(html,'lxml')
print(soup.prettify())
给我一个只有脚本的HTML: “自动搜索:每3秒最多1次。重新加载1. setTimeout(function(){location.reload(true);},1100);”
我认为这是我的代码中的错误,但是网络搜索没有解释为什么会出现这种情况,或者如何修复它。 *更新/结论:我在页面加载后和识别表之后添加了driver.implicitly_wait(3)以减慢程序。该错误尚未复制。
答案 0 :(得分:1)
更新/结论:我在页面加载后和识别表格之后添加了driver.implicitly_wait(3)以减慢程序。该错误尚未复制。