我可以在我的两台计算机IOS,WINDOWS上正确运行这些代码,但它可以在我公司的计算机Linux上找到98个名字。他们都使用python 2.7
import requests, bs4
index_url = 'http://www.nlm.nih.gov/medlineplus/druginfo/herb_All.html'
def get_urls():
response = requests.get(index_url)
soup = bs4.BeautifulSoup(response.text)
#print(response.)
return [a.attrs.get('href') for a in soup.select('div.section-body a[href^=]')]
print(len(get_urls()))
答案 0 :(得分:3)
也许确保您使用相同的解析器,并且可能指定您在代码中使用哪种html解析器,当您在不同的计算机上运行它时,它将知道要使用哪种解析器。
BeautifulSoup(markup, "html.parser")
文档中有更多相关信息。