我想使用python和lxml从下面的网站中提取部分症状的测试部分。任何人都可以帮忙。
http://www.ncbi.nlm.nih.gov/pubmedhealth/PMH0001851/
谢谢,
答案 0 :(得分:1)
你想用lxml抓一个网页?试试这个:
from lxml.html import parse
doc = parse("http://www.ncbi.nlm.nih.gov/pubmedhealth/PMH0001851/").getroot()
for h2 in doc.cssselect('h2'):
print h2.text_content()
这将打开你的页面中的h2s。