Question

我想使用python和lxml从下面的网站中提取部分症状的测试部分。任何人都可以帮忙。

http://www.ncbi.nlm.nih.gov/pubmedhealth/PMH0001851/

谢谢，

Answer 1

你想用lxml抓一个网页？试试这个：

 from lxml.html import parse
 doc = parse("http://www.ncbi.nlm.nih.gov/pubmedhealth/PMH0001851/").getroot()
 for h2 in doc.cssselect('h2'):
     print h2.text_content()

这将打开你的页面中的h2s。

使用python从网页中提取一个部分

1 个答案: