使用python从网页中提取一个部分

时间:2012-02-27 18:47:03

标签: python html web-scraping lxml webpage

我想使用python和lxml从下面的网站中提取部分症状的测试部分。任何人都可以帮忙。

http://www.ncbi.nlm.nih.gov/pubmedhealth/PMH0001851/

谢谢,

1 个答案:

答案 0 :(得分:1)

你想用lxml抓一个网页?试试这个:

 from lxml.html import parse
 doc = parse("http://www.ncbi.nlm.nih.gov/pubmedhealth/PMH0001851/").getroot()
 for h2 in doc.cssselect('h2'):
     print h2.text_content()

这将打开你的页面中的h2s。