我有以下HTML代码:
<dl>
<dt>1</dt>
<dd>2</dd>
<dt>3</dt>
<dd>4</dd>
<dt>5</dt>
<dd>6</dd>
<dt>7</dt>
<dd>8</dd>
</dl>
现在我想连接每个dt
和dd
标签,xpath 1.0可能吗?
所以结果应该是:
12
34
56
78
已经尝试过这样的事情,但没有成功:
//*/dl[concat(dt/text(), ./following-sibling::node()/text())]
答案 0 :(得分:0)
使用python工作:
content = sel.xpath('//*/dl').extract()
p = re.compile(ur'<dt[^>]*>(.*?)<\/dd[^>]*>')
for s in p.findall(str(prod_specs)):
print BeautifulSoup(s).text