我的问题是我必须抓一个网站:
<div class="xyz tab"> blah blah </div>
同一网站的另一个div如下:
<div class="xyz">blah blah</div>
在没有空间的情况下刮取网站我可以使用此
pyquery('.xyz').text()
但是对于有空间我该怎么办?
答案 0 :(得分:3)
如果您需要检查xyz
和tab
课程,可以使用.xyz.tab
:
>>> from pyquery import PyQuery as pq
>>> data = """
... <div>
... <div class="xyz tab">test1</div>
... <div class="xyz">test2</div>
... </div>
... """
>>> d = pq(data)
>>> print d('.xyz.tab')
<div class="xyz tab">test1</div>