使用BeautifulSoup查找具有两种特定样式的标记

时间:2016-02-01 20:56:25

标签: python html css python-2.7 beautifulsoup

我正在尝试使用Python2.7中的BeautifulSoup(bs4)包在html文档中查找以下标记:

<div style="position:absolute; border: textbox 1px solid; writing-mode:lr-tb; left:408px; top:540px; width:14px; height:9px;"><span style="font-family: OEULZL+ArialMT; font-size:9px">0.00<br></span></div>

在html文档中,还有多个其他标签几乎完全相同 - 唯一一致的区别是“left:408px”和“height:9px”属性。

如何使用BeautifulSoup找到此标记?

我尝试了以下内容:

from bs4 import BeautifulSoup as bs

soup = bs("<div style="position:absolute; border: textbox 1px solid; writing-mode:lr-tb; left:408px; top:540px; width:14px; height:9px;"><span style="font-family: OEULZL+ArialMT; font-size:9px">0.00<br></span></div>", 'html.parser')

soup.find_all('div', style=('left:408px' and 'height:9px'))
soup.find_all('div', style=('left:408px') and style=('height:9px')) #doesn't like style being used twice
soup.find_all('div', {'left':'408px' and 'height':'9px'})
soup.find_all('div', {'left:408px'} and {'height:9px'})
soup.find_all('div', style={'left':'408px' and 'height':'9px'})
soup.find_all('div', style={'left:408px'} and {'height:9px'})

有什么想法吗?

1 个答案:

答案 0 :(得分:7)

您可以查看style内的left:408pxheight:9px

soup.find('div', style=lambda value: value and 'left:408px' in value and 'height:9px' in value)

或者:

import re
soup.find('div', style=re.compile(r'left:408px.*?height:9px'))

或者:

soup.select_one('div[style*="408px"]')

请注意,通常,样式属性不可靠用于定位元素。查看是否还有其他内容 - 检查父元素,兄弟元素,或者元素附近是否有相应的标签。

请注意,更合适的CSS选择器为div[style*="left:408px"][style*="height:9px"],但由于limited CSS selector supportthis bug,它不会按原样运行。