BeautifulSoup4:如何找到其文本包含重音字符的HTML元素?

时间:2014-12-01 15:02:42

标签: beautifulsoup python-unicode

我的HTML代码中有此标记

<td> Open </td>

另一个:

<td> Prévu </td>

我使用(汤是HTML页面)

soup.find(text='Open')

它被发现但是在使用时

 soup.find(text='Prévu')

我没有结果(对象)。

找到这两个关键字的目标不是搜索本身,而是查看表格中的特定元素是否具有值打开Prévu(表格格式不正确,所以我不能真正依赖固定的结构来匹配特定的细胞。)

我猜问题来自重音字母。我也试过

&egrave;
&eacute;

但结果相同。

有任何线索吗? 提前致谢

1 个答案:

答案 0 :(得分:2)

使用 unicode 解决问题:

soup.find(text=u'Prévu')