Scrapy Xpath:当我选择< 12时,我得到“\ r \ n \ t \ t \ t \ t \ t \ t \ t”而不是“< 12”

时间:2013-03-31 07:19:28

标签: python xpath scrapy

html代码就像

<td><12</td>

我想得到&#34;&lt; 12&#34;,但是当我使用&#34;选择(&#39; td / text()&#39;)。extract()&# 34;我得到&#34; [u&#39; \ r \ n \ t \ t \ t \ t \ t \ t \ t \ t \ t&#39;]&#34;。

每件商品都包含&#34;&lt;&#34;都是这样的。我怎样才能获得&#34;&lt; 12&#34;?谢谢!

1 个答案:

答案 0 :(得分:1)

不要在HTML中输入<12,而是键入&lt;12。这应该正确呈现和解析。

解释是HTML认为<是开关标记,因此让他感到困惑。因此,您需要使用一个名为“转义”的过程,这意味着您将所有特殊字符转换为普通的“转义符号”,您的浏览器(或任何正在阅读您的HTML)应该识别这些符号。

快速谷歌搜索提供了here的列表。