html代码就像
<td><12</td>
我想得到&#34;&lt; 12&#34;,但是当我使用&#34;选择(&#39; td / text()&#39;)。extract()&# 34;我得到&#34; [u&#39; \ r \ n \ t \ t \ t \ t \ t \ t \ t \ t \ t&#39;]&#34;。
每件商品都包含&#34;&lt;&#34;都是这样的。我怎样才能获得&#34;&lt; 12&#34;?谢谢!
答案 0 :(得分:1)
不要在HTML中输入<12
,而是键入<12
。这应该正确呈现和解析。
解释是HTML认为<
是开关标记,因此让他感到困惑。因此,您需要使用一个名为“转义”的过程,这意味着您将所有特殊字符转换为普通的“转义符号”,您的浏览器(或任何正在阅读您的HTML)应该识别这些符号。
快速谷歌搜索提供了here的列表。