Question

html代码就像

<td><12</td>

我想得到＆＃34;＆lt; 12＆＃34;，但是当我使用＆＃34;选择（＆＃39; td / text（）＆＃39;）。extract（）＆＃ 34;我得到＆＃34; [u＆＃39; \ r \ n \ t \ t \ t \ t \ t \ t \ t \ t \ t＆＃39;]＆＃34;。

每件商品都包含＆＃34;＆lt;＆＃34;都是这样的。我怎样才能获得＆＃34;＆lt; 12＆＃34;？谢谢！

Answer 1

不要在HTML中输入<12，而是键入<12。这应该正确呈现和解析。

解释是HTML认为<是开关标记，因此让他感到困惑。因此，您需要使用一个名为“转义”的过程，这意味着您将所有特殊字符转换为普通的“转义符号”，您的浏览器（或任何正在阅读您的HTML）应该识别这些符号。

快速谷歌搜索提供了here的列表。