Question

我们说我们有一个字符串

Bruce Wayne is Batman

当我将此字符串转换为HTML字符时，输出将为

Bruce Wayne is Batman

我试图在python 2.7中找到一种方法。任何人都可以建议如何做到这一点？

我搜遍了stackoverflow，我找到的所有答案都是如何转义HTML特殊字符。我不是想要转义特殊字符，而是将任何和所有字符串转换为它们的HTML char等价物。 mozila firefox的hackbar插件能够成功完成，我想用python实现相同的功能。

HTMLParse库也可以使用unescape（）模块成功解码它。在python中是否有一个库来编码它，就像上面提到的那样？此外，我不是在寻找像BeautifulSoup这样的外部库，而是一个内置的库，因为它不会为工具添加依赖项。

Answer 1

据我所知，标准库中没有任何内容可以执行此操作（编码每个字符，因为它的实体引用不是常见的事情），但是转换的功能很简单：

def entitify(text):
    return ''.join('&#%d;' % ord(c) for c in text)

>>> entitify('Bruce Wayne is Batman')
'&#66;&#114;&#117;&#99;&#101;&#32;&#87;&#97;&#121;&#110;&#101;&#32;&#105;&#115;&#32;&#66;&#97;&#116;&#109;&#97;&#110;'

>>> entitify(u'Rinôçérôse')
'&#82;&#105;&#110;&#244;&#231;&#233;&#114;&#244;&#115;&#101;'

该函数只使用ord()内置函数来获取每个字符的字节值或代码点，将其包装在&#...;中，然后将结果连接在一起。

Python将字符串转换为HTML char等价物

1 个答案: