Question

我在数据库中检索结果：

(86, 'B{\\u{a}}beanu', 'Alexandru-Ionut') 
(101, "Dosil Su{\\'a}rez", 'Alvaro') 
(119, 'Massafferri', "Andr{\\'e}") 
(161, 'M{\\"u}ller', 'Anke-Susanne')

我想将这些字符从乳胶解码为unicode，例如utf8（它将显示在网页上）。但我无法在服务器上安装模块，例如latexCodec

我发现在网络上为我工作的脚本，甚至在stackoverflow上都没有。有这个工作的脚本吗？

提前谢谢你。

Answer 1

根据服务器的设置方式，您可以安装latexcodec的用户副本 - 例如，使用pip install --user或将tarball解压缩到相应的pythonx.y } ~/.local/lib中的文件夹。如果即使这不是一个选项，你可以在最坏的情况下仍然在项目目录中保留它的静态副本。这些方法都不会由您处理，但这似乎不是一个大问题 - latexcodec git respository近一年内没有收到任何更新。

请注意，使用latexcodec会将乳胶解析为 unicode ，而不是utf-8编码的字节 - 但这几乎肯定是您真正想要的，如果它真的不是＆＃39; t，你可以从那里重新编码为utf8。

用于解析/将乳胶串转换为utf-8的Python脚本？

1 个答案: