用于解析/将乳胶串转换为utf-8的Python脚本?

时间:2015-08-18 10:02:08

标签: python utf-8 latex tex

我在数据库中检索结果:

(86, 'B{\\u{a}}beanu', 'Alexandru-Ionut') 
(101, "Dosil Su{\\'a}rez", 'Alvaro') 
(119, 'Massafferri', "Andr{\\'e}") 
(161, 'M{\\"u}ller', 'Anke-Susanne') 

我想将这些字符从乳胶解码为unicode,例如utf8(它将显示在网页上)。 但我无法在服务器上安装模块,例如latexCodec

我发现在网络上为我工作的脚本,甚至在stackoverflow上都没有。有这个工作的脚本吗?

提前谢谢你。

1 个答案:

答案 0 :(得分:2)

根据服务器的设置方式,您可以安装latexcodec的用户副本 - 例如,使用pip install --user或将tarball解压缩到相应的pythonx.y } ~/.local/lib中的文件夹。如果即使这不是一个选项,你可以在最坏的情况下仍然在项目目录中保留它的静态副本。这些方法都不会由您处理,但这似乎不是一个大问题 - latexcodec git respository近一年内没有收到任何更新。

请注意,使用latexcodec会将乳胶解析为 unicode ,而不是utf-8编码的字节 - 但这几乎肯定是您真正想要的,如果它真的不是' t,你可以从那里重新编码为utf8。