使用Python纠正文本中的ASCII渲染

时间:2018-11-13 14:59:48

标签: python ascii non-ascii-characters

我有一个字符串说:

  

” CeAgSb2以四方ZrCuSi2型结构结晶   (P4 / nmm),由Sbâ\ x80 \ x93Ce,Sbâ\ x80 \x93Agâ\ x80 \ x93Ce组成,   Sbâx80x93Sb层。它显示了独特的各向异性铁磁   在9.7K以下订购,具有0.33μB的小的订购力矩。其   剩余电阻率在p câx893.3 GPa以上急剧增加”

此文本包含无法正确显示的几个字符,例如下标符号,单位等。我无法返回源头来获取原始文档。

有没有一种方法可以使用Python将其还原为原始渲染?

如果我构建这些符号及其原始对应物的词典,那么我可以重建原始字符吗?那可能吗?

这已经存在吗? (那太好了)

0 个答案:

没有答案