ASCII到Unicode“美化”

时间:2015-08-29 14:10:54

标签: text unicode

我有一些ASCII编码的文件,其中包含各个Unicode字符的ascii表示形式,例如...--等,我想将其转换为例如用于显示目的的Unicode省略号和en-dash符号。这可以像对所有这些映射的简单替换过滤器一样简单(以正确的顺序,捕捉--- - > -- - > {{1}之类的内容}, 当然)。 (注意:不仅仅是那些)

是否存在所有此类转换的数据库?我假设逆必须以某种方式存在,以便能够在任何可能的情况下优雅地将unicode转换为明文,例如 - >

只要在大多数情况下转换是合适的并且有意义,它就不必非常准确。输出将仅显示给用户,不会被进一步处理。我可以在我去的时候自己编译一个列表,但是如果它已经完成,那么节省时间并避免重复工作会很好。

谢谢!

1 个答案:

答案 0 :(得分:1)

全面的列表并不是一个好主意,因为存在许多兼容性的Unicode字符,或者支持不足(请参阅我的评论)。相反,您可能希望使用像SmartyPants这样的策划列表/库(大多数其他语言都可以找到ports / alternatives)。