我有一些ASCII编码的文件,其中包含各个Unicode字符的ascii表示形式,例如...
,--
等,我想将其转换为例如用于显示目的的Unicode省略号和en-dash符号。这可以像对所有这些映射的简单替换过滤器一样简单(以正确的顺序,捕捉---
- > —
和--
- > {{1}之类的内容}, 当然)。 (注意:不仅仅是那些)
是否存在所有此类转换的数据库?我假设逆必须以某种方式存在,以便能够在任何可能的情况下优雅地将unicode转换为明文,例如–
- > …
。
只要在大多数情况下转换是合适的并且有意义,它就不必非常准确。输出将仅显示给用户,不会被进一步处理。我可以在我去的时候自己编译一个列表,但是如果它已经完成,那么节省时间并避免重复工作会很好。
谢谢!
答案 0 :(得分:1)
全面的列表并不是一个好主意,因为存在许多兼容性的Unicode字符,或者支持不足(请参阅我的评论)。相反,您可能希望使用像SmartyPants这样的策划列表/库(大多数其他语言都可以找到ports / alternatives)。