我想测试一些程序是否可以识别Unicode字符并对其正确排序。
有人可以提供一些示例Unicode字符,其原始字符表示与Unicode表示的排序方式不同吗?谢谢。
答案 0 :(得分:-1)
>>> from pyuca import Collator
>>> sorted(["cafe", "caff", "café"])
['cafe', 'caff', 'café']
>>> sorted(["cafe", "caff", "café"], key=Collator().sort_key)
['cafe', 'café', 'caff']