如何在CPP中按字典顺序有效地对utf8字符串进行排序

时间:2018-11-05 14:38:25

标签: c++ sorting utf-8

我想读取utf-8文件,并将第一行按字典顺序排序。

通常我可以将字符串作为ASCII值进行排序,因为它们已经按照字典顺序进行了排序。但是,当我使用UTF-8时,会变得混乱。 "şğöIä"等未按ASCII码排序。

我正在使用utfcpp库来读取我的文本文件。但是我找不到如何订购UTF-8字符串。

  

输入将类似于:sşaf

     

输出将类似于:afsş

我认为我可以分配一个字符串常量变量,例如

const string letters = "ABCÇDEFGĞHIİJKLMNOÖPRSŞTUÜVYZabcçdefgğhıijklmnoöprsştuüvyz";

然后我可以检查字母的索引以找到要排序的字母的字典顺序。

有没有更好或更简单的方法可以解决我的问题?

0 个答案:

没有答案