我正在尝试将C ++ std::string
转换为UTF-8或std::wstring
而不会丢失信息(考虑包含非ASCII字符的字符串)。
根据http://forums.sun.com/thread.jspa?threadID=486770&forumID=31:
如果std :: string具有非ASCII字符,则必须提供一个从编码转换为UTF-8 [...]
的函数
std::string.c_str()
使用什么编码?如何以跨平台方式将其转换为UTF-8或std::wstring
?
答案 0 :(得分:41)
std::string
本身不使用编码 - 它将返回您放入其中的字节。例如,那些字节可能正在使用ISO-8859-1编码...或任何其他,真的:关于编码的信息就不存在 - 您必须知道字节的来源!
答案 1 :(得分:6)
std::string
包含任何字节序列,因此编码取决于您。你必须知道它是如何编码的。但是,如果您不知道它是其他东西,它可能只是ASCII。在这种情况下,它已经与UTF-8兼容了。