使用中文字符时文件名错误

时间:2015-06-22 03:37:47

标签: c++ string character-encoding char

我尝试使用中文字符在Windows上创建文件。整个路径都在变量" std :: string originalPath"里面,但是,我有一个我无法理解的字符集问题需要克服。

我写了以下代码:

#include <iostream>
#include <boost/locale.hpp>
#include <boost/filesystem/fstream.hpp>
#include <windows.h>

int main( int argc, char *argv[] )
{

    // Start the rand
    srand( time( NULL ) );

    // Create and install global locale
    std::locale::global( boost::locale::generator().generate( "" ) );
    // Make boost.filesystem use it
    boost::filesystem::path::imbue( std::locale() );

    // Check if set to utf-8
    if( std::use_facet<boost::locale::info>( std::locale() ).encoding() != "utf-8" ){
        std::cerr << "Wrong encoding" << std::endl;
        return -1;
    }

    std::string originalPath = "C:/test/s/一.png";

    // Convert to wstring (**WRONG!**)
    std::wstring newPath( originalPath.begin(), originalPath.end() );

    LPWSTR lp=(LPWSTR )newPath.c_str();
    CreateFileW(lp,GENERIC_READ | GENERIC_WRITE, FILE_SHARE_READ |
            FILE_SHARE_WRITE,     NULL,CREATE_ALWAYS,FILE_ATTRIBUTE_NORMAL,NULL );

    return 0;

}
然而,

运行它,我进入文件夹&#34; C:\ test \ s&#34;一个名字&#34; |ㅈタ.png&#34;的文件,而不是我想要的&#34;一.png&#34;。我发现克服这一点的唯一方法是交换行

std::string originalPath = "C:/test/s/一.png";

// Convert to wstring (**WRONG!**)
std::wstring newPath( originalPath.begin(), originalPath.end() );

简单地

std::wstring newPath = L"C:/test/s/一.png";

在这种情况下文件&#34;一.png&#34;完全出现在文件夹&#34; C:\ test \ s&#34;中。尽管如此,我不能这样做,因为软件从std :: string变量获取其路径。我认为从std :: string到std :: wstring的转换是以错误的方式执行的,但是,可以看出,我在尝试理解这个逻辑时遇到了很大的问题。我详尽地阅读和研究了Google,阅读了许多定性文本,但我的所有尝试似乎都毫无用处。我尝试了MultiByteToWideChar函数以及boost :: filesystem,但两者都没有帮助,我只是在写入文件夹时无法获得正确的文件名。

我还在学习,所以如果我犯了一个愚蠢的错误,我很抱歉。我的IDE是Eclipse,它设置为UTF-8。

2 个答案:

答案 0 :(得分:2)

您需要将UTF-8字符串实际转换为UTF-16。为此,您必须查找如何使用boost::locale::conv或(仅限Windows)MultiByteToWideChar函数。

std::wstring newPath( originalPath.begin(), originalPath.end() );无法正常工作,只需逐个复制所有字节并将其转换为wchar_t。

答案 1 :(得分:1)

谢谢你的帮助,罗兰。最后我设法找到了解决方案,我只是使用了以下库:“http://utfcpp.sourceforge.net/”。我使用函数“utf8 :: utf8to16”将原始的UTF-8字符串转换为UTF-16,这样就可以让Windows正确显示中文字符。