如何编写一个wstring行包含一个文件的不同语言?

时间:2012-07-30 04:33:59

标签: c++ c string character-encoding wofstream

我从22个不同语言的文件中分离了部分,并使它们成为一个像以下字符串的行:

wstring wstr_line = L"\"IDS_TOAST_ECOON\",\"eco Mode is turned On.\",\"ecoモードをオンにしました。\",\"Režim eco je zapnutý.\",\"Økoindstillingen er aktiveret\"..."

我使用wofstream将wstr_line放入文件中,但该行在日语部分完成(\“ecoモードをオンにしました。\”)。 如果我设置wfout.imbue("chs");捷克部分的行(\“Režimecojezapnutý。\”)

如何正确地将此行写入文件?

2 个答案:

答案 0 :(得分:0)

尝试将此作为代码中的第一行:

int main()
{
    std::cout.imbue(std::locale(""));

这将应用程序的本地设置为机器支持的内容(宽字符串可能是UTF-32)。不幸的是,对于程序员来说,默认的本地是“C”,而“C”本地的codecvt方面没有做任何有用的事情(可能会在没有转换的情况下将宽章程截断为单个字节)。

答案 1 :(得分:0)

我已经在另一个策略output the lines in bytes中解决了这个问题。使用下面的函数输出wstring,无论它包含什么字符。

void output(ofstream &fout, vector<wstring> wline_list)
{
    void outputline(ofstream &, wstring);
  //pre output 0xFF and 0xFE to make the file encoding in UTF-16
    const BYTE PRE_LOW = 0xFF;
    const BYTE PRE_HIGH = 0xFE;
    fout << PRE_LOW << PRE_HIGH;
    for(vector<wstring>::size_type i(0); i<wline_list.size(); i++)
        outputline(fout, wline_list[i]);
}

void outputline(ofstream &fout, wstring line)
{
    void getByte(BYTE btchar[2], WORD wdChar);
    BYTE btChar[2] = {0,0};

    const BYTE CHANGE_LINE1_LOW = 0x0D;
    const BYTE CHANGE_LINE1_HIGH = 0x00;
    const BYTE CHANGE_LINE2_LOW = 0x0A;
    const BYTE CHANGE_LINE2_HIGH = 0x00;

    WORD wdChar(0);
    for(wstring::size_type i(0); i<line.length(); i++)
    {
        wdChar = line[i];
        getByte(btChar, wdChar);
        fout << btChar[0] << btChar[1];
    }
  //it needs this two chars to change line.
    fout << CHANGE_LINE1_LOW << CHANGE_LINE1_HIGH
        << CHANGE_LINE2_LOW << CHANGE_LINE2_HIGH;
}

void getByte(BYTE btchar[2], WORD wdChar)
{
    btchar[0] = wdChar % 0x0100;
    btchar[1] = wdChar / 0x0100;
}