我有一个包含日文文本的_bstr_t
字符串。我想将此字符串转换为UTF-8字符串,该字符串定义为char *
。
我可以将_bstr_t
字符串转换为char *
(UTF-8)字符串而不会丢失日文字符吗?
答案 0 :(得分:16)
使用WideCharToMultiByte() - 将CP_UTF8作为第一个参数传递。
请注意BSTR可以是空指针并且对应于空字符串 - 将其视为特殊情况。
答案 1 :(得分:1)
以下是一些应该进行转换的代码。
void PrintUtf8(const TCHAR* value) {
if (value == nullptr) {
printf("");
return;
}
int n = WideCharToMultiByte(CP_UTF8, 0, value, -1, nullptr, 0, nullptr, nullptr);
if (n <= 0) {
printf("");
return;
}
char* buffer = new char[n];
WideCharToMultiByte(CP_UTF8, 0, value, -1, buffer, n, nullptr, nullptr);
printf("%s", buffer);
delete(buffer);
}
答案 2 :(得分:-1)
非常方便的MSDN参考此类事情:http://msdn.microsoft.com/en-us/library/ms235631(VS.80).aspx
我认为你需要去wchar_t *因为char *会失去Unicode的东西,虽然我不确定。
// convert_from_bstr_t.cpp
// compile with: /clr /link comsuppw.lib
#include <iostream>
#include <stdlib.h>
#include <string>
#include "atlbase.h"
#include "atlstr.h"
#include "comutil.h"
using namespace std;
using namespace System;
int main()
{
_bstr_t orig("Hello, World!");
wcout << orig << " (_bstr_t)" << endl;
// Convert to a char*
const size_t newsize = 100;
char nstring[newsize];
strcpy_s(nstring, (char *)orig);
strcat_s(nstring, " (char *)");
cout << nstring << endl;
// Convert to a wchar_t*
wchar_t wcstring[newsize];
wcscpy_s(wcstring, (wchar_t *)orig);
wcscat_s(wcstring, L" (wchar_t *)");
wcout << wcstring << endl;
// Convert to a CComBSTR
CComBSTR ccombstr((char *)orig);
if (ccombstr.Append(L" (CComBSTR)") == S_OK)
{
CW2A printstr(ccombstr);
cout << printstr << endl;
}
// Convert to a CString
CString cstring((char *)orig);
cstring += " (CString)";
cout << cstring << endl;
// Convert to a basic_string
string basicstring((char *)orig);
basicstring += " (basic_string)";
cout << basicstring << endl;
// Convert to a System::String
String ^systemstring = gcnew String((char *)orig);
systemstring += " (System::String)";
Console::WriteLine("{0}", systemstring);
delete systemstring;
}