Ubuntu上的库ICU并不想从Unicode转换为windows-1251

时间:2018-02-10 18:06:21

标签: c++ unicode icu

我正在使用ICU库,我需要从Unicode转换为windows-1251,我写了这个简单的代码:

#include <unicode/unistr.h>
#include <unicode/ucnv.h>

int main(int argc, char** argv)
{
    UErrorCode status = U_ZERO_ERROR;
    UConverter *pConvert = ucnv_open("windows-1251", &status);
    if (status)
    {
        printf("Failed to obtain char set converter: %d\r\n", status);
        return false;
    }
}

我总是得到这个错误:&#34;无法获得字符集.....&#34;在创建UConverter对象期间。

如何解决此错误?我在谷歌搜索但没有找到任何东西。

我使用此代码获取别名文件中包含的所有可用转换器的列表:

for(int i = 0; i < ucnv_countAvailable(); ++i)
    {
        printf("   %s  \n", ucnv_getAvailableName(i));
    }

我在这个列表中找不到&#34; windows-1251&#34;。如何添加此编码?

1 个答案:

答案 0 :(得分:0)

您需要use the macro U_SUCCESS instead of just testing status。错误代码是ICU中的警告:

typedef enum UErrorCode {
  // ...
  U_AMBIGUOUS_ALIAS_WARNING = -122

这很好用:

auto converter = ucnv_open("windows-1251", &error);
if (U_SUCCESS(error))
{
  printf("Success! %s\n", ucnv_getName(converter, &error));
} 

打印出来:

Success! ibm-5347_P100-1998

你得到&#34;含糊不清的原因&#34;警告是因为&#34; windows-1251&#34;是多个规范名称(ibm-5347_P100-1998ibm-1251_P100-1995)的别名。您可以通过使用&#34;别名&#34;更新样本来查看此信息。功能:

int main()
{
  UErrorCode error{ U_ZERO_ERROR };
  const auto n = ucnv_countAvailable();
  for (int i = 0; i < n; ++i)
  {
    auto s = ucnv_getAvailableName(i);
    const auto m = ucnv_countAliases(s, &error);
    if (U_SUCCESS(error))
    {
      for (int j = 0; j < m; ++j)
      {
        auto a = ucnv_getAlias(s, j, &error);
        if (U_SUCCESS(error) && strstr(a, "windows-1251"))
          printf("%s --> %s\n", s, a);
      }
    }
  }
}

(删除strstr调用以查看所有名称/别名的很长列表。