如何将Unicode字符转换为HTML编码C ++?

时间:2014-08-05 17:55:46

标签: html c++ encoding

我需要你的帮助..如何在C ++中转换像这样的unicode字符

Thére Àre sôme spëcial charâcters ïn thìs têxt
عربى

像这样的HTML编码?

Thére Àre sôme spëcial charâcters ïn thìs têxt
عربى

非常感谢您的帮助 谢谢:))

1 个答案:

答案 0 :(得分:1)

除非您能找到第三方API来为您处理此问题,否则您可能需要手动编写代码:

  1. 将输入字符串数据转换为代码点值(即UTF-32)。

  2. 对于每个代码点值:

    一个。如果它在ASCII可视范围内(U + 0009,U + 000A,U + 000D,以及U + 0020到U + 007E),则将该值存储/显示为8位ASCII字符。

    湾否则,检查是否存在与代码点关联的可用实体名称(请参阅thisthisthisthis),如果是,则存储/显示该名称&name;格式。

    ℃。否则,以&#XXXX;格式存储/显示代码点值,其中XXXX是代码点的数值。