将utf-8字符转换为HTML命名实体

时间:2014-05-03 16:09:53

标签: html utf-8 xhtml

我正在寻找以下问题的快速解决方案。我希望开箱即用,但我还没有找到它。

我有一堆utf-8编码的xHTML文件,其中包含一些非ASCII符号,如法语和德语字母以及特殊标点符号。我需要将文件重新编码为Cp1251又称Cyrillic Windows,但为了保留这些字母和符号,我需要将它们表示为HTML命名的字符引用。与此同时,HTML的其余部分应保持不变。问题是我为此目的使用了什么?

我正在运行Ubuntu,我目前的解决方案基于bash和标准Linux工具,如sed,grep,...加上整洁和xsltproc。

提前谢谢!

祝你好运, 维拉德

0 个答案:

没有答案