这种编码的名称是什么?

时间:2010-03-06 06:46:22

标签: php html html-entities

如果您在html页面中复制并粘贴以下文字,

انوان

您将收到以下阿拉伯文字:

  

انوان

我的问题是:

这种类型的编码的名称是什么,包括数字和哈希(#)符号,以及如何在PHP中解码它?

4 个答案:

答案 0 :(得分:8)

这些是... HTML实体(或用于挑剔者的“数字字符引用”)。

尝试html_entity_decode

示例:

$foo = html_entity_decode('انوان');
// gives you the arabic words in $foo

(如果字符串的格式为ا...,则需要两次应用html_entity_decode。(我不知道codaddict的编辑是否有效。)

答案 1 :(得分:3)

这些字符称为HTML entities。基本上,它们是一种更安全的方式来表示&等字符以及可能在HTML中具有含义的其他符号。所有字符都有相应的HTML实体。

您可以使用html_entity_decode

在PHP中解码它们

答案 2 :(得分:0)

您可以使用convert_uudecode()函数进行解码。

<?php
echo convert_uudecode("+22!L;W9E(%!(4\"$`\n`"); //It prints I love PHP!
echo "\n";
echo convert_uudecode('&#1575;&#1606;&#1608;&#1575;&#1606;'); //It prints WU±
?>

答案 3 :(得分:0)

使用适当的术语:

  • &amp;实体参考,它引用名为 amp 的实体。
  • &#1575;字符引用,它引用Unicode字符集中的字符U + 0627(十进制1575)。

两个引用均为character references,因为它们仅引用单个字符。但实体也可以代表不止一个角色。