如果您在html页面中复制并粘贴以下文字,
انوان
您将收到以下阿拉伯文字:
انوان
我的问题是:
这种类型的编码的名称是什么,包括数字和哈希(#)符号,以及如何在PHP中解码它?
答案 0 :(得分:8)
这些是... HTML实体(或用于挑剔者的“数字字符引用”)。
示例:
$foo = html_entity_decode('انوان');
// gives you the arabic words in $foo
(如果字符串的格式为ا...
,则需要两次应用html_entity_decode
。(我不知道codaddict的编辑是否有效。)
答案 1 :(得分:3)
这些字符称为HTML entities。基本上,它们是一种更安全的方式来表示&
等字符以及可能在HTML中具有含义的其他符号。所有字符都有相应的HTML实体。
您可以使用html_entity_decode
答案 2 :(得分:0)
您可以使用convert_uudecode()函数进行解码。
<?php
echo convert_uudecode("+22!L;W9E(%!(4\"$`\n`"); //It prints I love PHP!
echo "\n";
echo convert_uudecode('انوان'); //It prints WU±
?>
答案 3 :(得分:0)
使用适当的术语:
&
是实体参考,它引用名为 amp 的实体。ا
是字符引用,它引用Unicode字符集中的字符U + 0627(十进制1575)。两个引用均为character references,因为它们仅引用单个字符。但实体也可以代表不止一个角色。