文本文件中的特殊字符(表情符号)

时间:2013-09-30 09:58:06

标签: utf-8 character-encoding special-characters emoji emoticons

我有一个从WhatsApp导出的对话的txt文件。 WhatsApp在他们的对话中支持表情符号,出乎意料的是,导出的对话也包含这些表情符号!也就是说,如果我在文本编辑器中打开文本文件(Mac 10.8上的Text Wrangler),我可以看到表情符号。文本文件以UTF-8编码,并且没有与我可以告诉的文件相关联的资源。

有人可以向我解释这些表情符号是如何包含在文本文件中的,以及文本编辑器如何准确地解释它们?这与字符编码有关吗?文本文件中是否包含额外资源?

1 个答案:

答案 0 :(得分:22)

Unicode包含将表情符号指定为“字符”的部分。它们是常规字符,您只需要一种可以显示它们的字体。另请参阅Unicode Emoji FAQ

在文本文件中,字符基本上以字节的形式编码为数字。要在计算机屏幕上以可视方式显示这些内容,您需要一个 font ,其中包含用于呈现此字符的可视字形。由于该过程总是数字标识符→字体→可见字形,因此很明显“字符”可以是任何视觉效果,包括表情符号或任何其他图像。

character viewer