终端中这个粉红色的全块utf-8字符是什么?

时间:2019-07-08 17:25:14

标签: utf-8

我正在使用pdftotext使用默认的utf-8编码将pdf文件转换为utf-8文本文件。例如

pdftotext input.pdf output.txt

在Emacs 23.4.1终端中查看时,一些文本文件看起来像粉红色的全块字符。这是截图。 enter image description here

起初,我认为这是一个完整的块字符,所以我试图在Perl脚本中将其删除。

$string =~ s/\x{2588}//g;

这并未删除字符。我想知道这是否是特定的UTF-8错误字符,由pdftotext引起的某种 mojibake 还是Emacs的问题。

0 个答案:

没有答案