我有一组PDF,我使用HTML 4.01导出选项导出到HTML文件。当我在SublimeText或Chrome中打开文件时,所有特殊字符都显示为?。声明的编码是UTF-8:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html40/strict.dtd">
<!-- Created from PDF via Acrobat SaveAsXML -->
<!-- Mapping table version: 28-February-2003 -->
<HTML>
<HEAD>
<META http-equiv="Content-Type" content="text/html; charset=UTF-8">
如果我使用SublimeText“Save with encoding-”选项,问题仍然存在,并使用UTF-8保存。 奇怪的是,这只发生在一些PDF上。其他人正在使用正确的编码进行保存,但导出过程没有区别。有什么我可以在PDF文件本身或导出过程中检查以查看此内容吗?