每当在其各自的程序中打开一个MS字(或LibreOffice或其他字处理器)文档时,这些字通常出现在页面上,但是当在文本编辑器中打开文档时,大多数文件都是Unicode乱码。 / p>
我可以理解为什么文档可能包含一些不易读的部分,比如项目符号或元数据,但为什么至少有部分内容存储为纯文本?每个字母都被编码了吗?
答案 0 :(得分:1)
Microsoft Word的最后一种格式docx是一个用zip压缩的纯文本的xml。您可以通过将docx重命名为zip来解压缩文件,然后使用记事本打开文件。所以它被部分存储为刚压缩的纯文本。
答案 1 :(得分:0)
我发现它可能是一个品牌推广的东西。如果需要,可以将其导入文本文件。
如果你去File>出口>更改文件类型>纯文本(* .txt),您可以在那里导出文档。