Microsoft Word文档中的奇怪字符无法导出/无法搜索

时间:2012-10-16 20:29:13

标签: ms-word diacritics fieldcodes

我有一份文件已经写得非常好。这是一个包含西里尔字符的字典。大多数字典都是可管理的,但我坚持一件我需要帮助的东西。单词中有重音字母,它们大部分都是正确的格式,带有unicode重音(因此形成一个字母)。然而,有一些非常奇特的字母看起来类似于例如:a;'(其中“a”是任意的西里尔字母)。你期待它取代它。然而,如果只能将这个东西导出到HTML中并在文本编辑器中操作,那么本身就不会成为问题。问题是Word将这个“东西”视为单个字符/实体并且

  • 导出时完全省略
  • 复制时只能粘贴到记事本(将其翻译成三个单独的字符),当粘贴到写字板时,它根本不会出现。
  • 在Word中运行搜索时,它不会找到该字母,也不会找到实际字符或完全复制/粘贴的组合。
  • 在任何其他软件(例如Libre Office)
  • 中打开文档时,该字母将消失

此时我正试图:

  • 了解这种组合究竟是什么
  • 运行搜索/替换操作以查找并清除所有这些错误

Here's示例Word文件。

以下是相关字词/字母的屏幕截图:

enter image description here

正确输入时应显示为“скре́пка”。

2 个答案:

答案 0 :(得分:1)

'character'似乎是'eq'类型的Word字段(等式)。这是带有切换字段代码的字段:

enter image description here

如果它是一个大型文档,您可以尝试创建一个VBA例程,删除字段并用相应的字符替换它们。

答案 1 :(得分:0)

假设@ Anonimista的分析是正确的,正如我认为的那样,您可以通过在Word中运行一些搜索和替换操作来修复该文件,例如, ^ 19eq \ o(е;')^ 21由е(后者是西里尔字母е后跟组合急性重音U + 0301)。这很无聊,因为您需要分别为每个元音(以及大写元音)执行此操作。但是我找不到在这种情况下使用通配符的方法;仅当未启用通配符时,字段的开始和结束的代码^ 19和^ 21才起作用。