不确定这是否适合询问或doctype,但无论如何我都会问... 一直在与德国客户合作,这个非常奇怪的问题开始出现......
因此,在填充网站内容时,我将其pdf表格复制/粘贴到我的编辑器(Espresso)中。奇怪的是,当所有文本在编辑器中看起来都是原始的时候,在浏览器中打开后,我们开始用重音角色的重音进行奇怪的异常,向前推进。所以'Ö'显示为O“,依此类推。
我认为这是一个unicode问题,但网站被声明为utf8,并且没有富文本或任何输入内容,它只是来自编辑器的原始文本。所以这真是令人难以置信。如果客户端直接编辑文件,则会正确显示。我发现如果我手动输入并替换重音字符,那也没关系。
任何人都有类似的经历/解决方案吗?
我应该没有本地化/字体问题,因为这些本质上是拉丁字符? (如果我错了,请纠正我)
答案 0 :(得分:3)
您无法从PDF中可靠地剪切和粘贴。内部格式不是显示的。 : - )
PDF可以在内部使用特殊编码使打印页面看起来正确,但这并不意味着您可以复制粘贴。
这是一个StackExchange问题,背景为 little 位:https://tex.stackexchange.com/questions/22213/how-to-get-accented-unicode-characters-that-can-be-copy-pasted。
虽然它与你的问题不完全相同,但它确实表明你如何制作PDF确实很重要。一些Latin-1(重音)字符可能在PDF中编码,而不是具有预期的Unicode代码点的字符,但有使用绘图说明使字符正确显示。
也许this product可以帮到你。我没有使用它,所以不能推荐它,但一点点搜索可能会产生你可以使用的东西。 (这个声称支持德语。)