我正在编辑一个网页,其可见文字是俄文,其编码设置为UTF-8。顺便说一句,我不是俄语发言人。所以我的目标是将渲染的西里尔文从浏览器复制并粘贴到这些页面的新编辑版本的html源代码中。我发现这不起作用,我正在粘贴一排问号('???????')。我不明白为什么会这样,但这是附带在这里的主要问题,这就是所谓的源格式(相关地,我如何从它呈现的西里尔文中重现它)。让我举个例子。用于“职业”或“工作”的俄语单词的html源代码如下:
СѓÐμÑ€Ð'ÐμÑÑ,ÐμльноÑÑ,и/Ðоль
当html页面在浏览器中呈现时,它看起来像这样:
Занимаемаядолжность/Бизнес
我的目标是再次复制俄语西里尔文本并将其成功粘贴到新页面,因此它看起来像第一种格式。任何人都可以告诉我第一种格式是什么,还有一种方法我可以“反向工程”它使用第二种格式作为输入到达第一种格式吗?
谢谢。
答案 0 :(得分:1)
这里的答案似乎与许多传统Windows程序仍然使用西里尔字母的非Unicode表示的事实有关。替代品,例如西里尔文Windows-125和大约六种变体。他们在当天管理这份工作'但不能很好地使用Unicode表示法。在过去的几天里,我做了比以前更多的挖掘,并找到了对问题的讨论here。我想感谢Karol S在正确的方向上向我推动我指向Dreamweaver文档。这让我提出了正确的问题。我引用的链接继续指定某些版本的Dreamweaver使用非Unicode表示。我正在使用Dreamweaver 4,这些日子已经很老了。
为了完整,神秘格式(上图)虽然没有确切的名称,但可以恰当地描述为"西里尔字符编码为'西方(拉丁文1)'字符&#34 ;.这种表现形式起作用'在编码保存数据的情况下,这些数据可以通过现代浏览器正确地呈现为Cyrillic,但它现在更常用,因此它是传统的表示。
答案 1 :(得分:-1)
获得更好的编辑。
如果你在Windows上,Notepad ++是好的。只需将其切换为UTF-8并仅使用它。
格式:
СѓÐμÑ€Ð'ÐμÑÑ,ÐμльноÑÑ,и/Ðоль
被称为垃圾。