将浏览器的突出显示文本转换为UTF8编码的javascript字符串

时间:2013-04-03 10:00:49

标签: javascript dom web-applications unicode

我是javascript的新手,并没有很好地掌握它的unicode处理。如果我理解正确,它有点像C / C ++,其中字符串包含没有任何编码信息的二进制序列。

当我使用类似var str=window.getSelection().toString()的内容来获取突出显示的文本时,结果字符串是否与网页具有相同的编码?如果是这样,找出编码并将其转换为unicode(例如UTF8)的最佳方法是什么?

1 个答案:

答案 0 :(得分:-1)

Javascript中的字符串与C或PHP中的“字符串”不同,它们实际上是字节数组并具有编码语义。 Javascript中的字符串与此完全不同,就像Java / C#或Python的unicode类型中的字符串一样。

它们是抽象字符串,至少如果您不尝试使用非BMP字符。在实践中,你不必担心,我只是提到它的完整性。

如上所述,var str=window.getSelection().toString()没有任何编码语义,它只是所选字符的字符串。你没有在你的问题中说明任何实际问题,但是如果你想知道“特殊”字符是否只适用于Javascript,那么它们就可以正常工作。