如何在JavaScript中创建大于4个字节的UTF8字符?

时间:2018-11-03 12:46:28

标签: javascript string encoding utf-8 character-encoding

我正在为Web应用开发漏洞扫描器,但遇到了我似乎无法解决的问题。 Web应用程序通常使用UTF8编码,每个字符使用1-4个字节。例如,采用UTF8编码的4字节字符将以字节“ 11110xxx”开头,然后再加上3个类似“ 10xxxxxx”的字节。

我阅读了有关UTF8的更多信息,发现它还可以支持每个字符5和6个字节。如果字符以“ 111110xx”开头,则为5字节字符,如果字符以“ 1111110x”开头,则为6字节字符。

我想通过Web注入此类字符(通过扫描仪),看看它们是否损坏。我试图使用utf8.js library(在npm上找到)来创建这样的字符,但事实证明该库仅支持每个字符最多4个字节的UTF8。

我如何以编程方式创建一个使用5或6个字节的JavaScript字符?

0 个答案:

没有答案