测试从网页复制的非ascii字符

时间:2016-11-21 21:47:51

标签: testing non-ascii-characters

所以,我发现很多关于删除非ascii字符的事情,但没有真正添加它们。

基本上,我有一个用户可以键入的文本字段,然后该字符串在某些上下文中被处理,存储和显示。我希望用户有时只是复制和粘贴来自其他网页的文本,我想确保用户在该字段中输入的任何内容都不会破​​坏任何内容。 (我知道这是一个潜在的问题,因为用户应对并粘贴'实际上并非ascii'的东西已经破坏了一次)

这不是关于删除非ascii字符!我想要一个可以复制和粘贴的可能问题字符的良好列表/文件,以验证它们是否得到正确处理。或者至少,找到这些潜在的复制粘贴'冒名顶替'字符的好方法。

1 个答案:

答案 0 :(得分:1)

谢谢Tom Blodget。转换并最小化文本后,以下是可以复制和粘贴的所有UTF-8字符的列表。 (这里是UTF-16UFT-32列表。我没有时间将这些列表复制到文本文件中。如果这些链接被破坏,请使用Google for UFT-16 tableGoogle for UTF-32 table

“#$%&安培;'()* +, - / 0123456789:;!?&LT; =&GT; @ ABCDEFGHIJKLMNOPQRSTUVWXYZ [] ^ _`ABCDEFGHIJKLMNOPQRSTUVWXYZ {|}〜¡¢£¤¥|§¨©ª «¬®¯°±²³'μ¶·¸¹º»¼½¾¿ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿĂ㥹ĆćČčĎďĐđĘęĚěĹ弾ŁłŃńŇňŐőŒœŔŕŘřŚśŞşŠšŢţŤťŮůŰűŸŹźŻżŽžƒ˘˙˛~˝ - ''‘’“†‡•...‰<>€™