所以,我发现很多关于删除非ascii字符的事情,但没有真正添加它们。
基本上,我有一个用户可以键入的文本字段,然后该字符串在某些上下文中被处理,存储和显示。我希望用户有时只是复制和粘贴来自其他网页的文本,我想确保用户在该字段中输入的任何内容都不会破坏任何内容。 (我知道这是一个潜在的问题,因为用户应对并粘贴'实际上并非ascii'的东西已经破坏了一次)
这不是关于删除非ascii字符!我想要一个可以复制和粘贴的可能问题字符的良好列表/文件,以验证它们是否得到正确处理。或者至少,找到这些潜在的复制粘贴'冒名顶替'字符的好方法。
答案 0 :(得分:1)
谢谢Tom Blodget。转换并最小化文本后,以下是可以复制和粘贴的所有UTF-8字符的列表。 (这里是UTF-16和UFT-32列表。我没有时间将这些列表复制到文本文件中。如果这些链接被破坏,请使用Google for UFT-16 table和Google for UTF-32 table)
“#$%&安培;'()* +, - / 0123456789:;!?&LT; =&GT; @ ABCDEFGHIJKLMNOPQRSTUVWXYZ [] ^ _`ABCDEFGHIJKLMNOPQRSTUVWXYZ {|}〜¡¢£¤¥|§¨©ª «¬®¯°±²³'μ¶·¸¹º»¼½¾¿ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿĂ㥹ĆćČčĎďĐđĘęĚěĹ弾ŁłŃńŇňŐőŒœŔŕŘřŚśŞşŠšŢţŤťŮůŰűŸŹźŻżŽžƒ˘˙˛~˝ - ''‘’“†‡•...‰<>€™