标签: java html encoding character-encoding special-characters
我正在尝试解决我们的实时应用程序中的问题。
场景:用户通过从Microsoft Word(或可能是其他编辑器)复制和粘贴文本来填充我们的HTML表单之一。在后端,表单在Spring中处理并与Hibernate一起保存。稍后我们导出XML时,现在从数据库中检索的相同数据要么生成无效的XML,要么生成有趣的字符。
如何通过正确地将用户发送的奇怪/未知字符转换为UTF-8来正确防止此问题在开始时发生?