我的网络应用程序中有一个HTML wysiwyg,我的用户从Microsoft Office复制/粘贴内容。
我需要一种Java方法将办公室内容(TEXT STRING)转换为html内容。
我写了你的代码value = value.replaceAll("(?s)<[^>]*>(\\s*<[^>]*>)*", " ").replaceAll("\n\r", " ").replaceAll("\n", " ").replaceAll("\r", " ");
value = value.replaceAll("<xml>.*?</xml>", " ").replaceAll("<style>.*?</style>", " ").replaceAll("\n\r", "<br />").replaceAll("\n", "<br />").replaceAll("\r", "<br />").replace("id=" , "OldId=");
但是这段代码没有给我正确的文字。
PS: 这个网站正是我需要做的 http://word2cleanhtml.com/