如何将HTML代码渲染或转换为从wysiwyg编辑器生成的纯文本

时间:2013-03-21 14:11:21

标签: java html parsing html-parsing jericho-html-parser

我在我的Web应用程序中使用了一个wysiwyg编辑器(CKEditor)来为用户提供基本的文字处理程序。我试图将该CKEditor的输出保存为pdf文档。 我现在可以生成pdf文档,但问题是来自CKEditor的输出是HTML代码,它是以pdf格式发布的。 我想发布那个在CKEditor中看到的pdf文档,但我不想在pdf中使用那些HTML标记。是否存在Java中的任何库,通过消除那些html标记但是保留它们的效果来将html代码呈现或转换为纯文本,即如果HTML代码这是大胆的则pdf应保存为这是大胆的不喜欢   <b>这是粗体</b>

2 个答案:

答案 0 :(得分:1)

您可以使用库将HTML从ckeditor转换为PDF。有很多选项可以将HTML转换为PDF。这个飞碟项目是一个很好的项目:https://code.google.com/p/flying-saucer/

答案 1 :(得分:0)

iText是一个非常受欢迎的库,用于将HTML转换为PDF。但是请注意,如果您选择使用他们的库,则使用与您使用的iText版本相关的许可。