用于CSS清理的Java库

时间:2010-03-31 09:10:55

标签: java html css

对于必须处理来自MS Office应用程序的粘贴HTML代码的富文本编辑器,我正在寻找一个Java库来清理HTML元素中所有“样式”属性的内容,因此只有一些CSS属性是左:

  • 背景颜色
  • 边界
  • 颜色
  • 字体家庭
  • 字体重量
  • 字体风格
  • 列表样式型
  • 文本对齐
  • text-decoration
  • 垂直对齐

为了创建格式良好的HTML文档,我可以使用JTidy。对于HTML元素转换(删除不需要的元素),我可以使用http://htmlparser.sourceforge.net/

CSS属性有什么可比性吗?

1 个答案:

答案 0 :(得分:2)

尝试使用一些CSS解析器(例如http://cssparser.sourceforge.net/)和SAC