HTML-to-RTF文档转换,将类保留为样式

时间:2014-10-27 21:07:49

标签: html converter rtf

我需要一个 HTML2RTF 工具,即将HTML格式转换为RTF格式的软件......但不是"任何转换":我需要保留HTML { {1}}属性(例如段落)作为MS-Word" styles"。

我的第一个选择是LibreOffice的一些终端命令,比如

class

因为LibreWriter拥有更大的社区并且假设最好的软件转换......但是因为不将类属性保留为样式而感到失望,即使在图形界面中作为用户进行测试时也是如此。

我需要一个Linux解决方案(也 abiword 未解决)...或者,最后一个选项,一个易于插入内联网Windows服务器的Web服务。


输入样本:

libreoffice --convert-to

在MS-Word中导入此示例并且看起来没问题,其中样式是类。 在LibreOffice(和<html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>sample1 doc</title> <!-- no style need, but can be declarated with anything, don't matter --> <style type="text/css"> .myStyle1 {color: #F00;} .myStyle2 {color: #880;} .a {color: #00F;} .b {color: #088;} </style> </head> <body><!-- important to preserve class names --> <p class="myStyle1">Hello in <i>style#1</i>. <span class="a">SPAN S1</span>.</p> <p class="myStyle2">... Hello in style#2...</p> <p class="myStyle1">Bye <span class="b">S2</span>.</p> </body> </html> 终端工具)中没有。

那么,LibreOffice还有另一个工具吗? Linux有一个工具吗?

PS:最后一种可能性,如果没有Linux,那么 webservice 适用于Windows和MS-Office。

1 个答案:

答案 0 :(得分:1)

在Libreoffice为我工作4.3.3.2。刚打开你提供的HTML文件,我可以看到名为Text.Body.myStyle1和myStyle2的样式。

HTML styles in Libreoffice


线索,适用于Debian Stable和UBUNTU LTS 64位...请参阅this How-To。基本步骤:

sudo apt-get remove libreoffice*
wget http://download.documentfoundation.org/libreoffice/stable/4.3.3/deb/x86_64/LibreOffice_4.3.3_Linux_x86-64_deb.tar.gz
tar -xzvf LibreOffice_4.3.3_Linux_x86-64_deb.tar.gz
cd LibreOffice_4.3.3*_Linux_x86-64_deb/DEBS
sudo dpkg -i *.deb

v4.3.3之后,还需要安装:

 sudo apt-get install libreoffice-writer

然后,引用的命令:

 libreoffice --headless -convert-to rtf libreTeste.html