我需要一个 HTML2RTF 工具,即将HTML格式转换为RTF格式的软件......但不是"任何转换":我需要保留HTML { {1}}属性(例如段落)作为MS-Word" styles"。
我的第一个选择是LibreOffice的一些终端命令,比如
class
因为LibreWriter拥有更大的社区并且假设最好的软件转换......但是因为不将类属性保留为样式而感到失望,即使在图形界面中作为用户进行测试时也是如此。
我需要一个Linux解决方案(也 abiword 未解决)...或者,最后一个选项,一个易于插入内联网Windows服务器的Web服务。
输入样本:
libreoffice --convert-to
在MS-Word中导入此示例并且看起来没问题,其中样式是类。
在LibreOffice(和<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>sample1 doc</title>
<!-- no style need, but can be declarated with anything, don't matter -->
<style type="text/css">
.myStyle1 {color: #F00;} .myStyle2 {color: #880;}
.a {color: #00F;} .b {color: #088;}
</style>
</head>
<body><!-- important to preserve class names -->
<p class="myStyle1">Hello in <i>style#1</i>.
<span class="a">SPAN S1</span>.</p>
<p class="myStyle2">... Hello in style#2...</p>
<p class="myStyle1">Bye <span class="b">S2</span>.</p>
</body>
</html>
终端工具)中没有。
那么,LibreOffice还有另一个工具吗? Linux有一个工具吗?
PS:最后一种可能性,如果没有Linux,那么 webservice 适用于Windows和MS-Office。
答案 0 :(得分:1)
在Libreoffice为我工作4.3.3.2。刚打开你提供的HTML文件,我可以看到名为Text.Body.myStyle1和myStyle2的样式。
线索,适用于Debian Stable和UBUNTU LTS 64位...请参阅this How-To。基本步骤:
sudo apt-get remove libreoffice*
wget http://download.documentfoundation.org/libreoffice/stable/4.3.3/deb/x86_64/LibreOffice_4.3.3_Linux_x86-64_deb.tar.gz
tar -xzvf LibreOffice_4.3.3_Linux_x86-64_deb.tar.gz
cd LibreOffice_4.3.3*_Linux_x86-64_deb/DEBS
sudo dpkg -i *.deb
v4.3.3之后,还需要安装:
sudo apt-get install libreoffice-writer
然后,引用的命令:
libreoffice --headless -convert-to rtf libreTeste.html