自动HTML简化工具?

时间:2009-05-08 06:44:37

标签: html

每当我看到其他人共享的问题时,如果解决方案实施起来很有趣,那么它通常已经解决了。我认为最好在我深入编码之前停止自己并进行搜索。

情况如下: 您可以将office文档的各个部分复制并粘贴到visual studio HTML编辑器中。问题是,它创建了如下所示的HTML文本:

<tr style="mso-yfti-irow:0;mso-yfti-firstrow:yes">
                <td style="border:solid windowtext 1.0pt;mso-border-alt:solid windowtext .5pt;
   padding:0cm 5.4pt 0cm 5.4pt" valign="top">
                    <p align="left" class="MsoNormal" 
                        style="text-align:left;tab-stops:center 216.0pt right 432.0pt">
                        <b style="mso-bidi-font-weight:normal"><span lang="EN-US">ID<o:p></o:p></span></b></p>
                </td>
                <td style="border:solid windowtext 1.0pt;border-left:none;
   mso-border-left-alt:solid windowtext .5pt;mso-border-alt:solid windowtext .5pt;
   padding:0cm 5.4pt 0cm 5.4pt" valign="top">

适用于机器,但这不是人类可读的。 我敢打赌,可以通过查找重复样式并从中创建CSS类来清除它。计算机程序可以很容易地做到这一点。

我可以运行这个程序,然后我会看起来很漂亮,易于维护的HTML看起来就像我的Word文档。

(是的,我知道我可以编辑我的Word文档,然后将其复制并粘贴到HTML中,或者只是将其保存为HTML文件。但它与之后手动编辑它不一样。事实)。

无论如何,有没有人知道这样做的程序?

<小时/> (后来编辑)我发现我问的问题是this one的副本。

3 个答案:

答案 0 :(得分:6)

HTML Tidy这样做!它还与常见的文本编辑器(如Notepad ++或UltraEdit)集成,并提供清理Office Web标记的选项。您需要设置word-2000 boolean flag to true

此外,Jeff Atwood在博客上发表了关于此问题的博客,并提出了自己的C#2.0解决方案in this article

答案 1 :(得分:3)

我会尝试使用HTML Tidy:http://tidy.sourceforge.net/,另一个选项是将您的word文档粘贴到TinyMCE中,然后保存HTML。

答案 2 :(得分:2)

您可能需要认真考虑将“粘贴为纯文本”作为简化工具。权衡你重新申请加价需要多长时间...你可能会发现它比你想象的要痛苦少。