我获得了一个最初使用Word生成的HTML文档。生成的HTML可能会使用一些清理并且很长,所以手工完成它将是乏味的。我还需要在将来使用同一来源的其他HTML文档执行此操作,因此在此单个实例之外提供简单的解决方案将非常有用。
其中一个问题是不带引号的HTML属性。我想避免手工添加所有引号,我正在寻找一种简单的方法来做到这一点。
以下是显示文件片段的屏幕截图:
屏幕截图来自Visual Studio 2010.Visual Studio识别出存在验证错误并建议添加引号,但我找不到自动添加引号的工具。 Visual Studio中是否有一个选项可以添加引号?
我最初是专门针对在Visual Studio中执行此操作提出的问题,但我真的只是在寻找一个好的解决方案。我没有被困在Visual Studio中,所以如果有任何其他建议,我们将不胜感激。
答案 0 :(得分:1)
查看这个tidyfornet,它是HTML Tidy的.Net包装器,这是一个从标签汤生成有效HTML / XHTML的Java包。
答案 1 :(得分:1)
我已使用HTMLTrim软件完成此操作。我必须纠正的唯一一点是使用text editor从所有文档中删除<o:p></o:p>
标记,因为它会对它们抱怨。它不会将单引号替换为双引号,但我已使用相同的文本编辑器完成它。如果您之后需要在单词中打开此文档,则需要删除<?xml ...?>
标题。