如何将大量类似的蹩脚html页面转换为高质量的基于CSS的页面?

时间:2009-04-27 17:03:58

标签: html css

以编程方式将大量非常相似的网页转换为更新的基于CSS的布局的最佳方法是什么?

我正在将旧网站的所有内容更改为新的基于CSS的布局。许多页面非常相似,我希望能够自动化该过程。

我目前正在考虑的是使用HtmlAgilityPack读取页面,并为将创建输出文本的每组相似页面创建一个方法。

您认为最好的方法是什么?这些页面大多不同于.jpg文件用于图像的内容,或者该特定页面上有多少组标题图像文本

编辑:我不能使用除.html以外的任何其他文件类型,因为这是我有权做的。有什么建议吗?

EDIT2:理想情况下,我也可以使它足够通用,只需切换几个移动部件就可以将它用于许多不同的html文件组。

SAMPLE OF TYPICAL PAGE

以上链接是我正在处理的一个示例。页面之间不同的部分是:

  • 元描述标签
  • 各种标题,特别是主标题
  • 页面上几乎每张图片都是新的
  • 每个视频的文字都是唯一的,但它们会以相似的块组合在一起
  • 视频文件和视频尺寸将是唯一的

其他一切都是一样的,页面的格式也是一样的。

EDIT3:如果有疑问,可能有用的另一件事就是编写一些代码来为我编写页面。我只需要删除可变原件的部分,并将它们放入一个读取并用于编写新版本的数据文件中。

5 个答案:

答案 0 :(得分:1)

这取决于“非常相似”的实际情况。如果您的意思是他们有效地使用了许多模板,那么我可能会使用Template-Toolkit为新设计构建新模板,并使用Template::Extract来删除数据。可能将数据存储在本地数据库中,以便将来更容易重建页面。

答案 1 :(得分:1)

我认为这取决于有多少页面,如果没有太多,你可以创建一个模板并使用所见即所得的编辑器来复制和粘贴内容。

但是如果你需要programaticaly我建议解析html来提取内容。 或清理它,如果你有权访问它你可以使用Expression Web,我用它来做类似的任务,你可以清理html并只保留标题标签,段落等,然后你可以应用css来格式化它在你想要的设计中。

然而,编写代码可能需要更长时间才能完成。 有时没有什么比手工更快。

祝你好运

答案 2 :(得分:0)

虽然这可能听起来有点油腻,但我能提供的最佳选择是Rent-A-Coder

答案 3 :(得分:0)

取决于页面,你可以用Perl或任何其他脚本语言编写脚本,尽可能地做,并让他们记下他们无法解决或不理解的任何内容。

答案 4 :(得分:0)

当面对像这样经常生成的旧代码时,我倾向于在文本编辑器中倾向于搜索和替换。

听起来很糟糕,不是吗?

说真的,如果你得到一个支持搜索多个文件和/或正则表达式的强大编辑器,那么可以删除大量讨厌的代码。至少可以说这不是一个完美的科学,并且可能需要一些手动操作才能使其成为“有用”形式,但它会消除大部分清理工作。