如何提取html标记标记

时间:2016-01-24 05:02:24

标签: html tags markup

是否有文本编辑器,软件,脚本,代码,狙击手或类似的东西生成类似于html文件中图片上的输出? 在其他工作中,只能输出html标记标记。 谢谢你帮助我。 output sample Before and After

这是我需要的前后图像所以你们可以理解我在寻找什么。我没有那么详细的细节。感谢

1 个答案:

答案 0 :(得分:0)

我不知道这个任务的工具。我认为研究像这样的html文件的结构是一个有趣的想法。我也需要这几次,所以我写了一个很小的命令行工具,应该做的工作:

html_skeleton https://github.com/antonharald/html_skeleton

它的作用:

  1. 阅读文件
  2. 将HTML结构解析为虚拟DOM
  3. 递归访问所有HTML元素。对于每个人:删除属性值,如果没有孩子:删除它的文本内容。
  4. 将操纵的DOM转换为HTML代码并打印出来。
  5. 我没有时间对它进行那么多测试,所以听听它是否适合你会很高兴。