我正在使用Python开发一个Web抓取工具,我需要熟悉某些网站上各种HTML标记的功能。不幸的是,Chrome浏览器,Firefox和Safari提供的“查看源”并没有输出格式良好的HTML源代码 - 它往往会在同一行上放置大量标签。浏览器是否提供了可能能够清理一些内容的任何插件,或者我是否需要在Python中获取/开发某种类型的工具,它将脏HTML作为输入并输出格式良好的HTML?
答案 0 :(得分:1)
由于我主要使用Chrome,因此我能想到的最佳示例是Code Formatter (Chrome)
这不是自动的;您必须将整个页面复制并粘贴到应用程序中。应用程序窗口也很小(据我所知,这是不可改变的),但相对有效。
...和JavaScript and CSS Beautifier
更有效和更干净,但只有标题所示才能使用.Js和CSS。