缩短HTML文件

时间:2014-06-26 16:30:58

标签: python html

是否有缩短HTML页面的库(最好是Python)?我的意思是它会产生一个可能更小的(就字符数而言,包括换行符< - 考虑字符串的长度)HTML页面与原始页面完全相同?

例如:

<b>
    Silly example
</b>

可以更改为:

<b>Silly example</b>

,最终结果将是相同的:

愚蠢的例子

2 个答案:

答案 0 :(得分:2)

您可以使用BeautifulSoup来美化(而不是缩小)Python中的HTML或XML代码。

from bs4 import BeautifulSoup
soup = BeautifulSoup('file.html')
prettified = soup.prettify(encoding="utf8")

要在Python中缩小HTML,可以使用htmlmin。可以在documentation中找到htmlmin.minify的更多参数。

import htmlmin

with open('file.html', 'r') as f:
    content = f.read()
    minified = htmlmin.minify(content, remove_empty_space=True)

答案 1 :(得分:0)

您可以使用htmlmin

import htmlmin

input_html = '<b>\n\tSilly example\n</b>'

minified_html = htmlmin.minify(input_html)

print(input_html)

# <b>
#   Silly example
# </b>


print(minified_html)

# <b> Silly example </b>