我正在尝试使用BeautifulSoup中的“美化”打印出第一行和最后1000行。我已经将Kafka的The Metamorphosis下载到我的硬盘中,并且我已经成功创建了一个BeautifulSoup对象:
由于Gutenberg网站的验证码问题,我在硬盘上保存了该文档的副本。
page = open('meta.htm', 'r').read()
soup = BeautifulSoup(page, "lxml")
如何使用soup.prettify()
打印文档的第一行和最后1000行?
答案 0 :(得分:1)
只需切片:
result = soup.prettify().splitlines()
print('\n'.join(result[:1000] + result[-1000:]))