我正在开发一个项目,打印特定网页上的前300个字符。我的代码大部分都有用,但我遇到的问题是如何只打印前300个字符而不是整个页面?
gen_random = str(random.randint(2000,8001))
new_url = ('http://www.gutenberg.org/files/'+ gen_random + '/'+
gen_random + '.txt')
html = urllib.request.urlopen(new_url)
soup = bs.BeautifulSoup(html, 'lxml')
print(soup.find('body').getText())
答案 0 :(得分:3)
print(soup.find('body').getText()[:300])