我想提取本文和其他文章的SUBHEADING: https://www.dr.dk/nyheder/regionale/trekanten/legos-regnskab-viser-tilbagegang
那就是:“2017年的Lego harnetoppræsenteretregnskabet,og kurven peger nedad。”
然而,看起来似乎没有python模块报纸可以做到这一点。
我错过了什么吗? 还有其他模块可以吗?我也试过可读性和html2text。
我的代码:
from newspaper import Article
url = 'https://www.dr.dk/nyheder/regionale/trekanten/legos-regnskab-viser-tilbagegang'
article = Article(url)
article.download()
article.parse()
print (article.title)
print (article.text)
答案 0 :(得分:0)
我认为你应该使用:
print(article.meta_description)
将打印文章的副标题。