Python报纸副标题

时间:2018-03-06 10:45:39

标签: python python-newspaper

我想提取本文和其他文章的SUBHEADING: https://www.dr.dk/nyheder/regionale/trekanten/legos-regnskab-viser-tilbagegang

那就是:“2017年的Lego harnetoppræsenteretregnskabet,og kurven peger nedad。”

然而,看起来似乎没有python模块报纸可以做到这一点。

我错过了什么吗? 还有其他模块可以吗?我也试过可读性和html2text。

我的代码:

from newspaper import Article

url = 'https://www.dr.dk/nyheder/regionale/trekanten/legos-regnskab-viser-tilbagegang'
article = Article(url)

article.download()
article.parse()

print (article.title)
print (article.text)

1 个答案:

答案 0 :(得分:0)

我认为你应该使用:

print(article.meta_description)

将打印文章的副标题。