我已经看过一些类似的问题,但不是我要问的问题(我至少可以找到)。我使用底部的三行代码来制作一个返回文章各个方面的api请求。
response = requests.get(self.format_url(api, version), params=payload)
json_data = response.json()
return json_data
我请求的数据很好,我已经想出如何提取文本参数,就像我想要的那样。唯一的问题是我想保留段落中断,但下面的article_text
只是忽略段落中断的所有文本。有没有一种标准的方法可以用json做到这一点,还是完全依赖于我使用的API?谢谢你的帮助,我是python的新手!
article_text = json_data['objects'][0]['text']
答案 0 :(得分:0)
万一有人碰巧读到这个,我实施的解决方案是从json_data
中提取未经改动的html然后利用美丽的汤来搜索所有
标签并替换他们用
标签。这很有用。