从BS4页面解析文本

时间:2017-08-18 22:22:22

标签: python beautifulsoup python-requests bs4

在页面https://bittrex.com/api/v2.0/pub/Markets/GetMarketSummaries上我试图解析我提出请求的文本。我用来拉文本的代码在这里

import requests
from bs4 import BeautifulSoup

link = 'https://bittrex.com/api/v2.0/pub/Markets/GetMarketSummaries'
html = requests.get('https://bittrex.com/api/v2.0/pub/Markets/GetMarketSummaries').text
print(html)

我可以轻松地从页面中提取所有文本,但现在我想用bs4解析它,以便它只获取特定货币的数量,例如ADX或ADT。 (显示为“MarketCurrency”:“ADX”) 我希望它能够在不拉动所有其他垃圾的情况下从页面中找到诸如“高”,“低”,“音量”和“最后”之类的信息。因此,例如我输入我想要的货币的代码,例如:ADX然后它解析该文本并打印出当天的高,低,成交量和最后一天的数字。谢谢你的帮助!

1 个答案:

答案 0 :(得分:0)

实际上,你非常接近。正如评论所说,输出不是HTML,而是JSON。幸运的是,python有一些很好的内置功能。以下代码将从站点输出JSON文本作为本机python字典(json_dict)。

import requests
import json

link = 'https://bittrex.com/api/v2.0/pub/Markets/GetMarketSummaries'
raw_json = requests.get('https://bittrex.com/api/v2.0/pub/Markets/GetMarketSummaries').text
json_dict = json.loads(raw_json)
print(json_dict)