对于一门学校课程,我们正在学习高级python,以初步了解网络抓取和类似内容。...我有一个练习,我必须从以下代码行中提取值v1,v2 HTML ...我尝试查找,但找不到任何真正特定的东西...。如果它不适合使用,则将其删除。...
HTML部分
{"v1":"first","ex":"first_soup","foo":"0","doo":"0","v1":["second"]}
所以之后,当我想显示值时,它应该像
print(v1)
first
print(v2)
second
我试图通过像这样切整行来获取值:
v1=htmltext[7,12]
v2=htmltext[60,66]
但是在这种情况下,我不使用bs4模块,建议使用...。如果有人教我,我将不胜感激。
答案 0 :(得分:1)
您看到的不是HTML文件,而是JSON。在这种情况下,使用BeautifulSoup的HTML解析器没有任何意义,您可能想要使用标准的JSON library来做到这一点,就像这样:
import json
json_Dict=json.loads(str(soup))
然后您可以使用标题(或键)对其进行索引
json_Dict["v1"]
>>>"first"