我正在尝试使用漂亮的汤从网站中提取lon / lat信息,并使用下面的代码获取包含我需要的信息的mapdata BS4元素。可以有一个或多个(下面的url中有两个)lon / lat坐标,所以我试图找到一种方法来正确解析字符串以提取信息。
import requests
from bs4 import BeautifulSoup
url = "http://fire.wikia.com/wiki/Moose_Jaw_Fire_Department"
response = requests.get(url)
soup = BeautifulSoup(response.text)
mydivs = soup.findAll("div", { "class" : "mapdata" })
mydivs
这给出了以下
[{ “MINZOOM”:假 “mappingservice”: “googlemaps3”, “类型”: “路线图”, “geoservice”: “GEONAMES”, “类型”:[ “路线图”, “卫星”,“HYBRID “ ”地形“], ”MAXZOOM“:假, ”宽度“: ”自动“, ”高度“: ”350像素“, ”中心“:假, ”标题“: ”“, ”标签“: ”“,”图标 “:””, “visitedicon”: “”, “线”:[], “多边形”:[], “圆圈”:[], “矩形”:[], “wmsoverlay”:假 “copycoords” :假, “静态”:假, “缩放”:假, “层”:[], “对照”:[ “锅”, “变焦”, “类型”, “比例”, “街景”],“zoomstyle “:” DEFAULT”, “typestyle”: “DEFAULT”, “autoinfowindows”:假的, “调整大小”:假的, “kmlrezoom”:假的, “兴趣点”:真实的, “markercluster”:假的, “倾斜”:0, “imageoverlays”:[], “KML”:[], “gkml”:[], “fusiontables”:[], “searchmarkers”: “”, “enablefullscreen”:假, “位置”:[{ “文本” :“\ u003Cp \ u003ESouth Hill Fire Station \ n \ u \ u003 /”,“title”:“South Hill Fire Station \ n”,“link”:“”,“lat”:50.384617,“lon”: - 105.553335, “ALT”:0 “地址”: “”, “图标”: “”, “基团”: “”, “inlineLabel”: “”, “visitedicon”: “”},{ “文本”:” \ u003Cb \ u003E \ u003Cp \ u003ELillooet Fire Station \ n \ u003 / p / u003C / u003C / b \ u003C \ u003Chr \ u003Cp \ u003North Hill Fire Station \ n \ u0000 / p \ u003E“,”title“:”Lillooet Fire Station \ n“,”link“:”“,”lat“:50.402969, “LON”: - 105.533991, “ALT”:0 “地址”: “”, “图标”: “”, “基团”: “”, “inlineLabel”: “”, “visitedicon”: “”}]} ]
我试图找到BS4元素中的locations元素,在这种情况下,我想我会有一个我可以使用的json文件,但是找不到能让我达到这一点的代码行。 / p>