我正在尝试在仅使用表而不使用任何类或ID标识的旧网站中抓取数据。当我在Chrome或Firefox中使用copy xpath函数时,它们会向我返回类似的内容:
tbody
这些tbody
标记对于Python的Scrapy似乎是无法访问的,并且该站点html结构的混乱性质使我自己几乎无法创建xpath。没有这些function (data) {
$.each(data, function (key, value) {
tempData += '<tr>';
tempData += '<td>' + value.name + '</td>';
tempData += '<td>' + value.value + '</td>';
//check whether the key already exists in the map
if (measurementDataMap.get(value.name) == undefined) {
//if the key doesn't exist, the value points to an empty array
measurementDataMap[value.name] = [];
}
measurementDataMap[value.name].push(value.value);
});
标签,有什么办法可以复制xpath?