无法从html <section>找到所需的内容:Python BS4

时间:2018-10-23 12:41:13

标签: python web-scraping beautifulsoup

我正在将此website用作天气预报。它的html非常嵌套,我无法检索所需的内容。我要抓取的部分在下面提到:

Section to be scraped

要获取此部分html所需的标签,我正在使用以下方法:

var data = [{ type: 'a', position: 1 }, { type: 'b', position: 1 }, { type: 'a', position: 1 }, { type:'a', position: 2 }, { type: 'b', position: 2 }, { type: 'c', position: 1 }, { type:'c', position: 1 }],
    duplicates = Array
        .from(
            data
                .reduce((m, o) => {
                    var key = ['type', 'position'].map(k => o[k]).join('|');
                    return m.set(key, (m.get(key) || []).concat(o));
                }, new Map)
               .values()
        )
       .filter(({ length }) => length > 1);

console.log(duplicates);

运行此代码后,我能够检索标签,但所有这些标签均来自先前的容器。有人可以帮助我在这里遵循正确的方法吗,谢谢

0 个答案:

没有答案