怎么会这样呢:
我有一个包含约160页的列表,每个页面包含±5个子菜单。总的来说,我必须检查800页中的特定标签,并返回缺少特定标签的页面。
到目前为止,我想出了这个伪代码(用Python思考)
for each URL in URL_list
fetch pagesource
for each submenu_link in pagesource
fetch pagesource
if string "<h2 class=\"subtitle\">" is not in pagesource:
print submenu_link + "subtitle missing"
你怎么看?错误的方法?