美丽的汤串方法表现得很奇怪

时间:2011-09-11 14:05:53

标签: python screen-scraping beautifulsoup

我正在尝试在此页面中获取图片 - http://www.bkstr.com/webapp/wcs/stores/servlet/CourseMaterialsResultsView?catalogId=10001&categoryId=9604&storeId=10161&langId=-1&programId=562&termId=100020629&divisionDisplayName=Stanford&departmentDisplayName=MATH&courseDisplayName=51&sectionDisplayName=01&demoKey=d&purpose=browse

我做正常的urllib打开的东西(如果有人要跟踪,你需要跟踪cookie) 并且这样做

data =  soup.findAll("div",{"class":"efMaterialImage left"))

工作正常。

奇怪的是,当我执行test = data.string并打印结果时,控制台会显示“无”。

知道为什么吗?

1 个答案:

答案 0 :(得分:1)

findAll返回匹配列表,而不是单个匹配项。但是,Python列表没有属性“string”。

请尝试data[0]

编辑:

如果标签有一个子节点及其字符串,则字符串似乎只能起作用。 <div>something</div>可行,但<div><p>something</p></div>不会。 使用更多选择器或改为使用.contents