这是我发布的第一个问题,如果我想让问题更清楚,请告诉我。此外,我刚开始使用Python,所以我希望我能用正确的术语来说明问题。
基本上我创建了一个可定制的webscraper,它依赖于用户对CSS选择器的了解。用户首先必须访问他们想要抓取的网站并记下他们所需元素的css选择器(" AA")并将其输入excel文件,其中python脚本将读取通过browser.find_elements_by_css_selector(" AA")输入并传递它,并通过.text.encode获取相关文本(' utf-8')
但是我注意到有时候属性值中可能会有一些重要信息应该被删除。我环顾四周,发现建议始终包含.get_attribute()
1)是否有替代方法只需使用browser.find_elements_by_css_selector(" AA")而不使用browser.find_elements_by_css_selector(" AA")来获取属性值.get_attribute(&#34 ; BB&#34)。否则,
2)用户是否可以在" BB"中输入一些值?在browser.find_elements_by_css_selector(" AA")。get_attribute(" BB")中,只有browser.find_elements_by_css_selector(" AA")会运行?
答案 0 :(得分:0)
是,可以在不使用get_attribute()
方法的情况下检索文本属性值。我不确定是否可以通过 css 实现,但通过 xpath 可以实现。几个例子如下: