我是Python的初学者,并试图开始我的第一个项目,该项目围绕创建一个程序来自动在各种网站上的表单中填写预定义的值。
目前,我正在努力寻找一种使用网站上显示的文字来识别Web元素的方法。例如,网站A的电子邮件字段显示“电子邮件:”,而另一个网站可能显示“填写您的电子邮件”。在这种情况下,将不可能使用ID或名称查找元素(除非我为每个网站编写不同的代码集),因为每个网站的内容都不相同。
所以,我的问题是,是否可以编写代码来扫描所有字段->检查文本->然后根据与每个字段相关的文本填写值?
答案 0 :(得分:0)
如果您知道该页面的标记,则可以这样做,并且可以编写代码来解析该页面。在这种情况下,您应该使用xpath,lxml,漂亮的汤,硒等。您可以在google或youtube上查看许多手册,只需键入“ python scraping” 但是,如果您想编写一个能够理解随机站点上的随机页面并了解其功能的程序,那将非常困难,这是使用机器学习的一项复杂任务。我想这个任务完全不适合初学者。