这是C语言
我想知道如何编写程序来查找网站的所有输入字段。任何网站。然后可以填写它们。我可以在vbs中编写简单的webbrowser,但是我如何分析输入字段。更好的是我可以点击查找字段,它将它的名称放在一个框中......这将是理想的。 有人可以帮忙吗?谢谢:))
答案 0 :(得分:2)
您确定要在C中执行此操作吗?
我问,因为这并不容易。首先,您需要能够针对您要查看的网页运行HTTP GET
请求。为此,您可能需要libcurl;无论如何,你绝对不想从头开始写作。
接下来,您需要处理所获得的html,找到所有input
字段。如果有bobince的血压,你不想使用正则表达式来做这件事。 HTML不是常规语言,你需要带走 - 你需要一个xml解析器。输入libxml。我确信还有其他的xml库,甚至是用于解析html的库。
最后,完成该操作(获取字段等)后,您需要能够填充它们并根据ACTION
的{{1}}和METHOD
参数提交正确的请求。
这当然是假设你知道应该格式化哪些字段。它还假设没有其他事情发生。如果您有经过javascript验证的Web表单(我真诚地希望他们也在请求上验证,但他们可能会通过JS提供反馈)您将无法从中受益(除非您要集成JS,在这种情况下您不妨写一个浏览器)。
这不是一项微不足道的任务,而且它是HTML的可访问性标准的原因,因为否则在没有人工交互的情况下解释表单变得棘手。
当然,这一切都假设FORM
表示良好,但情况并非总是如此......
我可能会建议另一种方法。 BeautifulSoup是一个众所周知的Python Web抓取库,可以很好地工作。 Python作为一种语言也允许更容易的字符串操作,这将大大缩短您的开发时间。考虑到你想要进行的任务的大小和复杂性与快速获得结果的需要,我建议需要使用C一些认真的思考。如果你有很多时间,一定要去C。