我正在用selenium和beautifulsoup4解析网页, 我在解析特定网页时遇到问题。
当我在该页面上实际查看html源代码并使用selenium或bs4进行解析时,我得到了不同的html源代码页面。 不同之处在于形式和输入的存在。
当我解析该页面时,我得到了
的html<form action="" method="post" name="fmove">
<input name="goAction" style="display:none" type="submit"/>
</form>
我无法找到输入或提交的内容。 请让我理解这个问题。 谢谢!
答案 0 :(得分:2)
我将专注于[找到]输入或提交的内容&#39;没有涉及更广泛的问题。即便如此,如果与该页面相关联的代码没有安排填写表单的action
属性和/或其input
个元素{{}},我告诉您并不能保证产生答案。 {1}}和name
对。
首先,在Chrome浏览器中打开该页面。使用上下文菜单中的项目来检查&#39;屏幕上的元素,用于查找最终提交该表单的Javascript。在代码中的行上放置一个断点。现在重新加载页面(F5)并练习表单。代码应该在断点处停止。您应该能够在屏幕的最右侧部分看到value
元素的属性,包括form
和名称 - 值对,您可以在其中复制它们以便在您自己的代码中使用。< / p>
PS:我真的必须提到,如果不知道你正在抓什么网站,很难确定很多这个。祝你好运!