从网站填写表格和网页剪贴

时间:2018-10-09 14:51:34

标签: web-scraping web-scripting ie-plugins

这不是一个很好的开始,但是如果这是题外话,请原谅我,但这似乎是一个编程问题...

在ASP.NET网站上,我想在新的浏览器中打开一个页面,该页面的顶部是工具栏,底部是类似iframe的窗口。框架式窗口将支持选项卡式浏览并加载第三方网站。工具栏将具有允许用户操作HTML(表单填充和网页抓取)的按钮。例如,工具栏按钮可以是“提取网页数据”或“填写表格”。

理想情况下,它可以与IE,Edge,Chrome和Safari一起使用,但是绝对最低要求是IE,更优选的最低要求是Chrome和Edge。

我已经看到其他专有软件可以做到这一点。我不知道他们是否需要特定的浏览器(例如IE,可以在其中安装插件)或如何做到这一点,这是我的问题。

所以我将这个问题缩小为三种可能性:

  1. 使用纯HTML,Javascript等。 -使用iFrame几乎可以完美地工作,但是内容不会在同一个域中,因此我无法访问iFrame的HTML。

  2. 使用(或编写)专有的浏览器-我认为您不能(或不想)从网页启动EXE,而且这本身似乎很复杂。

  3. 使用(或编写)插件-可能限制对IE的使用。我认为IE插件可以根据我见过的其他插件来实现我想要的功能。

我曾经在Web自动化和脚本产品方面拥有过桌面编程经验,虽然很有前途,但我认为他们不能满足我的需求:

它们具有在服务器端运行的ASP.NET COM组件,因此它不会向用户显示界面,但可用于基于脚本以静默方式填充和抓取网站。

它们还具有专有的浏览器,该浏览器显示用户界面并运行脚本来填充和抓取。但这是一个EXE,因此无法从网站启动。

他们有一个IE插件,可添加一个附加的弹出窗口,将其自身附加到IE。类似于他们的浏览器并运行脚本。

问题-我已经知道可以做到,但是机制是什么?我倾向于使用IE插件。

如果插件是答案,则chrome具有扩展名,这有可能吗?

0 个答案:

没有答案