是否可以编写程序来获取在线搜索结果?
具体来说,我想要来自http://portal.uspto.gov/external/portal/pair
的数据示例数据是应用程序编号,例如9078871,10595401
是的,他们有CAPTCHA,我愿意手工输入。问题是我有超过500个申请号,我该怎么办?我有更简单的方法吗?
提前致谢!此外,搜索引擎似乎是用javascript编写的,但我不太确定。
答案 0 :(得分:0)
当然有可能,为什么不可以。
我不知道你的知识差距会使你能够完成这项任务,因为你没有指出这一点。
一步一步......
我在你提到的网站上挖了一点,真正可以说的是它不会是1小时的动作,因为它是用Java编写的(JSP; Java Server Pages)。
我到目前为止发现的是,您首先必须编写函数getDossier
的等效函数,或使用Webbrowser控件使您能够手动调用javascript以获取搜索结果。然后你可以简单地将一些正则表达式一起烘焙,从而将数据解析出来。