刮掉这种类型的网站架构可能吗?

时间:2017-02-26 20:56:16

标签: web-scraping xmlhttprequest httprequest httpresponse

我正在尝试为客户构建Web应用程序。它在此站点上实现了一个简单的远程搜索:

https://www.handelsregister.de/rp_web/mask.do?Typ=n

我需要做的就是在标有Company or keywords的输入字段中插入一些值,执行搜索并获取HTTP响应。

问题是我不熟悉这种架构;我一直使用具有URL等的API。是否可以通过编程自动执行上述操作?

1 个答案:

答案 0 :(得分:1)

可能。您可以发送POST请求并解析响应。以下是Python中使用模块requests

的基本示例
import requests 

query = "test"

post_fields = {'suchTyp':'n',
        'registerArt':'',
        'registerNummer':'',
        'registergericht':'',
        'schlagwoerter':query,
        'schlagwortOptionen':2,
        'ergebnisseProSeite':100,
        'btnSuche':'Rechercher'}

response = requests.post("https://www.handelsregister.de/rp_web/search.do", data=post_fields)
print(response.status_code)
print(response.text)