linux - 从网页自动下载数据

我曾经从网站上下载数据，有时它很无聊且重复，所以我想知道有什么方法可以自动下载数据。

例如，我曾经从此链接下载：“ http://isc-mirror.iris.washington.edu/iscbulletin/search/arrivals/#phases” 。我需要做和更改的是填充并选择一些参数，然后单击“搜索到的货物” 。例如，就我而言，我需要单击“已审核的ISC公告” ，在“阶段名称：” 部分中写上一个阶段名称（例如Sg），然后选择<分别为“为活动选择区域：” 和“选择站点：” 的strong>“矩形搜索” 。例如，我想在“最高纬度（-90至90）：” 中输入 '50'，在中输入 '40' >“底纬度（-90至90）：” ，“ 70” 表示“左经度（-180至180）：” 和 <80> 表示“选择活动的区域：” 和“选择站点”中的“右经（-180至180）：” ：” 。我需要将“开始日期：” 更改为“ 1/1/1964” ，并为添加“日期” “结束日期：” ，然后单击“搜索到达” ，最后，我将获得输出。我正在考虑以一种系统的方式并且像一个循环那样进行此操作，逐年获取结果，然后将所有结果输出到一个文件中。对于每年，唯一要更改的参数是“开始日期：” 和“结束日期：” ，而其他选择和参数相同。

为澄清起见，我提供一个带有值的示例：1）首先，我如上所述填充参数，并将“ 1/1/1964” 设为“开始”日期：和“ 1/1/1965” 作为“结束日期：” ，点击“搜索到达” ，输出结果在文件中。 2）然后刷新网站，完全像以前一样填补空白，并获得下一年的输出。我们只需要将以前的“结束日期：” ，“ 1/1/1965” 替换为新的“开始日期：” 并将“ 1/1/1966” 作为新的“结束日期：” ，然后单击“搜索到达” 并将其输出到上一个文件（输出）。我想继续此过程，直到 1/12/2017 。

这样做的原因是，如果我要下载很大的年份范围，输出的大小会很大，从而导致进程崩溃。

我使用Linux服务器和Shell，并熟悉AWK 。我曾经使用 Google Chrome 作为我的互联网浏览器。在不熟悉这样的过程之前，我还没有做过这样的事情。如果有人可以帮助我如何以这种自动化的方式获取数据，我将深表感谢。

最好的问候

从网页自动下载数据

0 个答案: