使用标准格式从内部网站抓取数据

时间:2017-11-29 21:52:41

标签: excel vba web-scraping screen-scraping

我们有一个ERP系统,通过其数据仓库无法获得某些数据。这导致不得不进入产品并手动提取我想要的数据......超过2000种产品。

网址是这样的:

www.ERP.com - 然后我登录 https://ERP.com/.../ro/product_detail.jsp?companyId=XXXXX&productId=YYYY

我在excel表中有公司ID,在excel表中有产品ID。

系统带回了大量的产品数据,其中有3行代码,我需要10位数字。代码是:

<TD class="verdanaBlue">Schedule B Number&nbsp;:&nbsp;</TD>
<TD class="verdanaBlue" id="scheduleBNumber">
    3902100000<input type="hidden" name="scheduleBNumber" class="verdana" value="3902100000"

从此我需要第一组数字3902100000 ...

我想将数字放在我表格的另一栏中。

代码可以这样工作:点击运行,并使用我的表格中的公司ID和产品ID在谷歌中获取上述网址(我已经登录),运行,等待一下,然后刮掉10位数字......

如果你能帮忙,我,我的手,手指和眼睛都会非常感激!

0 个答案:

没有答案