从网页提取数据到Excel工作表

时间:2018-10-18 17:51:44

标签: asp.net excel vba web

如何将网页中的信息提取到Excel工作表中?

该网站为https://www.proudlysa.co.za/members.php,我想提取其中列出的所有公司及其所有信息。

2 个答案:

答案 0 :(得分:0)

您所指的过程称为“网页抓取”,这里有一些VBA教程供您尝试。

或者,您可以随时尝试

答案 1 :(得分:-1)

我尝试为所有页面创建一些内容。但是时间充裕并且有错误。这应该对您有所帮助。您将必须在所有112页上执行此操作。

使用chrome转到页面

在网址中输入javascript:,然后粘贴以下代码。它应该满足您的需求。那么您只需要复制并粘贴到excel中即可。

var list = $(document).find(".pricing-list");
var csv ="";
for (i = 0; list.length > i;i++) {
    var dataTags = list[i].getElementsByTagName('li');
    var dataArr = [];
    for (j = 0; dataTags.length > j;j++) {
        dataArr.push(dataTags[j].innerText.trim());

    }
    csv += dataArr.join(', ') + "<br>";
}

您会得到类似的东西

enter image description here

已编辑

使用此选项将自动将每个页面下载为csv,然后您就可以将它们合并。

确保粘贴前在网址中输入javascript:,然后按Enter键

也适用于chrome,不确定其他浏览器。我不太用它们

var list = $(document).find(".pricing-list");
var csv ="data:text/csv;charset=utf-8,";
for (i = 0; list.length > i;i++) {
    var dataTags = list[i].getElementsByTagName('li');
    var dataArr = [];
    for (j = 0; dataTags.length > j;j++) {
        dataArr.push(dataTags[j].innerText.trim());

    }
    csv += dataArr.join(', ') + "\n";
}
var a = document.createElement("a");
a.href = ""+ encodeURI(csv);
a.download = "data.csv";
a.click();