在线工具,用URL列表将数据从网站中提取并抓取到excel中

时间:2015-04-01 06:13:15

标签: web-crawler excel-2010 extract web-content

是否有任何在线工具(无需在计算机上安装软件)从网站中提取带有URL列表的数据。我想从www.indiabix.com中提取数据,例如:

1)问题

2)选项1

3)选项2

4)选项4

5)回答(这是启用了java脚本)

6)解释

我希望所有这些信息都能出类拔萃。 我尝试了import.io,但效果不大,另一个工具WEBCONTENTEXTRACTOR不是免费的,试用版只有14天。

3 个答案:

答案 0 :(得分:0)

我刚尝试了#34;火车上的问题"部分:

http://www.indiabix.com/aptitude/problems-on-trains/

仅使用Magic(即基于Web的工具),我认为您可以获得非常接近所需格式的数据 - 并以CSV格式下载(然后可以在Excel中打开):

https://magic.import.io/?site=http:%2F%2Fwww.indiabix.com%2Faptitude%2Fproblems-on-trains%2F&utm_source=bm&utm_medium=bm&utm_campaign=bm

不幸的是,由于答案是隐藏的,我担心您需要桌面应用程序来解压缩它(它是免费的 - 虽然我感谢你提到你不想安装任何东西) 。 来自support@import.io的人很棒,您可以随时与他们联系,了解是否有任何技巧/提示可以达到您想要的效果。

希望这有帮助。

答案 1 :(得分:0)

您可以像这样使用Magic: https://magic.import.io/?site=http:%2F%2Fwww.indiabix.com%2Faptitude%2Fproblems-on-trains%2F&utm_source=bm&utm_medium=bm&utm_campaign=bm

答案可以在名为divspacer_contents的列中找到 如果您查看该列的内容,您将看到每个问题的答案。

答案 2 :(得分:0)

问题是陈旧的,但值得一提的是DataScraping.co,您可以在chrome商店中使用名为“Advanced web scraper”的Chrome扩展程序来设置抓取代理,然后使用在线应用程序来提取几乎任何网站。

enter image description here

注意:我是该产品的创始成员之一