使用JavaScript有效地将网页数据提取到数据结构中

时间:2015-01-18 15:34:47

标签: javascript html stackexchange

我是JS的新手,我正在努力找出执行此任务的最有效方法。

Stack Exchange会在http://stackexchange.com/sites

保留其成员网站的列表

将这些数据提取到数据结构中的最有效方法是什么,比如JavaScript中的数组或字典?

2 个答案:

答案 0 :(得分:1)

似乎所有的stackexchange站点都使用相同的框架构建。如果您在控制台中签入,则可以看到在任何stackexchange站点上定义了javascript对象StackExchange

如果您只想在问题中抓取该链接,可以在浏览器中找到该链接,然后在控制台中输入:$('.gv-item-collapsed-wrapper h2').text()

该页面已经加载了jQuery,您可以使用它来搜索页面上的元素。该代码段将显示字符串中的所有网站标题。

更好(但有点复杂)

var arr = [];
$('.gv-item-collapsed-wrapper h2').each(function(){arr.push($(this).text())});

答案 1 :(得分:0)

我刚测试了一小部分网站,这似乎有效:

window["StackExchange"] !== undefined

如果您查看任何页面的来源,总会有这样的内容:

StackExchange.ready(function () {

所以基本上你要检查一下这个班级StackExchange是否存在,如果存在,最有可能(我确信在互联网群众中,有人在借用/窃取代码或使用相同的名称)StackExchange站点。