从网页获取数据

时间:2014-09-06 22:49:42

标签: javascript html wikipedia-api

我试图仅使用javascript从维基百科中删除第一段。基本上,我想做的是

document.getElementsByTagName("P")[0]

除了我的网页上没有,我想从维基百科中获取一个给定的页面并应用该功能。我目前的代码给出了:

Uncaught TypeError: undefined is not a function

我的代码:

function getWikiDescription(searchTerm)
{
    var theURL = "http://en.wikipedia.org/wiki/" + searchTerm.replace(" ", "_");
    var article = null;
    $.get(theURL, function(data){
        wikiHelper(data);
    }, "html");
}
function wikiHelper(data)
{
    alert(data);
    console.log(data.getElementByTagName("p")[0]);
}
getWikiDescription("godwin's law");

数据基本上变成了一个包含所有html的巨型字符串,但getElementByTagName函数不起作用。任何帮助将不胜感激,提前谢谢。

2 个答案:

答案 0 :(得分:0)

浏览器通常不允许向不同于脚本来源的域发送ajax请求。你不能只是发送和ajax请求到你喜欢的任何页面。 阅读same origin policy 关于ways to circumvent this

答案 1 :(得分:0)

你可以使用jQuery和jinP,它支持jQuery和WikiMedia API(通过尊重?callback=?查询参数)

"use strict";

var endpoint = 'http://en.wikipedia.org/w/api.php';

$.ajax({
    url: endpoint,
    crossDomain: true,
    dataType: 'jsonp',
    data: {
        format: "json",
        action: "parse",
        page: "Bay_View_Historical_Society"
    },
    error: function(xhr,status,error){
        alert( error );
    }
}).done(function(rawhtml){
    var dom_object = $( '<div>' + rawhtml.parse.text['*'] + '</div>' );
    var p = $(dom_object).find('p').first();
    p.appendTo('#output');
});

工作示例:

http://jsfiddle.net/sean9999/0h4t0ybd/2/

jQuery并不是绝对必要的,但它使代码简洁易读。

代码执行以下操作:

  1. 对内容发出JSONP请求
  2. 将标记向下拉为文本
  3. 将文本转换为DOM结构
  4. 查询第一个节点(doc.getElementsByTagName("P")[0]
  5. 的DOM结构