使用jQuery解析XML搜索结果页面

时间:2013-10-05 00:12:08

标签: javascript jquery xml

背景

我正在尝试将Google搜索结果包含在我正在创建的页面中。这些搜索结果的格式为XML

目前我正在导入XML:

if (window.XMLHttpRequest) {
    // Code for Internet Explorer7+, Firefox, Chrome, Opera, and Safari
    xmlhttp = new XMLHttpRequest();
}
else {
    // Code for Internet Explorer 6 and Internet Explorer 5
    xmlhttp = new ActiveXObject("Microsoft.XMLHTTP");
}
xmlhttp.open("GET", "foo", false);
xmlhttp.send();
xmlDoc = xmlhttp.responseXML;

其中foo是包含搜索结果的XML文件的URL

问题:

此功能完美,但仅当foo.xml等适当的扩展名结尾时才有效。这会产生问题,因为包含搜索结果的页面(http://search.domain.com/search?q=queryString&output=xml)没有扩展名。

当我尝试使用搜索结果的URL调用xmlhttp.open()时,xmlhttp.send()失败,并且不会执行其后的任何函数或命令。

我尝试了几种使用jQuery和纯JavaScript导入/解析文件的不同方法,但它们似乎都不起作用。

问题:

有没有办法只导入无扩展名文件的文本? 然后,我可以使用parseFromString解析文本。这样我就可以获得所需的数据,但只能将搜索结果中的所有文本(无论金额)复制到我的页面中。

我更希望是否有一种方法可以让我打开并将无扩展名页面解析为XML文件。

如果您需要更多信息,请与我们联系。


这是应该返回的代码:

<?xml version="1.0" encoding="ISO-8859-1" standalone="no"?>
<!DOCTYPE GSP SYSTEM "google.dtd">
<GSP VER="3.2">
  <TM>TimeTaken(in seconds)</TM>
  <Q>queryString</Q>
  <PARAM name="q" value="queryString" original_value="queryString"/>
  <PARAM name="output" value="xml" original_value="xml"/>
  <PARAM name="ie" value="UTF-8" original_value="UTF-8"/>
  <PARAM name="ulang" value="en" original_value="en"/>
  <PARAM name="ip" value="ipAddress" original_value="ipAddress"/>
  <PARAM name="access" value="p" original_value="p"/>
  <PARAM name="sort" value="date:D:L:d1" original_value="date:D:L:d1"/>
  <RES SN="1" EN="10">
    <M><!-- The estimated total number of results for the search -->3560</M>
    <FI/>
    <NB>
      <NU>/search?q=queryString&amp;lr=&amp;ie=UTF-8&amp;output=xml&amp;access=p&amp;sort=date:D:L:d1&amp;start=10&amp;sa=N</NU>
    </NB>
    <!-- First result -->
    <R N="1"> <U><!--URL of result-->http://www.google.com?option=42</U>
      <UE><!--URL of result with special characters changed to html
              equivalent-->http://www.google.com%3Foption%3D</UE>
      <T><!--Title of result -->Google </T>
      <RK><!--Query Ranking
              10(highest relevance)-1(lowest relevance)-->10</RK>
      <ENT_SOURCE> <!--Identifies the application ID (serial number) of the
                      search appliance that contributes to a result.-->
        S5-KUB000F0ADETLA </ENT_SOURCE>
      <FS NAME="date" VALUE=""/>
      <S><!-- Snippet for the search result --> Search the world's information,
      including webpages, images, videos and more. <em>Google</em> has many
      special features to help you find exactly what you're looking&nbsp;
      <b>...</b></S><LANG>en</LANG>
      <HAS><!--special features that are included for this search result-->
        <L/>
        <C SZ="30k" CID="TiXnj_p8qlgJ" ENC="ISO-8859-1"/>
      </HAS>
    </R>
  </RES>
</GSP>

现在我实际上已经好好看了一下,谷歌在使用&output=xml时答应我的XML代码并不是那么“xml-ey”。有办法解决这个问题,还是我不得不废弃我的项目?

我能够使用相同的“XML”与php解析器很好地协作,但我被要求将所有内容更改为JavaScript而不是PHP

1 个答案:

答案 0 :(得分:0)

由于您已经在使用jQuery,只需使用 .ajax 方法,该方法可以在dataType选项设置为“xml”时自动解析XML。

jQuery.ajax({
   url:"http://example.com/someurl",
   dataType:"xml",
   success:function(xml) {
      //xml will be an object which you can use to access the elements.
   }
});

如果正在检索正在检索的文件的内容类型,例如text/html,则可以将dataType更改为'text xml',以便jQuery知道将文本视为XML。

如果您想继续使用vanilla JavaScript来执行Ajax次请求,则必须获取.responseText而不是.responseXML,然后解析

var xmlDoc = new DOMParser().parseFromString(xmlhttp.responseText,'text/xml');

请注意,不完全支持DOMParser,例如,9以下的Internet Explorer不支持它。