我正在尝试将Google搜索结果包含在我正在创建的页面中。这些搜索结果的格式为XML。
目前我正在导入XML:
if (window.XMLHttpRequest) {
// Code for Internet Explorer7+, Firefox, Chrome, Opera, and Safari
xmlhttp = new XMLHttpRequest();
}
else {
// Code for Internet Explorer 6 and Internet Explorer 5
xmlhttp = new ActiveXObject("Microsoft.XMLHTTP");
}
xmlhttp.open("GET", "foo", false);
xmlhttp.send();
xmlDoc = xmlhttp.responseXML;
其中foo
是包含搜索结果的XML文件的URL。
此功能完美,但仅当foo
以.xml
等适当的扩展名结尾时才有效。这会产生问题,因为包含搜索结果的页面(http://search.domain.com/search?q=queryString&output=xml
)没有扩展名。
当我尝试使用搜索结果的URL调用xmlhttp.open()
时,xmlhttp.send()
失败,并且不会执行其后的任何函数或命令。
我尝试了几种使用jQuery和纯JavaScript导入/解析文件的不同方法,但它们似乎都不起作用。
有没有办法只导入无扩展名文件的文本?
然后,我可以使用parseFromString
解析文本。这样我就可以获得所需的数据,但只能将搜索结果中的所有文本(无论金额)复制到我的页面中。
我更希望是否有一种方法可以让我打开并将无扩展名页面解析为XML文件。
如果您需要更多信息,请与我们联系。
这是应该返回的代码:
<?xml version="1.0" encoding="ISO-8859-1" standalone="no"?>
<!DOCTYPE GSP SYSTEM "google.dtd">
<GSP VER="3.2">
<TM>TimeTaken(in seconds)</TM>
<Q>queryString</Q>
<PARAM name="q" value="queryString" original_value="queryString"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="ie" value="UTF-8" original_value="UTF-8"/>
<PARAM name="ulang" value="en" original_value="en"/>
<PARAM name="ip" value="ipAddress" original_value="ipAddress"/>
<PARAM name="access" value="p" original_value="p"/>
<PARAM name="sort" value="date:D:L:d1" original_value="date:D:L:d1"/>
<RES SN="1" EN="10">
<M><!-- The estimated total number of results for the search -->3560</M>
<FI/>
<NB>
<NU>/search?q=queryString&lr=&ie=UTF-8&output=xml&access=p&sort=date:D:L:d1&start=10&sa=N</NU>
</NB>
<!-- First result -->
<R N="1"> <U><!--URL of result-->http://www.google.com?option=42</U>
<UE><!--URL of result with special characters changed to html
equivalent-->http://www.google.com%3Foption%3D</UE>
<T><!--Title of result -->Google </T>
<RK><!--Query Ranking
10(highest relevance)-1(lowest relevance)-->10</RK>
<ENT_SOURCE> <!--Identifies the application ID (serial number) of the
search appliance that contributes to a result.-->
S5-KUB000F0ADETLA </ENT_SOURCE>
<FS NAME="date" VALUE=""/>
<S><!-- Snippet for the search result --> Search the world's information,
including webpages, images, videos and more. <em>Google</em> has many
special features to help you find exactly what you're looking
<b>...</b></S><LANG>en</LANG>
<HAS><!--special features that are included for this search result-->
<L/>
<C SZ="30k" CID="TiXnj_p8qlgJ" ENC="ISO-8859-1"/>
</HAS>
</R>
</RES>
</GSP>
现在我实际上已经好好看了一下,谷歌在使用&output=xml
时答应我的XML代码并不是那么“xml-ey”。有办法解决这个问题,还是我不得不废弃我的项目?
我能够使用相同的“XML”与php解析器很好地协作,但我被要求将所有内容更改为JavaScript而不是PHP。
答案 0 :(得分:0)
由于您已经在使用jQuery,只需使用 .ajax 方法,该方法可以在dataType选项设置为“xml”时自动解析XML。
jQuery.ajax({
url:"http://example.com/someurl",
dataType:"xml",
success:function(xml) {
//xml will be an object which you can use to access the elements.
}
});
如果正在检索正在检索的文件的内容类型,例如text/html
,则可以将dataType
更改为'text xml'
,以便jQuery知道将文本视为XML。
如果您想继续使用vanilla JavaScript来执行Ajax次请求,则必须获取.responseText
而不是.responseXML
,然后解析
var xmlDoc = new DOMParser().parseFromString(xmlhttp.responseText,'text/xml');
请注意,不完全支持DOMParser,例如,9以下的Internet Explorer不支持它。