set objXmlHttp = Server.CreateObject("Msxml2.ServerXMLHTTP")
objXmlHttp.Open "GET", "http://www.yapi.com.tr/Haberler/e_61034.html", false
objXmlHttp.Send
response.write objXmlHttp.ResponseText
这段代码没有给我所有的源代码。 Responsetext直到“YapıDergisi,284”,但orjinal页面直到“/ body / html”。为什么这会发生在我身上?
Orjinal page - http://www.yapi.com.tr/Haberler/e_61034.html
答案 0 :(得分:0)
在原始页面中,主文章末尾似乎有一个空字节(在“284”之后)。似乎ResponseText将该空字节视为响应字符串的结尾。我能够通过使用以下内容获得完整的文章:
<%
Response.CharSet = 65001
Response.AddHeader "Content-Type", "text/html;charset=UTF-8"
set objXmlHttp = Server.CreateObject("Msxml2.ServerXMLHTTP")
objXmlHttp.Open "GET", "http://www.yapi.com.tr/Haberler/e_61034.html", false
objXmlHttp.Send
Response.BinaryWrite objXmlHttp.ResponseBody
%>
请注意,我将响应字符集设置为与原始页面匹配的UTF-8。