为什么我不能用cURL或Simple HTML DOM保存这个网站?

时间:2016-01-08 07:39:53

标签: javascript php html curl

我有一个问题,我可以使用简单的HTML DOM或cURL保存很多页面,但是通过这个域我只能保存一半的内容,我不知道为什么。

当我打印变量$html时,我会看到页面的完整内容。数据库字段是普通文本字段。

我的代码:

include('config.php');
include('simple_html_dom.php');

$html = file_get_html('http://www.statistik-portal.de/Statistik-Portal/');;

mysql_query("UPDATE `kgs_test` SET `content` = '$html' WHERE `id` = 1");

我的数据库中保存的代码:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">    <html xmlns="http://www.w3.org/1999/xhtml" lang="de" xml:lang="de">  <head>  <title>Gemeinsames Datenangebot der Statistischen &Auml;mter des Bundes und der L&auml;nder</title>  <meta http-equiv="content-type" content="text/html; charset=iso-8859-1" />  <meta name="content-language" content="de" />  <meta name="description" content="Gemeinsames Datenangebot der Statistischen &Auml;mter des Bundes und der L&auml;nder" />  <meta name="author" content="Statistisches Landesamt Baden-W&uuml;rttemberg" />  <meta name="keywords" content="Daten, Bund, Land" />  <meta http-equiv="imagetoolbar" content="no" />  <meta name="robots" content="index, follow, noarchive" />  <link rel="shortcut icon" href="/Statistik-Portal/favicon.ico" type="image/ico" />  <link rel="search" type="application/opensearchdescription+xml" href="/Statistik-Portal/Suche/OpenSearch.xml" title="Amtl.Statistik" />  <link rel="stylesheet" type="text/css" media="screen" href="/Statistik-Portal/styleScreen.css" title="Standard" />  <link rel="stylesheet" type="text/css" media="print" href="/Statistik-Portal/stylePrint.css" />  <link rel="alternate stylesheet" type="text/css" media="screen" href="/Statistik-Portal/styleScreenS.css" title="nur-Text" />    <meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=3"/>    </head>    <body onload="window.focus()">    <p id="skipNav"><a href="#content">Navigation 

当我尝试使用更多代码行从其他域保存页面时,我没有任何问题。如果我尝试保存此域的子页面,则每次在“导航”一词后停止代码。

0 个答案:

没有答案