我有一个问题,我可以使用简单的HTML DOM或cURL保存很多页面,但是通过这个域我只能保存一半的内容,我不知道为什么。
当我打印变量$html
时,我会看到页面的完整内容。数据库字段是普通文本字段。
我的代码:
include('config.php');
include('simple_html_dom.php');
$html = file_get_html('http://www.statistik-portal.de/Statistik-Portal/');;
mysql_query("UPDATE `kgs_test` SET `content` = '$html' WHERE `id` = 1");
我的数据库中保存的代码:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" lang="de" xml:lang="de"> <head> <title>Gemeinsames Datenangebot der Statistischen Ämter des Bundes und der Länder</title> <meta http-equiv="content-type" content="text/html; charset=iso-8859-1" /> <meta name="content-language" content="de" /> <meta name="description" content="Gemeinsames Datenangebot der Statistischen Ämter des Bundes und der Länder" /> <meta name="author" content="Statistisches Landesamt Baden-Württemberg" /> <meta name="keywords" content="Daten, Bund, Land" /> <meta http-equiv="imagetoolbar" content="no" /> <meta name="robots" content="index, follow, noarchive" /> <link rel="shortcut icon" href="/Statistik-Portal/favicon.ico" type="image/ico" /> <link rel="search" type="application/opensearchdescription+xml" href="/Statistik-Portal/Suche/OpenSearch.xml" title="Amtl.Statistik" /> <link rel="stylesheet" type="text/css" media="screen" href="/Statistik-Portal/styleScreen.css" title="Standard" /> <link rel="stylesheet" type="text/css" media="print" href="/Statistik-Portal/stylePrint.css" /> <link rel="alternate stylesheet" type="text/css" media="screen" href="/Statistik-Portal/styleScreenS.css" title="nur-Text" /> <meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=3"/> </head> <body onload="window.focus()"> <p id="skipNav"><a href="#content">Navigation
当我尝试使用更多代码行从其他域保存页面时,我没有任何问题。如果我尝试保存此域的子页面,则每次在“导航”一词后停止代码。