当我运行此脚本时,我无法获得HTML页面的结构。 它只是很多没有br或新行的文本。
这是脚本:
<?php
$page = strip_tags(file_get_contents('http://stats.swehockey.se/Teams/Info/TeamRoster/5467#G%C3%96T'));
file_put_contents('teams.txt', $page);
$start = 677;
$end = 840;
$lines = file('teams.txt');
for ($i = $start; $i <= $end && $i < count($lines); $i++) {
echo $lines[$i];
}
?>
我想恢复结构,以便将内容放入mySQL数据库。
答案 0 :(得分:0)
你在寻找这样的东西:
<?php
$page = file_get_contents('http://stats.swehockey.se/Teams/Info/TeamRoster/5467#G%C3%96T');
file_put_contents('teams.txt', $page);
$start = 677;
$end = 840;
$lines = file('teams.txt');
for ($i = $start; $i <= $end && $i < count($lines); $i++) {
echo $lines[$i];
}
?>
答案 1 :(得分:0)
我不知道你在获取内容后使用strip_tags()的原因,这里是文档说的:
strip_tags - 从字符串中删除HTML和PHP标记。 Learn more about strip_tags()
你得到这个结果是正常的。要获取所有HTML,您必须将其删除:
$page = file_get_contents('http://stats.swehockey.se/Teams/Info/TeamRoster/5467#G%C3%96T');