Question

当我运行此脚本时，我无法获得HTML页面的结构。它只是很多没有br或新行的文本。

这是脚本：

<?php


$page = strip_tags(file_get_contents('http://stats.swehockey.se/Teams/Info/TeamRoster/5467#G%C3%96T'));

file_put_contents('teams.txt', $page);

$start = 677; 
$end = 840;   

$lines = file('teams.txt'); 
for ($i = $start; $i <= $end && $i < count($lines); $i++) {
    echo $lines[$i];
}

?>

我想恢复结构，以便将内容放入mySQL数据库。

Answer 1

你在寻找这样的东西：

<?php
$page = file_get_contents('http://stats.swehockey.se/Teams/Info/TeamRoster/5467#G%C3%96T');
file_put_contents('teams.txt', $page);
$start = 677; 
$end   = 840;   
$lines = file('teams.txt'); 
for ($i = $start; $i <= $end && $i < count($lines); $i++) {
    echo $lines[$i];
}
?>

Answer 2

我不知道你在获取内容后使用strip_tags（）的原因，这里是文档说的：

strip_tags - 从字符串中删除HTML和PHP标记。 Learn more about strip_tags()

你得到这个结果是正常的。要获取所有HTML，您必须将其删除：

$page = file_get_contents('http://stats.swehockey.se/Teams/Info/TeamRoster/5467#G%C3%96T');

Strip_tags PHP - 获取结构

2 个答案: