搜索html表并用php编写特定的行/列

时间:2013-07-15 07:22:05

标签: php html search html-table

我制作了一个代码,从另一个网站读取一个表并将其写在我的网站上。现在我想只读取特定的行/列并将其写在我的网站上。该表充满了天气数据,每5分钟刷新一次。我只需要完整和半小时的值,而不是行中的所有值,而只需要温度。例如,每隔五分钟就有一行包含温度值,湿度,太阳辐射等。我需要找到一个值,比如05:00,以及该行的只读/写温度列。在这种情况下,它将是:05:00 12,5°C。而且我需要48个值,因为每天24小时,包括另外24个半小时,它们共48个,对吧..

这是我的代码的一部分:

<?php

$trazi = ':00';
$citaj = file('proba.txt');
foreach($citaj as $linija)
{
  if(strpos($linija, $trazi) !== false)
   echo $linija;
}

$traziURL = "somepage";
$stranica = file_get_contents($traziURL);
$tablica = '/(<table.*<\/table>)/s';
preg_match_all($tablica, $stranica, $zeit);
echo $zeit[0][0];
$ime = "proba.txt";
$table = fopen($ime, 'w') or die ("Error!");
$podaci = $zeit[0][0];

fwrite($table, $podaci);
fclose($table);

?>

它有可能对你不起作用,因为有些部分缺失,只是为了给你这个想法。

1 个答案:

答案 0 :(得分:0)

我确信还有其他多种方法可以做到这一点,但我会这样做。

<?php

/**
 * @author Bart Degryse
 * @copyright 2013
 */

function getData() {
  //Get the html page
  $url = "http://www.essen-wetter.de/table.php";
  $content = file_get_contents($url);

  //Turn it into a dom document searchable by xpath
  $dom = new DOMDocument();
  $dom->loadHTML($content);
  $xpath = new DOMXPath($dom);

  //Get field names
  $query = "//tr/td[position()=1 and normalize-space(text()) = 'Zeit']";
  $entries = $xpath->query($query);
  $entry = $entries->item(0);
  $tr = $entry->parentNode;
  foreach ($tr->getElementsByTagName("td") as $td) {
    $fieldnames[] = $td->textContent;
  }

  //Get field data
  $query = "//tr/td[position()=1 and (substring-after(normalize-space(text()),':') = '00' or substring-after(normalize-space(text()),':') = '30')]";
  $entries = $xpath->query($query);
  foreach ($entries as $entry) {
    $fieldvalues = array();
    $tr = $entry->parentNode;
    foreach ($tr->getElementsByTagName("td") as $td) {
      $fieldvalues[] = $td->textContent;
    }
    $data[] = array_combine($fieldnames, $fieldvalues);
  }

  //Return data set
  return $data;
}

//Gather the data
$data = getData();

//Do something with it
echo "<pre>\n";
foreach ($data as $row) {
  echo "Temperature at {$row['Zeit']} was {$row['Temperatur']}.\n";
}
echo "</pre><hr><pre>\n";
print_r($data);
echo "</pre>\n";
?>

如果要在UTF-8兼容终端或声明为UTF-8编码的网页上显示数据,则应该这样做。 如果您想使用单字节ISO-8859-1编码,则必须更改此行:

    $fieldnames[] = $td->textContent;

进入这个:

    $fieldvalues[] = utf8_decode($td->textContent);

<强>备注 请注意,虽然这样做在技术上并不合法,但你在松散的地方。该页面上的数据受版权保护,由Markus Wolter拥有。在未经他同意的情况下将他的数据用于您自己的目的被视为盗窃。