在simple_html_dom之前使用str_replace

时间:2013-07-06 20:39:28

标签: php simple-html-dom

我正在使用简单的HTML dom抓取scapped数据并且它一直运行良好。但是,我拥有的其中一个源没有任何唯一字段,因此我尝试str_replace然后抓取我重命名的元素然后使用simple_html_dom。

然而,它不起作用。我的代码是:

require('simple_html_dom.php');

// Create DOM from URL or file
$html = file_get_html('http://www.url.com');

$html = str_replace('<strong>','',$html);

$html = str_replace('</strong>','',$html);   

$html = str_replace('<span class="pound">&pound;</span>','',$html);

$html = str_replace('<td>','<td class="myclass">',$html);

foreach($html->find('td.myclass') as $element)
   $price = $element->innertext;

$price = preg_replace('/[^(\x20-\x7F)]*/','', $price);

echo $price;

1 个答案:

答案 0 :(得分:0)

<?php
  require('simple_html_dom.php');
  // Create DOM from URL or file
  $html = file_get_html( 'http://www.url.com' );

  foreach( $html->find( 'td' ) as $element ) {
    $price  = trim( str_replace( "&pound;", "", $element->plaintext ) );
  }

  $price = preg_replace('/[^(\x20-\x7F)]*/','', $price);

  echo $price;
?>