纯文本上的简单HTML DOM str_replace

时间:2013-11-24 20:26:51

标签: php mysql dom str-replace simple-html-dom

我正在尝试创建一些可以更改网页上所有文本并将其输出给用户的内容。它将改变数据库中预定义的单词。

我正在使用http://simplehtmldom.sourceforge.net作为我的HTML解析器。我想要的只是改变标签内部的测试,而不是标签。我认为这样可行,如果我回复$e->plaintext它会起作用但是它没有被设计。

<?php
// example of how to modify HTML contents
include('../simple_html_dom.php');

// get DOM from URL or file
$html = file_get_html('http://example.com/');

$e = $html->find("html", 0);

$text = $e->plaintext;

$con = mysqli_connect("localhost","root","root","Words");
$result = mysqli_query($con,"SELECT * FROM Wordsweb");

//replace all words
$English = array();
$Simple = array();

while ($row =  mysqli_fetch_array($result)){
    $English[] = $row['English'];
    $Simple[] = $row['Simple'];
}

$e->plaintext = str_replace($English, $Simple,$e->plaintext);
echo $e;
?>

提前致谢!

p.s。:之前我使用的是preg_replace_callback,但建议我使用它。

1 个答案:

答案 0 :(得分:0)

单独替换每个文本节点的内容,而不是一次更改整个文件的文本:

<?php

// load the HTML document
$doc = new DOMDocument;
@$doc->loadHTMLFile('https://en.wikipedia.org/wiki/Banana');

// select all the text nodes
$xpath = new DOMXPath($doc);
$nodes = $xpath->query('//text()');

// replace text in each text node
$english = array('banana', 'bananas');
$simple = array('yello', 'yellos');

foreach ($nodes as $node) {
    $node->nodeValue = str_replace($english, $simple, $node->nodeValue);
}

print $doc->saveHTML();