PHP - 在RTF / txt文件中查找/替换文本

时间:2013-03-20 17:59:11

标签: php str-replace

我遇到了查找特定文本并将其替换为替代文本的问题。 我正在使用.rtf.txt文件测试下面的代码。我也确保文件是可写的,来自我的服务器。

这是一个命中与失败的情况,我很好奇我的代码是否错误,或者这只是打开和操纵文件的奇怪。

<?php

$filelocation = '/tmp/demo.txt';
$firstname = 'John';
$lastname = 'Smith';

$output = file_get_contents($filelocation);
$output = str_replace('[[FIRSTNAME]]', $firstname, $output);
$output = str_replace('[[LASTNAME]]', $lastname, $output);
$output = str_replace('[[TODAY]]', date('F j, Y'), $output);

// rewrite file
file_put_contents($filelocation, $output);

?>

因此,在demo.txt文件中,我有一整页文字,[[FIRSTNAME]],[[LASTNAME]]和[[TODAY]]四处散布。

找到/替换它是命中和错过。到目前为止,[[TODAY]]总是被正确替换,而名称则不是。

有没有人有同样的问题?

(旁注,我已经检查了错误日志,到目前为止,没有从打开文件返回PHP警告/错误,也没有写入)

2 个答案:

答案 0 :(得分:1)

很难说没有看到demo.txt的内容。我的第一个猜测是,使用括号作为指针可能会出现问题。我会尝试更改为RTF未使用的内容,如百分号或星号。例如:%% FIRSTNAME %%,** FIRSTNAME **(这当然假设您可以控制demo.txt的内容。)

答案 1 :(得分:0)

我也遇到过这个问题。似乎Microsoft Word在标记中插入格式代码。我发了一篇关于如何在我的技术博客上解决这个问题的博客文章。

http://tech.humlesite.eu/2017/01/13/using-regular-expression-to-merge-database-content-into-rich-text-format-template-documents/

PHP示例如下所示:

<?php 

$file = file_get_contents('mergedoc.rtf');

// To temporary get rid of the escape characters...
$mergetext = str_replace("\\", "€€", $file); 

// New seven part regex with default value detection
$regex2 = '/<<((?:€€[a-z0-9]*|\}|\{|\s)*)([a-z0-9.\-\+_æøåÆØÅA-Z]*)((?:€€[a-z0-9]*|\}|\{|\s)*)([a-z0-9.\-\+_æøåÆØÅA-Z]*)((?:€€[a-z0-9]*|\}|\{|\s)*)(?:\s*:(.*?)\s*)?((?:€€[a-z0-9]*|\}|\{|\s)*)>>/';

// Find all the matches in it....
preg_match_all($regex2,$mergetext, $out, PREG_SET_ORDER);

// Lets see the result
var_dump($out); 

foreach ($out as $match) {
    $whole_tag = $match[0]; // The part we actually replace. 
    $start = $match[1]; // The start formatting that has been injected in our tag, if any
    $tag = $match[2]; // The tag word itself. 
    if (($match[4].$match[6]) != "") { //some sec-part tag or default value?
        $end = $match[5]; // The end formatting that might be inserted. 
        if ($end == "") {
            $end = $match[7]; // No end in 5, we try 7. 
        }
    } else {
        $end = $match[3]; // No second tag or default value, we find end in match-3 
    }

    $secPartTag = $match[4]; // Do we have inserted some formatting inside the tag word too ? 
    if ($secPartTag != "") {
        $tag .= $secPartTag; // Put it together with the tag word. 
    }
    $default_value = $match[6]; 

    // Simple selection of what we do with the tag. 
    switch ($tag) {
        case 'COMPANY_NAME': 
            $txt = "MY MERGE COMPANY EXAMPLE LTD"; 
            break; 
        case 'SOMEOTHERTAG':
            $txt = "SOME OTHER TEXT XX"; 
            break; 
        case 'THISHASDEFAULT':
            $txt = ""; 
            break; 

        default:
            $txt = "NOTAG"; 
    }
    if ($txt == "") {
        $txt = $default_value; 
    }
    // Create RTF Line breaks in text, if any. 
    $txt = str_replace(chr(10), chr(10)."\\line", $txt); 
    // Do the replace in the file. 
    $mergetext = str_replace($whole_tag, $start.$txt.$end, $mergetext); 
}
// Put back the escape characters. 
$file = str_replace("€€", "\\", $mergetext);
// Save to file. Extention .doc makes it open in Word by default. 
file_put_contents("ResultDoc.doc", $file); 

?>