使用php合并基于第一列的2个文本文件

时间:2016-04-13 14:48:53

标签: php shell file concat

我有2个日志文件,包含多行,如

第一

1|2016-04-13|...
3|2016-03-13|...

第二

2|POST|accept: txt|...
3|POST|accept: txt|...

预期结果:

3|2016-03-13|...|POST|accept: txt|...

所以我需要使用PHP脚本将所有数据基于第一列(ID)组合到单个文件中。
注意:行数可以不同。只需要交叉点(订单敏感)

3 个答案:

答案 0 :(得分:1)

打开两个日志文件。

你可以使用fopen和fgets(在foreach / while循环中)来获取数组

或使用file_get_contents按\ n(\ r \ n在Win上)爆炸文件

现在你应该有两个包含两个日志文件行的数组。 然后你这样做:

 $log1Lines = array("3|...|...", "4|...|...");
 $log2Lines = array("2|...|...", "3|...|...");

 $merged = array();

foreach($log1Lines as $row1){
     $id1 = explode("|", $row1)[0];
     foreach($log2Lines as $row2){
          $exploded = explode("|", $row2);
          $id2 = array_shift($exploded);
          if($id1 == $id2){
                $merged[$id1] = $row1 . "|" . implode("|", $exploded);
          }
     }
 }
 print_r($merged);
teoreticaly它应该可以在没有循环的情况下进行(比较array_intersect对两个数组之间的解析索引),但我现在没办法解决这个问题。

希望它有所帮助。

答案 1 :(得分:1)

我最近需要写一些相似的东西,所以我已经为你的格式更新了一些。如有必要,这将支持2个以上的文件,并允许更改分隔符。

<?php
class Merger
{
    protected $separator = '|';
    protected $data = [];
    protected $initialised = false;

    public function mergeFile($filename)
    {
        $file = new SplFileObject($filename);
        $fileKeys = [];

        // Read the information out of the current file
        while (!$file->eof()) {
            $line = $file->fgets();
            $parts = explode($this->separator, trim($line));
            $id = array_shift($parts);
            $fileKeys[] = $id;

            $fileData[$id] = $parts;
        }

        // First pass: add everything
        if (!$this->initialised)
        {
            $this->data = $fileData;
        }

        // Subsequent passes, only add things that have already been seen, then
        // clear out anything that wasn't in the current file
        else
        {
            foreach ($fileData as $id => $data)
            {
                if ($this->data[$id])
                {
                    $this->data[$id] = array_merge($this->data[$id], $data);
                }
            }

            $this->data = array_filter($this->data, function ($e) use ($fileKeys) {
                return in_array($e, $fileKeys);
            }, ARRAY_FILTER_USE_KEY);
        }

        $this->initialised = true;
    }

    public function output($filename)
    {
        foreach ($this->data as $id => $data)
        {
            $output .= $id . $this->separator . implode($this->separator, $data) . PHP_EOL;
        }

        file_put_contents($filename, $output);
    }
}

$merger = new Merger;
$merger->mergeFile('1.txt');
$merger->mergeFile('2.txt');

echo $merger->output('output.txt');

答案 2 :(得分:0)

我的解决方案是:

<?php 
    exec ("awk -F'|' -vOFS='|' '(NR==FNR){a[$1]=$0; next}{if(a[$1]){print $2,a[$1]}}' first.log second.log > result.log");
?>

我使用exec php函数来执行shell脚本

awk -F'|' -vOFS='|' '(NR==FNR){a[$1]=$0; next}{if(a[$1]){print $2,a[$1]}}' first.log second.log > result.log

此处-F'|'指定&#39; |&#39;作为分隔符的符号,first.logsecond.log是我要合并的文件。