比较PHP中2 csv文件的内容

时间:2011-10-23 04:51:56

标签: php csv

有谁知道比较2个csv文件内容并报告相同行的最佳方法是什么。

相同的意思是,每列具有相同值的记录。

3 个答案:

答案 0 :(得分:2)

我认为这是Lord Vader所说的实际代码:

#!/usr/bin/php
<?
$strFile1 = $argv[1];
$strFile2 = $argv[2];

function parseData($strFilename) {
  $strAllData = file($strFilename);
  foreach($strAllData as $intLineNum => $strLineData) {
    $arrLineData = explode(',',$strLineData);
  }
  return $arrLineData;
}

$arrFile1 = parseData($strFile1);
$arrFile2 = parseData($strFile2);

$intRow = 0;
foreach($arrFile1 as $intKey => $strVal) {
  if(!isset($arrFile2[$intKey]) || ($arrFile2[$intKey] != $strVal)) {
    exit("Column $intKey, row $intRow of $strFile1 doesn't match\n");
  }
  $intRow++;
}
print "All rows match fine.\n";

?>

答案 1 :(得分:1)

rlCH的代码示例存在一些问题,即

  • 无法处理多行csv
  • 只能处理一个方向的差异
  • 停在第一个差异

虽然对于操作来说可能已经足够了,但我正在寻找一种方法来正确比较两个多行csv文件。 (包含数据跨越多行的多行)所以我花了一些时间实际创建一个,我想为什么不分享它。也许它为某人节省了一点时间。

现在,我没有从命令行使用PHP,所以如果你想这样做,我建议你改变输入处理和输出(这个输出html所以你可以在浏览器中使用它)

用法; 将脚本和文件放在目录中进行比较 使用两个参数f1和f2调用脚本 例如compareCSV.php?f1 = file1.csv&amp; f2 = file2.csv

<?php

//---- init
$strFileName1=isset($_REQUEST['f1'])?$_REQUEST['f1']:'';
$strFileName2=isset($_REQUEST['f2'])?$_REQUEST['f2']:'';

if ( !$strFileName1 ) { die("I need the first file (f1)"); }
if ( !$strFileName2 ) { die("I need the second file (f2)"); }

try {
    $arrFile1 = parseData($strFileName1);
    $arrFile2 = parseData($strFileName2);
} catch (Exception $e) {
    die($e->getMessage());
}

$rowCount1=count($arrFile1);
$rowCount2=count($arrFile2);

$colCount1=count($arrFile1[0]);
$colCount2=count($arrFile2[0]);

$highestRowCount = $rowCount1>$rowCount2 ? $rowCount1:$rowCount2;
$highestColCount = $colCount1>$colCount2 ? $colCount1:$colCount2;

$row = 0;
$err = 0;

//---- code

echo "<h2>comparing $strFileName1 and $strFileName2</h2>";
echo "\n<table border=1>";
echo "\n<tr><th>Err<th>Row#<th>Col#<th>Data in $strFileName1<th>Data in $strFileName2";
while($row<$highestRowCount) {
    if(!isset($arrFile1[$row])) {
        echo "\n<tr><td>Row missing in $strFileName1<th>$row";
        $err++;
    } elseif(!isset($arrFile1[$row])) {
        echo "\n<tr><td>Row missing in $strFileName2<th>$row";
        $err++;
    } else {
        $col=0;
        while($col<$highestColCount) {
            if ( !isset($arrFile1[$row][$col]) ) {
                echo "\n<tr><td>Data missing in $strFileName1<td>$row<td>$col<td><td>".htmlentities($arrFile2[$row][$col]);
                $err++;
            } elseif ( !isset($arrFile2[$row][$col]) ) {
                echo "\n<tr><td>Data missing in $strFileName1<td>$row<td>$col<td>".htmlentities($arrFile1[$row][$col]) ."<td>";
                $err++;
            } elseif ( $arrFile1[$row][$col] != $arrFile2[$row][$col] ) {
                echo "\n<tr><td>Data mismatch";
                echo "<td>$row <td>$col";
                echo "<td>".htmlentities($arrFile1[$row][$col]);
                echo "<td>".htmlentities($arrFile2[$row][$col]);
                $err++;
            }
            $col++;
        }
    }
    $row++;
}
echo "</table>";

if ( !$err ) {
    echo "<br/>\n<br/>\nThe two csv data files seem identical<br/>\n";
} else {
    echo "<br/>\n<br/>\nThere are $err differences";
}


//---- functions

function parseData($strFilename) {
    $arrParsed = array();
    $handle = fopen($strFilename , "r");
    if ($handle) {
        while (!feof($handle)) {
            $data = fgetcsv($handle , 0 , ',' , '"' );
            if ( empty($data)) continue; //empty row
            $arrParsed[]=$data;
        }
        fclose($handle);
    } else {
        throw new Exception("File read error at $strFilename");
    }
    return $arrParsed;
}

?>

答案 2 :(得分:0)

您有文件A和文件B.

解析文件A并为每一行创建对象,并将一行的内容存储在一个对象中。在创建对象时,将它们存储在数组中。

对文件B执行相同的操作。

所以现在你有两个数组,第一个数组用于存储文件A中行的所有数据,另一个数组用于存储。

现在你需要迭代你的第一个数组,首先是数组A中的每个对象,扫描数组B并检查B中是否有相同的对象,如果数组A中的所有元素都通过了这个。这意味着他们是理想的。否则,休息。