PHP& CSV:删除或忽略以不同长度行的字符开头的行

时间:2013-03-14 06:50:36

标签: php csv

我的CSV文件在第一列中使用了键,每个都有不同的行长。

文件顶部,标题行以“M”开头,然后以“C”开头,然后“A”的行在整个文件中交替出现。

M   P395, 177   177, 13/03/13, , , , , , , FALSE,   1904.2, , , , , , , , , , , , , , 
C   QTM0039326, X6  100013424,  Example, , Example  WA  6754    AU, FALSE,  TRUE    FALSE, N,   FALSE, FALSE, FALSE Example Example Brisbane,   Brisbane City   QLD 4000    AU, , , , , , Example   TRACKADV
A   0.1, , , FALSE  FALSE   0, , , , , , , , , , , , , , , , , , , , , 
C   QTM0039226  7021130 X6  100013427,  Example, , Example  NSW 2795    AU  427181931   FALSE,  TRUE    FALSE, N    0, FALSE, FALSE, FALSE  Example Example, , Brisbane QLD 4000    AU  Example Example Example, , Example  QLD 4211    AU, Example TRACKADV
A   4.1 0   0   0, ARTICLE CONTAINS CONSUMER GOOD(S)    FALSE   FALSE   0   0,  FALSE   FALSE   FALSE   FALSE   FALSE, FALSE, , , , , , , , , , , , , , , , 
C   QTM0039214  7021130 X6  100013440   Example, Example, , Example QLD 4502    AU  32858429    FALSE,  TRUE    FALSE, N    0, FALSE, FALSE, FALSE  Example Example, , Brisbane QLD 4000    AU  Example Example Example, , Example  QLD 4211    AU, Example TRACKADV
A   1.35    0   0   0, ARTICLE CONTAINS CONSUMER GOOD(S)    FALSE   FALSE   0   0,  FALSE   FALSE   FALSE   FALSE   FALSE, FALSE, , , , , , , , , , , , , , , , 
C   QTM0039296  7021130 X6  100013349, Metro Auto Spares    Example, , Example  TAS 7310    AU  427236691   FALSE,  TRUE    FALSE, N    0, FALSE, FALSE, FALSE  Example Example, , Brisbane QLD 4000    AU  Example Example Example, , Example  QLD 4211    AU, Example TRACKADV
A   5.25    0   0   0, ARTICLE CONTAINS CONSUMER GOOD(S)    FALSE   FALSE   0   0,  FALSE   FALSE   FALSE   FALSE   FALSE, FALSE, , , , , , , , , , , , , , , , 
C   QTM0039300  7021130 X6  100013345,  Example, , Example  QLD 4303    AU  402131430   FALSE,  TRUE    FALSE, N    0, FALSE, FALSE, FALSE  Example Example, , Brisbane QLD 4000    AU  Example Example Example, , Example  QLD 4211    AU, Example TRACKADV
A   0.6 0   0   0, ARTICLE CONTAINS CONSUMER GOOD(S)    FALSE   FALSE   0   0,  FALSE   FALSE   FALSE   FALSE   FALSE, FALSE, , , , , , , , , , , , , , , , 
C   QTM0039242  7021130 X6  100008683,  Example, , Example  SA  5034    AU  403468706   FALSE,  TRUE    FALSE, N    0, FALSE, FALSE, FALSE  Example Example, , Brisbane QLD 4000    AU  Example Example Example, , Example  QLD 4211    AU, Example TRACKADV
A   0.6 0   0   0, ARTICLE CONTAINS CONSUMER GOOD(S)    FALSE   FALSE   0   0,  FALSE   FALSE   FALSE   FALSE   FALSE, FALSE, , , , , , , , , , , , , , , , 
C   QTM0039065  7021130 X6  100013177,  Example, , Example  VIC 3136    AU  61397233661 FALSE,  TRUE    FALSE, N    0, FALSE, FALSE, FALSE  Example Example, , Brisbane QLD 4000    AU  Example Example Example, , Example  QLD 4211    AU, Example TRACKADV

我只需要来自行C的数据。是否可以快速删除以“M”和“A”开头的所有行,或者忽略脚本中的这些行?

如果我删除所有的M&手动从目标文件中获取行我可以使用它来获取我想要的数据,但由于行长度不同,无论新行字符如何,我都无法使用此方法。

if (($handle = fopen("test.csv", "r")) !== FALSE) {
    while (($data = fgetcsv($handle, 1000, ",", "\n")) !== FALSE) 
    {
        echo $data[0] . " - ". $data[1] . " - ". $data[4] . "<br/><hr>" ;
    }

    fclose($handle);
}

1 个答案:

答案 0 :(得分:0)

一种方法是

preg_replace_all('#^([MCA])\s#im',"$1,",$file);

然后将其解析为普通CSV

while($line=fgetcsv($f))
{
    if($line[0]=="M" || $line[0]=="A") continue;
    /* ... */
}

如果你使用PHP&gt; = 5.3,你可以使用另一种方式:str_getcsv

while($line=fgets($f))
{
    if(preg_match('#^[MA]\s#i',$line)) continue;
    $line=str_getcsv(substr($line,2));
    /* ... */
}

此方法的一个缺点是,如果您的CSV包含"multiline \n column"之类的内容,则会中断。

关于可变长度问题,您可能有兴趣知道fgetcsv只需要一个参数就可以工作(PHP&gt; = 5);将所有其他参数保留为默认值,它将读取每个CSV行的全长。