用CSV替换换行符

时间:2012-12-27 13:46:17

标签: php regex csv preg-replace

我有一个关于将CSV字符串转换为数组的问题。

INV;165;1;0;1 Username;0;10000;"Here is multiline-text.

with line-breaks:

";20 Offen;0,00
INV;166;1;0;1 Username2;0;10000;"Here is another multiline-text.

with line-breaks:

";20 Offen;0,00

我试图用str_getcsv拆分字段,但问题是,分隔符只出现在一个字段中,而且函数也在分割多行字段。

我的解决方案是首先通过preg_replace转换换行符,但我没有进入它。 这是我的正则表达式,只替换“和”所包含的换行符; :

/(;")(.*)(\n)(.*)(";)/

此模式实际上只匹配第一个换行符。 有人能给我一个暗示做这个工作吗?

提前谢谢。

以下是原始CSV:

CMXINV;165;1;0;1 Felix Hirschberg;0;10000;Herr;;Max;Muster;Company;;Street;123;City;DE;(0 40) 6 25 6;;(0 40) 6 25 6;mail@muster.de;;;;;;;;0;20121217;20121217;1 Sofort ohne Abzug;EUR;1 Agentur;0 ;0,00;;"Vielen Dank für Ihren Auftrag.

Vereinbarungsgemäß berechnen wir Ihnen:

";"Mit besten Grüßen


Invoice Man";;0;0;0;0;;20 Offen;0,00;;0 ;0,00;0,00;;EXW;;;;;;;;;;;;;;;;2;;Project: Test-Project;;0,000;0,00;1,000;0,00;0,00;0;0;0;0;0
CMXINV;165;2;0;1 Felix Hirschberg;0;10000;Herr;;Max;Muster;Company;;Street;123;City;DE;(0 40) 6 25 6;;(0 40) 6 25 6;mail@muster.de;;;;;;;;0;20121217;20121217;1 Sofort ohne Abzug;EUR;1 Agentur;0 ;0,00;;"Vielen Dank für Ihren Auftrag.

Vereinbarungsgemäß berechnen wir Ihnen:

";"Mit besten Grüßen


Invoice Man";;0;0;0;0;;20 Offen;0,00;;0 ;0,00;0,00;;EXW;;;;;;;;;;;;;;;;0;1;"- job1 (1h)
- job2 (1h)
- job3 (0,75h)
- job4 (1h)
- job5 (0,5h)";HR;3,25;100,00;1,00;0,00;325,00;1;0;0;0;0
MESSAGE;S;210053;INVOICE_GET hat 1 Datensätze zurückgegeben
MESSAGE;S;204020;Datenübertragung erfolgreich. Es wurden 1 Datensätze verarbeitet.

3 个答案:

答案 0 :(得分:2)

你可以试试这个:

/;"(([^"]*)([\r\n])+([^"]*))+"/im

这将匹配;"分隔符中每个换行符之前和之后的文本。 第二个匹配将是前面的文本,第四个匹配将是以下文本。

请注意,我已经离开了最后一个';'如果多行值是行中的最后一行,则确保它仍然匹配。

答案 1 :(得分:1)

根据php手册中的用户评论,fgetcsv()str_getcsv()都应该正确处理新行。

您可能应该利用这些实施(他们应该已经解决了您可能遇到的任何问题)。


编辑:自己的解析器

或者您可以编写自己的解析器(基于注释):

// Browse file one character after another
while (false !== ($c = fgetc($fp))) {
    // We are not inside the value, newline = new row
    if( ($c == "\n") || ($c == "\r")){
       // Newline, add to result
       continue;
    }

    // Whitespace? continue, do nothing
    if( ctype_space( $c)){
        continue;
    }

    // Okay, now we can use switch
    switch( $c){
        case ',':
            // Add empty value
            break;

        // Escaped value
        case '"':
        case "'":
            $escapeChar = $c;
            $prevChar = '';
            $value = '';

            while( false !== ($c = fgetc($fp))){
                // We just hit and end of escaped sequence, check escaped val by \
                if( ($c == $escapeChar) && ($c != '\\') ){
                   break;
                }

                // If we got \ and prev value is \ = "blah blah \\"
                // Prevent escape escape character of being guessed incorrectly
                if( ($c == '\\') && ($prevChar == '\\')){
                    $prevChar = '';
                } else {
                    $prevChar = $c;
                }

                $value .= $c;
            }

            // $value is your value
            break;

        // Normal, non escaped value:
        default:
            $value = '';
            while( false !== ($c = fgetc($fp))){
                if( ($c == ',') || ($c == '\n') || ($c == '\r')){
                    break;
                }
                $value .= $c;
            }

            // $value = your field value
            break;
     }
}

答案 2 :(得分:0)

如果你在一个文件中有CSV输入,你可以使用fgetcsv(),它可以很好地处理多行条目。

如果CSV输入是字符串,您可以使用特殊的php://temp I / O流将其有效地传递给fgetcsv()

$fp = fopen( 'php://temp', 'w+' );
fputs( $fp, $csv );
rewind( $fp );
$data = fgetcsv( $fp, 0, ';', '"' );
fclose( $fp );