PHP fgetcsv - 检测太多记录

时间:2013-10-01 13:23:00

标签: php csv

我有以下csv文件:

"Id","Title","Body","Tags"
"101","this title","
\"">.</>"";
","c# asp.net excel table"

我想将其转换为数组,如下所示:

Array
(
    [0] => Array
        (
            [0] => Id
            [1] => Title
            [2] => Body
            [3] => Tags
        )

    [1] => Array
        (
            [0] => 101
            [1] => this title
            [2] => \"">.</>"";
            [3] => c# asp.net excel table
        )
)

我的代码是:

while (($data = fgetcsv($handle, 0, ",")) !== FALSE) {
    $num = count($data);

    for ($c=0; $c < $num; $c++) {
        $data[$c] = strip_tags($data[$c]);
    }

    $result[$row] = $data;
    $row++;
}
fclose($handle);
return $result;

我的问题是我得到以下数组:

Array
(
    [0] => Array
        (
            [0] => Id
            [1] => Title
            [2] => Body
            [3] => Tags
        )

    [1] => Array
        (
            [0] => 101
            [1] => this title
            [2] => 
\">.</>"";
        )

    [2] => Array
        (
            [0] => ,c# asp.net excel table"
        )

)

一般情况下,当字段中存在潜在的代码时,如何避免检测到太多的recors(它是StackOverflow数据转储,因此某些文本字段具有各种编程代码)。

2 个答案:

答案 0 :(得分:1)

此字符串未正确转义:

"
\""&gt;.&lt;/&gt;"";
"

所有引用字符必须在它们之前有反斜杠(或者您传递给适当参数的其他转义字符。 你不应该将0和逗号传递给fgetcsv,它们已经是默认值:http://php.net/fgetcsv

答案 1 :(得分:1)

尝试使用CSVed打开文件,确保其格式正确为CSV格式。

如果CSV被破坏,那么您可以快速修复已解析的结果。例如:

while (($data = fgetcsv($handle, 0, ",")) !== FALSE) {
    $num = count($data);

    for ($c=0; $c < $num; $c++) {
        $data[$c] = strip_tags($data[$c]);
    }

    if (count($data) == 3) {
        $data[1][2] .= $data[2].[0];
        unset($data[2]);
    }

    $result[$row] = $data;
    $row++;
}
fclose($handle);
return $result;