在GAE上使用PHP解析远程csv文件

时间:2011-08-08 07:49:19

标签: php google-app-engine quercus

我似乎是在使用Quercus在Google App Engine上使用PHP开发的小应用程序中捕获22;

  1. 我有一个远程csv文件,我可以下载&存储在字符串中
  2. 要解析该字符串,我最好使用str_getcsv,但Quercus还没有这个功能
  3. Quercus似乎知道fgetcsv,但是该函数需要一个我没有的文件句柄(我不能创建一个新文件,因为GAE不允许创建文件)
  4. 任何人都知道如何解决这个问题而不必忽略内置的PHP csv-parser函数并编写我自己的解析器?

5 个答案:

答案 0 :(得分:1)

我认为最简单的解决方案就是编写自己的解析器。无论如何它都是小菜一碟并且会让你学习更多的正则表达式 - 在PHP中没有csv字符串到数组解析器是没有意义的,因此编写自己的完全合理。只要确保它不会太慢;)

答案 1 :(得分:0)

您可以使用stream_wrapper_register创建新的流包装器。

以下是阅读全局变量的手册中的示例:http://www.php.net/manual/en/stream.streamwrapper.example-1.php

然后您可以像普通文件句柄一样使用它:

$csvStr = '...';
$fp = fopen('var://csvStr', 'r+');
while ($row = fgetcsv($fp)) {
    // ...
}
fclose($fp);

答案 2 :(得分:0)

这显示了一个简单的手动解析器,我使用带有限定的,不合格的转义功能的示例输入编写。它可以用于标题和数据行,并包含一个assoc数组函数,使您的数据成为一个kvp样式数组。

//example data
$fields = strparser('"first","second","third","fourth","fifth","sixth","seventh"');
print_r(makeAssocArray($fields, strparser('"asdf","bla\"1","bl,ah2","bl,ah\"3",123,34.234,"k;jsdfj ;alsjf;"')));


//do something like this
$fields = strparser(<csvfirstline>);
foreach ($lines as $line)
    $data = makeAssocArray($fields, strparser($line));


function strparser($string, $div = ",", $qual = "\"", $esc = "\\") {
    $buff = "";
    $data = array();
    $isQual = false; //the result will be a qualifier
    $inQual = false; //currently parseing inside qualifier

    //itereate through string each byte
    for ($i = 0; $i < strlen($string); $i++) {
        switch ($string[$i]) {
            case $esc:
                //add next byte to buffer and skip it
                $buff .= $string[$i+1];
                $i++;
                break;
            case $qual:
                //see if this is escaped qualifier
                if (!$inQual) {
                    $isQual = true;
                    $inQual = true;
                    break;
                } else {
                    $inQual = false; //done parseing qualifier
                    break;
                }
            case $div:
                if (!$inQual) {
                    $data[] = $buff;    //add value to data
                    $buff = "";         //reset buffer
                    break;
                }
            default:
                $buff .= $string[$i];
        }
    }
    //get last item as it doesnt have a divider
    $data[] = $buff;
    return $data;
}

function makeAssocArray($fields, $data) {
    foreach ($fields as $key => $field)
        $array[$field] = $data[$key];
    return $array;
}

答案 3 :(得分:0)

如果它可以很脏又快。我会用的 http://php.net/manual/en/function.exec.php 传递它并使用sed和awk(http://shop.oreilly.com/product/9781565922259.do)来解析它。我知道你想使用php解析器。我之前尝试过并且失败只是因为它没有发出错误的声音。 希望这可以帮助。 祝好运。

答案 4 :(得分:0)

您可以将fopenphp://tempphp://memoryphp.net)一起使用,以使其发挥作用。您要做的是打开php://tempphp://memory,写入,然后回滚(php.net),然后将其传递给fgetcsv。我没有对此进行测试,但可能会有效。