使用PHP手动解析原始multipart / form-data数据

时间:2011-03-30 08:28:59

标签: php http parsing curl

我似乎无法找到这个问题的真正答案所以我在这里:

如何在PHP中以multipart/form-data格式解析原始HTTP请求数据?我知道如果格式正确,原始POST会自动解析,但我所指的数据来自PUT请求,而PHP不会自动解析。数据是多部分的,看起来像:

------------------------------b2449e94a11c
Content-Disposition: form-data; name="user_id"

3
------------------------------b2449e94a11c
Content-Disposition: form-data; name="post_id"

5
------------------------------b2449e94a11c
Content-Disposition: form-data; name="image"; filename="/tmp/current_file"
Content-Type: application/octet-stream

�����JFIF���������... a bunch of binary data

我用libcurl发送数据(伪代码):

curl_setopt_array(
  CURLOPT_POSTFIELDS => array(
    'user_id' => 3, 
    'post_id' => 5, 
    'image' => '@/tmp/current_file'),
  CURLOPT_CUSTOMREQUEST => 'PUT'
  );

如果我删除CURLOPT_CUSTOMREQUEST位,请求将在服务器上作为POST处理,所有内容都会被解析得很好。

有没有办法手动调用PHP的HTTP数据解析器或其他一些好的方法呢? 是的,我必须将请求发送为PUT:)

6 个答案:

答案 0 :(得分:25)

好的,对于Dave和Everts的建议,我决定手动解析原始请求数据。在搜索了大约一天后,我没有找到任何其他方法来做到这一点。

我得到了thread的帮助。我没有像在引用的线程中那样篡改原始数据,因为这会破坏正在上传的文件。所以这都是正则表达式。这并没有很好地测试,但似乎适用于我的工作案例。没有进一步的麻烦,并希望有一天这可能会帮助别人:

function parse_raw_http_request(array &$a_data)
{
  // read incoming data
  $input = file_get_contents('php://input');

  // grab multipart boundary from content type header
  preg_match('/boundary=(.*)$/', $_SERVER['CONTENT_TYPE'], $matches);
  $boundary = $matches[1];

  // split content by boundary and get rid of last -- element
  $a_blocks = preg_split("/-+$boundary/", $input);
  array_pop($a_blocks);

  // loop data blocks
  foreach ($a_blocks as $id => $block)
  {
    if (empty($block))
      continue;

    // you'll have to var_dump $block to understand this and maybe replace \n or \r with a visibile char

    // parse uploaded files
    if (strpos($block, 'application/octet-stream') !== FALSE)
    {
      // match "name", then everything after "stream" (optional) except for prepending newlines 
      preg_match("/name=\"([^\"]*)\".*stream[\n|\r]+([^\n\r].*)?$/s", $block, $matches);
    }
    // parse all other fields
    else
    {
      // match "name" and optional value in between newline sequences
      preg_match('/name=\"([^\"]*)\"[\n|\r]+([^\n\r].*)?\r$/s', $block, $matches);
    }
    $a_data[$matches[1]] = $matches[2];
  }        
}

通过引用使用(为了不过多地复制数据):

$a_data = array();
parse_raw_http_request($a_data);
var_dump($a_data);

编辑:这个答案在7年后仍然定期点击。从那以后我从未使用过这段代码,现在也不知道是否有更好的方法。请查看下面的评论,并了解有许多情况下此代码无效。使用风险自负。

答案 1 :(得分:8)

我很惊讶没有人提到parse_strmb_parse_str

$result = [];
$rawPost = file_get_contents('php://input');
mb_parse_str($rawPost, $result);
var_dump($result);

http://php.net/manual/en/function.mb-parse-str.php

答案 2 :(得分:3)

我使用了Chris的示例函数并添加了一些所需的功能,例如R Porter需要$ _FILES的数组。希望它可以帮助一些人。

这是class&例如usage

<?php
include_once('class.stream.php');

$data = array();

new stream($data);

$_PUT = $data['post'];
$_FILES = $data['file'];

/* Handle moving the file(s) */
if (count($_FILES) > 0) {
    foreach($_FILES as $key => $value) {
        if (!is_uploaded_file($value['tmp_name'])) {
            /* Use getimagesize() or fileinfo() to validate file prior to moving here */
            rename($value['tmp_name'], '/path/to/uploads/'.$value['name']);
        } else {
            move_uploaded_file($value['tmp_name'], '/path/to/uploads/'.$value['name']);
        }
    }
}

答案 3 :(得分:2)

我怀疑最好的方法是“自己动手”,尽管你可能会在使用类似(如果不是完全相同)格式的多部分电子邮件解析器中找到灵感。

从Content-Type HTTP标头中抓取边界,并使用它来分解请求的各个部分。如果请求非常大,请记住,您可能会将整个请求存储在内存中,甚至可能多次。

相关的RFC是RFC2388,幸运的是很短。

答案 4 :(得分:1)

我没有多处理http标题,但发现了一些可能有用的代码

function http_parse_headers( $header )
{
    $retVal = array();
    $fields = explode("\r\n", preg_replace('/\x0D\x0A[\x09\x20]+/', ' ', $header));
    foreach( $fields as $field ) {
        if( preg_match('/([^:]+): (.+)/m', $field, $match) ) {
            $match[1] = preg_replace('/(?<=^|[\x09\x20\x2D])./e', 'strtoupper("\0")', strtolower(trim($match[1])));
            if( isset($retVal[$match[1]]) ) {
                $retVal[$match[1]] = array($retVal[$match[1]], $match[2]);
            } else {
                $retVal[$match[1]] = trim($match[2]);
            }
        }
    }
    return $retVal;
}

来自http://php.net/manual/en/function.http-parse-headers.php

答案 5 :(得分:1)

您是否看过fopen("php://input")解析内容?

标题也可以设为$_SERVER['HTTP_*'],名称总是大写,破折号变为下划线,例如$_SERVER['HTTP_ACCEPT_LANGUAGE']