创建时间和内存高效的PHP脚本

时间:2009-07-03 12:05:51

标签: php mysql

我必须重写我的代码,以便在内存和执行时间方面有所改进。

脚本的作用是创建一个mysql转储,其中数据进入大数据表并插入另一个数据库。

这里处理的数据大约是17 MB的表数据,大约需要62 MB的内存。任何建议如何降低内存使用量,以后它会变得越来越大?

<?php
ini_set("max_execution_time", "28800");
error_reporting(E_ALL);

include(dirname(__FILE__)."/includes/prepend.php");

$table = "source_table";
$target = "destination_table";

echo 'Initial: ' . number_format((memory_get_usage()/ 1024) / 1024 , 0, '.', ',') . " MB <br>";

$db = new DB_cms();
$db->beginTransaction();

$return.= 'DELETE FROM '.$target.'; '. "\n\n";

if($db->query('SELECT * FROM '.$table)){
    $i=0;
    $itemList = array();

    while($db->next_record()){

        $itemList[$i]["guid"] = $db->f("guid");
        $itemList[$i]["title"] = $db->f("title");
        $itemList[$i]["description"] = $db->f("description");
        $itemList[$i]["copyright"] = $db->f("copyright");
        $itemList[$i]["mediaType"] = $db->f("wapMediaType");
        $itemList[$i]["price"] = $db->f("displayPrice");
        $itemList[$i]["category"] = $db->f("category");
        $itemList[$i]["thumbnail"] = $db->f("thumbnail");

        //begin json  data
        $json = new Services_JSON();
        $keywords_arr = $json->decode($db->f("keywords"));

        foreach($keywords_arr as $key => $value){
             $itemList[$i][$key] = $value;
        }

        $credit_arr = $json->decode($db->f("credit"));
        foreach($credit_arr as $c => $credit){
            $itemList[$i][str_replace(' ','',$c)] = $credit;
        }
        $i++;
    }

    $toInsert = array();

    foreach($itemList as $items => $item){
        $guid = mysql_real_escape_string($item["guid"]);
        $title = mysql_real_escape_string($item["title"]);
        $description = mysql_real_escape_string(ereg_replace('"', "",$item["description"]));
        $copyright = mysql_real_escape_string($item["copyright"]);
        $mediaType = mysql_real_escape_string($item["mediaType"]);
        $price = mysql_real_escape_string($item["price"]);
        $keywords = mysql_real_escape_string(ereg_replace('"', "",$item["keywords"]));
        $category = mysql_real_escape_string(ereg_replace('"', "",$item["category"]));
        $thumbnail = mysql_real_escape_string($item["thumbnail"]);
        $date = date("Y-m-d H:i:s");
        //json decoded  data
        $artist = mysql_real_escape_string($item["artist"]);
        $label = mysql_real_escape_string($item["label"]);
        $genre = mysql_real_escape_string($item["genre"]);
        $media_format = mysql_real_escape_string($item["mediaformat"]);
        $country = mysql_real_escape_string($item["country"]);
        $album_title = mysql_real_escape_string(ereg_replace('"', "",$item["albumtitle"]));

        $toInsert[] = "('0', $guid, 'NULL', '".$mediaType."', '".$category."', '".$keywords."', '".$title."', '".$artist."', '".$album_title."', '".$genre."', '".$label."', '".$media_format."', '".$country."', '".$description."', '".$thumbnail."', '".$price."', '".$copyright."', '".$date."', '0', '".$date."', '0', 'active')";
    }

    $sqlStart = "INSERT INTO `".$target ."` (`SortVar`, `Guid`, `Space`, `MediaType`, `Category`, `Keywords`, `Title`, `Artist`, `Album`, `Genre`, `Label`, `Mediaformat`, `Country`, `Description`, `Thumbnail`, `Price`, `Copyright`, `DateCreated`, `CreatedBy`, `DateModified`, `ModifiedBy`, `Status`) VALUES";

    foreach (array_chunk($toInsert, 100) as $insertSet) {
        $return.= $sqlStart . implode(', ', $insertSet);
        $return.="; \n";
    }

    //save file
    $handle = fopen(ABSOLUTE_DUMP_PATH.'file'.'.sql','w+');
    if(fwrite($handle,$return)){
        fclose($handle);
        $ret = true;
    } else {
        $ret = false;
    }

    $usage = memory_get_usage();
    $total_usage = ($usage / 1024) / 1024;
    echo 'Peak: ' . number_format($total_usage, 0, '.', ',') . " MB<br>";
    echo 'End: ' . number_format($total_usage, 0, '.', ',') . " MB<br>";
}
?>

2 个答案:

答案 0 :(得分:1)

如果您在1个数据库中的两个表之间执行此操作(这是您当前的代码似乎要执行的操作),请在一个SQL语句中执行此操作。如果您不需要,请不要将数据下载到PHP。你会想要使用MySQL的insert...select syntax。查询应该看起来不完全不同于:

INSERT INTO `target_table` (`SortVar`, `Guid`, `Space`, `MediaType`, `Category`, `Keywords`, `Title`, `Artist`, `Album`, `Genre`, `Label`, `Mediaformat`, `Country`, `Description`, `Thumbnail`, `Price`, `Copyright`, `DateCreated`, `CreatedBy`, `DateModified`, `ModifiedBy`, `Status`)
  SELECT *
  FROM `source_table`;

答案 1 :(得分:1)

不是将所有内容都读入数组,然后将其写入目标文件,而是尝试重构程序,以便逐步写出来。