我正在使用MySQL处理HHVM。我真的很困惑,发现使用multi_query()批处理2000 sql查询比使用单个查询()的2000循环要慢得多(请参阅代码和结尾处的结果)。通过进一步分析,我发现API next_result()占用了大部分时间(~70%)。
我的问题是:
(1)为什么API next_result()太慢了?
(2)如果我想一起做成千上万的SQL查询,有没有比天真循环更好的方法呢?
谢谢!
这是代码(php):
$conn = new mysqli("localhost", "root", "pwd", "table");
$loop = 2000;
$q = "select * from ContactInfo;";
// single query in a loop
$results = array();
$sq_start = microtime(true);
for ($i=0; $i < $loop; $i++) {
$ret = $conn->query($q);
$results[] = $ret;
}
for ($i=0; $i < $loop; $i++) {
$xx = $results[$i]->fetch_all();
}
$sq_end = microtime(true);
// construct the multi-query
for ($i=0; $i < $loop; $i++) {
$m_q .= $q;
}
// multi-query in one round-trip
$mq_start = microtime(true);
$conn->multi_query($m_q);
do {
$ret = $conn->store_result();
$xx = $ret->fetch_all();
} while($conn->next_result());
$mq_end = microtime(true);
echo "Single query: " . ($sq_end - $sq_start)*1000 . " ms\n";
echo "Multi query: " . ($mq_end - $mq_start)*1000 . " ms\n";
结果如下:
Single query: 526.38602256775 ms
Multi query: 1408.7419509888 ms
注意:在这种情况下,next_result()将消耗922ms。
答案 0 :(得分:0)
这里最简单的答案是开销。 multi_query()
为每个结果集构建一个数据对象。然后它必须一遍又一遍地存储该对象。
相比之下,您一遍又一遍地运行相同的查询,但只编写一个简单的数据数组来存储结果。然后PHP可以释放前一个结果集的内存,因为你经常覆盖同一个变量(一旦数据对象内部没有任何指向它的内容,它就可以garbage collected)。
但这不是一个非常好的用例。这里没有真正的应用程序,因为不需要反复运行相同的查询(您的数据库应该在第一次运行时缓存结果,然后将数据存储在内存中以便更快地检索)。 对于单个结果集,此处的差异可以忽略不计。