我正在使用libpq处理postgresql。下面给出的代码花费了很多时间(代码末尾给出的时间)。
#include "stdafx.h"
#include <stdlib.h>
#include <libpq-fe.h>
#include <windows.h>
static void exit_nicely(PGconn *conn)
{
PQfinish(conn);
exit(1);
}
int _tmain(int argc, _TCHAR* argv[])
{
const TCHAR *conninfo;
PGconn *conn;
PGresult *res;
int nFields, i, j;
if (argc > 1)
conninfo = argv[1];
else
conninfo = _T("hostaddr=192.168.4.171 port=12345 dbname=mydb user=myname password=mypass");
conn = PQconnectdb(conninfo);
if (PQstatus(conn) != CONNECTION_OK)
{
fprintf(stderr, "Connection to database failed: %s",
PQerrorMessage(conn));
exit_nicely(conn);
}
/* Start a transaction block */
res = PQexec(conn, "BEGIN");
if (PQresultStatus(res) != PGRES_COMMAND_OK)
{
fprintf(stderr, "BEGIN command failed: %s", PQerrorMessage(conn));
PQclear(res);
exit_nicely(conn);
}
TCHAR szVal1[200];
TCHAR szVal2[200];
TCHAR szBuffer[200];
TCHAR *paramValues[2];
int paramLengths[2];
int paramFormats[2] = {0,0};
ExecStatusType eStatus;
LARGE_INTEGER li;
QueryPerformanceFrequency(&li);
double dAppFreq = double(li.QuadPart)/1000.0;
QueryPerformanceCounter(&li);
LONGLONG siStartCounter = li.QuadPart;
TCHAR szStmt[512] = {0};
_tcscpy_s(szStmt, 512, _T("Insert50k"));
Oid oidTypes[2] = {0,0};
PGresult *pRes = PQprepare(conn,
szStmt,
_T("insert into details values($1,$2);"),
2,
oidTypes);
QueryPerformanceCounter(&li);
LONGLONG siEndCounter = li.QuadPart;
LONGLONG siLoop = 0;
double dDiff = (siEndCounter - siStartCounter)/dAppFreq;
printf("Prepared %.2lf\n", dDiff);
for(int i=0; i<50000; i++)
{
_stprintf_s(szVal1, 200, _T("%d"), i);
_stprintf_s(szVal2, 200, _T("Detail%d"), i);
paramValues[0] = szVal1;
paramValues[1] = szVal2;
paramLengths[0] = _tcslen(szVal1);
paramLengths[1] = _tcslen(szVal2);
siStartCounter = siEndCounter;
pRes = PQexecPrepared(conn,
szStmt,
2,
paramValues,
paramLengths,
paramFormats,
0);
QueryPerformanceCounter(&li);
siEndCounter = li.QuadPart;
siLoop += (siEndCounter - siStartCounter);
eStatus = PQresultStatus(res);
if (!res || (eStatus != PGRES_COMMAND_OK) )
{
PQclear(res);
exit_nicely(conn);
}
}
dDiff = siLoop/dAppFreq;
printf("Inserted %.2lf\n", dDiff);
siStartCounter = siEndCounter;
_tcscpy_s(szBuffer,200, _T("select count(*) from programdetails;"));
res = PQexec(conn, szBuffer);
eStatus = PQresultStatus(res);
if (!res || (eStatus != PGRES_TUPLES_OK) )
{
PQclear(res);
exit_nicely(conn);
}
/* first, print out the attribute names */
nFields = PQnfields(res);
for (i = 0; i < nFields; i++)
printf("%-15s", PQfname(res, i));
printf("\n\n");
/* next, print out the rows */
for (i = 0; i < PQntuples(res); i++)
{
for (j = 0; j < nFields; j++)
printf("%-15s", PQgetvalue(res, i, j));
printf("\n");
}
QueryPerformanceCounter(&li);
siEndCounter = li.QuadPart;
dDiff = (siEndCounter - siStartCounter)/dAppFreq;
printf("Printed %.2lf\n", dDiff);
/* end the transaction */
res = PQexec(conn, "COMMIT");
PQclear(res);
/* close the connection to the database and cleanup */
PQfinish(conn);
return 0;
}
示例输出(以msecs为单位):
Prepared 0.55
Inserted 5527.52
count
50000
Printed 7.58
首先准备此处的查询,然后执行。这种简单的插入大约需要5.5秒。有没有更好的方法来做同样的事情或我在这里做错了什么?
答案 0 :(得分:5)
在TCP连接上,每个INSERT都会导致数据库的TCP往返。在5.5秒内完成50000次插入意味着一次TCP往返需要大约0.1ms。你必须将它与你的网络设备的TCP基准测试进行比较,但是你可能不希望用这种方法更快。
您应该考虑COPY FROM STDIN
而不是单独的INSERT。在内部,这将缓冲内容,并且由于往返服务器的次数少得多,您可能会看到相当大的速度增加。
有关此形式的COPY的libpq API,请参阅http://www.postgresql.org/docs/current/static/libpq-copy.html。
答案 1 :(得分:3)
我有一个类似的问题,并将我的一系列插入转换为一个多行插入。尽管添加了大量的字符串修改和strcat调用,但这显着改善了性能:
1000 rows:
Individual Inserts: 22.609s
Multirow Insert: 1.217s
代码位于https://gist.github.com/Meekohi/11291680(也显示将二进制数据插入一列的示例)
答案 2 :(得分:0)
在不同的线程中定义多个连接,并在这些线程中分配数据,并从这些线程发送每个项目的插入命令。我做到了这一点并且提高了5-10倍的速度。如果您需要最新的C ++ 11代码示例,请告诉我。