Question

我有一个包含记录元素的xml文件。我正在将记录元素内的数据转换为PCAP格式。代码如下所示。在do循环中，我只花了6毫秒，但是当我花时间准确地在循环边界时，它显示我花了43毫秒......这个差异来自哪里？此外，我是新的循环内存。这是可以接受的做法还是应该将内存归零并重复使用？重用会带来任何性能提升吗？循环内的时间如下所示

2012-05-14 07:26:48 ThreadID（19404）TRACE：开始时间：1030466589，结束时间：1030466589

2012-05-14 07:26:48 ThreadID（19404）TRACE：开始时间：1030466590，结束时间：1030466590

2012-05-14 07:26:48 ThreadID（19404）TRACE：开始时间：1030466591，结束时间：1030466591

2012-05-14 07:26:48 ThreadID（19404）TRACE：开始时间：1030466592，结束时间：1030466592

2012-05-14 07:26:48 ThreadID（19404）TRACE：开始时间：1030466593，结束时间：1030466593

2012-05-14 07:26:48 ThreadID（19404）TRACE：开始时间：1030466594，结束时间：1030466594

2012-05-14 07:26:48 ThreadID（19404）TRACE：开始时间：1030466595，结束时间：1030466595

但是在do循环的边界上的时间是 2012-05-14 07:26:48 ThreadID（19404）TRACE：开始时间：1030466584，结束时间：1030466627

        static struct tms st_cpu;
        static struct tms et_cpu;
        clock_t end_time;
        clock_t start_time;
        char szData[100] = {0};
        clock_t st_total_time;
        clock_t et_total_time;
        static struct tms st_total_cpu;
        static struct tms et_total_cpu;
        st_total_time = times(&st_total_cpu);
        do {
        char *pBuffer = new char[m_nBufferLen];
        memset(pBuffer,0,m_nBufferLen);
            if(fgets(pBuffer,m_nBufferLen,fpcap) != NULL)
            {
                    char *pRecord = NULL;
                    if((pRecord = strstr(pBuffer,"<rec ")) != NULL)
                    {
                            start_time = times(&st_cpu);
                            CXMLParser objXMLParser(pBuffer);
                            objXMLParser.ProcessRecord();
                            objPCAPGenerator.GeneratePCAPRecord(&objXMLParser);
                            end_time = times(&et_cpu);

                            sprintf(szData,"start Time:%ld,End Time:%ld",start_time,end_time);
                            CLog::PrintLog(DBG_TRACE,"%s",szData);


                            sprintf(szData,"Real Time: %ld,UserTime:%ld,SystemTime:%ld",
                                            end_time-start_time,
                                            (et_cpu.tms_utime + et_cpu.tms_cutime) - (st_cpu.tms_utime + st_cpu.tms_cutime),
                                            (et_cpu.tms_stime + et_cpu.tms_cstime) -(st_cpu.tms_stime + st_cpu.tms_cstime)
                                            );
                            CLog::PrintLog(DBG_TRACE,"%s",szData);
                    }
            }
            else
            {
                    bEnd = true;
            }
    }while(bEnd != true);

    et_total_time = times(&et_total_cpu);

    sprintf(szData,"start Time:%ld,End Time:%ld",st_total_time,et_total_time);
    CLog::PrintLog(DBG_TRACE,"%s",szData);


    sprintf(szData,"Total Real Time: %ld,Total UserTime:%ld,Total SystemTime:%ld",
                    et_total_time-st_total_time,
                    (et_total_cpu.tms_utime + et_total_cpu.tms_cutime) - (st_total_cpu.tms_utime + st_total_cpu.tms_cutime),
                    (et_total_cpu.tms_stime + et_total_cpu.tms_cstime) -(st_total_cpu.tms_stime + st_total_cpu.tms_cstime)
                    );
    CLog::PrintLog(DBG_TRACE,"%s",szData);

Answer 1

一般来说，分配内存是一项成本相对较高的操作，因此如果这是性能关键代码，你肯定应该重新使用你分配的内存块。

另外，请记住删除您正在分配的内存。我不认为它现在正在完成。

Answer 2

您当然可以并且应该对您的代码进行分析，但仅仅从它的一瞥看，我发现了两个基本问题：

您正在为每次迭代重新分配缓冲区。是必要的还是你可以使用相同的缓冲区？顺便说一下，在阅读之前你不需要将它设置为0，只需在字符串读取后设置一个尾随零。
是否有必要在每次迭代中读取文件？如果文件很大并且不能适合内存，那当然是必要的。如果文件具有已知的相对较小的大小，只需将其读取到一个大缓冲区，然后解析它，它会快得多。

花在哪里？

2 个答案: