花在哪里?

时间:2012-05-15 09:28:55

标签: c++

我有一个包含记录元素的xml文件。我正在将记录元素内的数据转换为PCAP格式。代码如下所示。在do循环中,我只花了6毫秒,但是当我花时间准确地在循环边界时,它显示我花了43毫秒......这个差异来自哪里? 此外,我是新的循环内存。这是可以接受的做法还是应该将内存归零并重复使用?重用会带来任何性能提升吗? 循环内的时间如下所示

2012-05-14 07:26:48 ThreadID(19404)TRACE:开始时间:1030466589,结束时间:1030466589

2012-05-14 07:26:48 ThreadID(19404)TRACE:开始时间:1030466590,结束时间:1030466590

2012-05-14 07:26:48 ThreadID(19404)TRACE:开始时间:1030466591,结束时间:1030466591

2012-05-14 07:26:48 ThreadID(19404)TRACE:开始时间:1030466591,结束时间:1030466591

2012-05-14 07:26:48 ThreadID(19404)TRACE:开始时间:1030466592,结束时间:1030466592

2012-05-14 07:26:48 ThreadID(19404)TRACE:开始时间:1030466593,结束时间:1030466593

2012-05-14 07:26:48 ThreadID(19404)TRACE:开始时间:1030466593,结束时间:1030466593

2012-05-14 07:26:48 ThreadID(19404)TRACE:开始时间:1030466594,结束时间:1030466594

2012-05-14 07:26:48 ThreadID(19404)TRACE:开始时间:1030466595,结束时间:1030466595

但是在do循环的边界上的时间是 2012-05-14 07:26:48 ThreadID(19404)TRACE:开始时间:1030466584,结束时间:1030466627

        static struct tms st_cpu;
        static struct tms et_cpu;
        clock_t end_time;
        clock_t start_time;
        char szData[100] = {0};
        clock_t st_total_time;
        clock_t et_total_time;
        static struct tms st_total_cpu;
        static struct tms et_total_cpu;
        st_total_time = times(&st_total_cpu);
        do {
        char *pBuffer = new char[m_nBufferLen];
        memset(pBuffer,0,m_nBufferLen);
            if(fgets(pBuffer,m_nBufferLen,fpcap) != NULL)
            {
                    char *pRecord = NULL;
                    if((pRecord = strstr(pBuffer,"<rec ")) != NULL)
                    {
                            start_time = times(&st_cpu);
                            CXMLParser objXMLParser(pBuffer);
                            objXMLParser.ProcessRecord();
                            objPCAPGenerator.GeneratePCAPRecord(&objXMLParser);
                            end_time = times(&et_cpu);

                            sprintf(szData,"start Time:%ld,End Time:%ld",start_time,end_time);
                            CLog::PrintLog(DBG_TRACE,"%s",szData);


                            sprintf(szData,"Real Time: %ld,UserTime:%ld,SystemTime:%ld",
                                            end_time-start_time,
                                            (et_cpu.tms_utime + et_cpu.tms_cutime) - (st_cpu.tms_utime + st_cpu.tms_cutime),
                                            (et_cpu.tms_stime + et_cpu.tms_cstime) -(st_cpu.tms_stime + st_cpu.tms_cstime)
                                            );
                            CLog::PrintLog(DBG_TRACE,"%s",szData);
                    }
            }
            else
            {
                    bEnd = true;
            }
    }while(bEnd != true);

    et_total_time = times(&et_total_cpu);

    sprintf(szData,"start Time:%ld,End Time:%ld",st_total_time,et_total_time);
    CLog::PrintLog(DBG_TRACE,"%s",szData);


    sprintf(szData,"Total Real Time: %ld,Total UserTime:%ld,Total SystemTime:%ld",
                    et_total_time-st_total_time,
                    (et_total_cpu.tms_utime + et_total_cpu.tms_cutime) - (st_total_cpu.tms_utime + st_total_cpu.tms_cutime),
                    (et_total_cpu.tms_stime + et_total_cpu.tms_cstime) -(st_total_cpu.tms_stime + st_total_cpu.tms_cstime)
                    );
    CLog::PrintLog(DBG_TRACE,"%s",szData);

2 个答案:

答案 0 :(得分:0)

一般来说,分配内存是一项成本相对较高的操作,因此如果这是性能关键代码,你肯定应该重新使用你分配的内存块。

另外,请记住删除您正在分配的内存。我不认为它现在正在完成。

答案 1 :(得分:0)

您当然可以并且应该对您的代码进行分析,但仅仅从它的一瞥看,我发现了两个基本问题:

  1. 您正在为每次迭代重新分配缓冲区。是必要的还是你可以使用相同的缓冲区?顺便说一下,在阅读之前你不需要将它设置为0,只需在字符串读取后设置一个尾随零。

  2. 是否有必要在每次迭代中读取文件?如果文件很大并且不能适合内存,那当然是必要的。如果文件具有已知的相对较小的大小,只需将其读取到一个大缓冲区,然后解析它,它会快得多。