C编程。使用execl和pthread

时间:2012-07-13 13:48:05

标签: c pthreads

我在使用execl()和pthread时遇到了问题。

我的想法非常简单:编写一个守护进程,在某些情况下启动一个外部进程(一个与守护进程本身相关的独立可执行文件)并等待该进程的返回值。此外,我希望有可能同时启动同一进程的多个实例。

我处理多个线程的代码部分:

...
for (c_thread=0,i=0;i<N;i++)
        {
        /* Start actions before start threads */
        for (j=c_thread;j<c_thread+config.max_threads;j++)
                         Before_Process(act[act_index[j]].measID);

       /* Now create threads */
        for (c=0,j=c_thread;j<c_thread+config.max_threads;j++)
                {
                        Print_Log(LOG_DEBUG,"Create tread n. %d, measurementID=%s",c,act[act_index[j]].measID);
                        if ((ret=pthread_create(&pth[c],NULL,Start_Process_Thread,(void *) &act[act_index[j]].measID)))
                                {
                                        Print_Log(LOG_ERR,"Error in creating thread (errorcode: %d)",ret);
                                        exit(EXIT_FAILURE);
                                }
                c++;
                }
        /* Joint threads */
        for (j=0;j<config.max_threads;j++)
                {
                        if ((ret=pthread_join(pth[j], (void**) &r_value[j])))
                        {
                                Print_Log(LOG_ERR,"Error in joint thread (errorcode: %d)",ret);
                                exit(EXIT_FAILURE);
                        }
                }
       /* Perform actions after the thread */
        for (j=0;j<config.max_threads;j++)
                {
                        status=*(int*) r_value[j];
                        Print_Log(LOG_DEBUG,"Joint tread n. %d. Return value=%d",j,status);
                       After_Process(act[act_index[c_thread+j]].measID,status);

                }

        c_thread += config.max_threads;
        }
...

函数Start_Process_Thread:

void *Start_Process_Thread(void *arg)
{

int *ret;
char *measID;
measID=(char*)arg;

if (!(ret=malloc(sizeof(int))))
        {
        Print_Log(LOG_ERR, "allocation memory failed, code=%d (%s)",
                              errno, strerror(errno) );
                      exit(EXIT_FAILURE);
        }

*ret=Start_Process(measID);
pthread_exit(ret);
}


int Start_Process(char *measID)
{
...
  pipe(pfd);
  pid=fork();
  if (!pid)
    {
      signal(SIGALRM,Timeout);
      alarm(config.timeout_process);
      flag=0;
      /*
         Start the Process.
      */
          ret=execl(config.pre_processor,buff_list[TokCount-1],config.db_name,measID,(char *) 0);
      if (ret==-1)
        {
          alarm(0);
          flag=1;
          Print_Log(LOG_ERR,"Cannot run script %s, code=%d (%s)",config.process, errno, strerror(errno));
        }
      alarm(0);
      close(1);
      close(pfd[0]);
      dup2(pfd[1],1);
      write(1,&flag,sizeof(int));
    }
  else
    {
      wait(&status);
      close(pfd[1]);
      read(pfd[0],&flag,sizeof(int));
      close(pfd[0]);
      if (!flag)
        {
          if (WIFEXITED(status))
            {
              if (!(return_value=WEXITSTATUS(status)))
                {
                  /*
                     Process gives no errors.
                  */
                  Print_Log(LOG_INFO, "Processing of measurementID=%s ended succesfully!",measID);
                }
              else
                {
                  /*
                     Process gives errors.
                  */
                  Print_Log(LOG_WARNING,"Processor failed for measurementID=%s, code=%d",measID, return_value);
                }
            }
          else
            {
              /*
                 Timeout for Process
              */
              Print_Log( LOG_WARNING,"Timeout occurred in  processing measurementID=%s",measID);
              return_value=255;
            }

        }
    }
}

从技术角度来看上面的代码工作得很好,但我在处理被调用外部进程的不同实例的返回值时遇到了问题。特别是,与某个实例关联的返回值随机归因于不同的返回值。 例如,假设分别使用参数meas1,meas2,meas3和meas4调用外部过程的4个不同实例,并假设meas1,meas2和meas3已成功处理,而对于meas4,过程失败。在这样的情况下,我的代码混合了返回值,使meas1,meas3和meas4成功,meas2失败或meas1,meas2,meas4和meas3失败成功。

有关为何会发生这种情况的任何想法?

非常欢迎任何帮助。

提前感谢您的关注。

1 个答案:

答案 0 :(得分:3)

当进程中的任何线程执行wait()时,它会获取有关该进程的任何死子的信息 - 不一定是关于正在等待的线程启动的最后一个子进程。

您需要考虑:

  1. 捕获死亡进程的PID(由wait()返回,但你忽略了)。
  2. 将单个线程指定为“尸体处置者”(除了wait()之外什么也不做,并记录和报告子进程系列中的死亡事件)。
  3. 一种数据结构,它允许启动进程的线程记录它们在子进程终止时对其状态感兴趣。据推测,一旦孩子开始,孩子应该在适当的条件下等待,这样就不会消耗CPU时间,没有任何用处。
  4. “处置尸体”线程会在收集尸体时处理相应其他线程的通知。
  5. 担心过程中的超时,以及杀死狂奔太久的孩子。
  6. 有时这是一种病态的事情......