为什么Popen()执行的子进程输出的一部分丢失了?

时间:2011-05-30 16:39:42

标签: python pygtk

这是一个奇怪的问题。我开始在this thread上工作,现在它已经变成了一些略有不同的东西。

我正在使用Popen()执行Perl程序'anubadok'。 Perl程序将其输出写入文件。这是执行此操作的Perl代码片段。第四。 print语句(在打开OUTFILE ...之后)写入非英语Unicode字符(孟加拉语)。我在它之前添加了3条打印行来测试是否正确写入所有Unicode字符。

...
my $infile = shift ;
my $input  = "STDIN" ;

if ( !$infile )
    {
    if (!$silent)
    {
    print STDERR "Reading form STDIN; (try: anubadok --help for usage or\n" ;
    print STDERR "see manpage for details.)\n" ;
    }
    }
elsif ( -e $infile )
    {
    open ( FILE, "<:utf8", $infile) 
        || die "Error! Couldn't open \"$infile\"! Exiting." ;
    $input = "FILE" ;
    }   
else    {
    print STDERR "Error! Couldn't find \"$infile\"! Exiting.\n" ;
    exit (1);
    }

Initialize::check_user_anubadok_dir();

open ( OUTFILE, ">:utf8", "anubadok_outfile" );
print OUTFILE "hello";
print OUTFILE "হেলেছি";
print OUTFILE "world";
print OUTFILE 
    XMLPP::xml_post_processor( 
        Translator::translate_in_bengali(
            PoSTagger::penn_treebank_tagger(
                XMLPP::xml_pre_processor(<$input>))));
close OUTFILE;

# print STDOUT
#   XMLPP::xml_post_processor( 
#       Translator::translate_in_bengali(
#           PoSTagger::penn_treebank_tagger(
#               XMLPP::xml_pre_processor(<$input>))));
...

下面是PyGTK代码,它正常工作,以显示我如何使用Popen()来执行子进程。它执行Perl程序,并将正确的输出写入文件。实际的程序更长,因为它有更多的小部件可以显示和处理更大的文件来填充视图等等。我能想到的没有其他逻辑差异。我在实际程序中使用相同的Popen()。但奇怪的是,由Perl程序编写的输出文件只包含字符串“helloহেলেছিworld”,即3个打印语句的输出。第4次打印的输出丢失。如果我在Perl程序中使用STDOUT而不是OUTFILE,并使用communic()来读取stdout对象,我发现它是空的。在下面的代码中,再次,这可以正常工作。

导致这种情况的原因是什么?我错过了什么?

如果有人想要实际运行此程序,请获取Anubadok的副本,并在anubadok-0.2.1 / bin / anubadok Perl脚本中包含那些额外的'print OUTFILE'块。

#!/usr/bin/env python
import pygtk,sys,gtk,os,subprocess,pdb

class C:

   def main(self, argv=None):
      gtk.main()

   def __init__(self):

      # Main window
      self.window = gtk.Window(gtk.WINDOW_TOPLEVEL)
      self.window.set_border_width(2)
      self.window.set_position(gtk.WIN_POS_CENTER)
      self.window.connect("destroy", self._destroy_window)

      # TextView
      self.v = gtk.TextView()
      self.v.set_name("v")
      self.vsw = gtk.ScrolledWindow()
      self.vsw.set_policy(gtk.POLICY_AUTOMATIC, gtk.POLICY_AUTOMATIC)
      self.vsw.add(self.v)

      # TextView
      self.v1 = gtk.TextView()
      self.v1.set_name("v1")
      self.v1sw = gtk.ScrolledWindow()
      self.v1sw.set_policy(gtk.POLICY_AUTOMATIC, gtk.POLICY_AUTOMATIC)
      self.v1sw.add(self.v1)

      # TreeView
      self.model = gtk.ListStore(str, str)
      self.tv = gtk.TreeView(self.model)
      self.tv.connect("row-activated", self._f, self.v)
      self.tv.connect("row-activated", self._f, self.v1)
      self.c = gtk.CellRendererText()
      self.c1 = gtk.CellRendererText()
      self.col = gtk.TreeViewColumn("C", self.c, text=0)
      self.col1 = gtk.TreeViewColumn("C1", self.c1, text=1)
      self.tv.append_column(self.col)
      self.tv.append_column(self.col1)
      self.tvsw = gtk.ScrolledWindow()
      self.tvsw.set_policy(gtk.POLICY_AUTOMATIC, gtk.POLICY_AUTOMATIC)
      self.tvsw.add(self.tv)

      self.fill_model(self.model)

      # Layout
      self.rbox = gtk.VBox(False, 0)
      self.rbox.pack_start(self.vsw, False, False, 0)
      self.rbox.pack_start(self.v1sw, False, False, 0)
      self.box = gtk.HBox(False, 0)
      self.box.pack_start(self.tvsw, False, False, 0)
      self.box.pack_start(self.rbox, False, False, 0)

      self.window.add(self.box)
      self.window.show_all()

   def fill_model(self, model):
      self.dbg("fill_model()")
      model.clear()
      fd = open("file", "r"); rows = fd.readlines(); fd.close()
      for l in rows:
          a = l.split()
          model.append([l[0], l[1]])
      return

   def _f(self, tview, path, column, textview):
       self.dbg("_f()")
       tsel = tview.get_selection()
       model, iter = tsel.get_selected()
       buf = textview.get_buffer()
       buf.set_text("")
       if(textview.get_name() == "v"):
           self.dbg("_f():v")
           buf.set_text("hello")
       elif(textview.get_name() == "v1"):
           self.dbg("_f():v1")
           x = "hello"
           t = self.g(x)
           buf.set_text(t)
       return

   def run(self, cmd):
      self.dbg("run()")
      """
      - Run command and return stdout as first argument of a
      tuple and stderr as the second argument of the tuple.
      - Returns None on error.
      """
      try:
         p = subprocess.Popen(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
         p.wait()
         if p.returncode:
            print "failed with code: %s" % str(p.returncode)
         return p.communicate()
      except OSError:
         print "OSError"

   def g(self):
      # pdb.set_trace()
      self.dbg("g()")
      p = self.run(["/home/rup/ir/utils/anubadok-0.2.1/bin/anubadok", "file1"])
      return p[0]

   def _destroy_window(self, widget, data = None):
      self.dbg("_destroy_window()")
      gtk.main_quit()
      return

   def dbg(self, msg):
       sys.stderr.write("dbg: %s\n" % msg)

if __name__ == "__main__":
   ui = C()
   ui.main()

1 个答案:

答案 0 :(得分:1)

Perl和Python都对LANG这样的环境变量很敏感。图形发射器和终端窗口通常会为孩子提供不同的值。

我尝试使用ASCII输入和输出进行测试,打印STDERR以查看是否有警告,记录每个进程的环境。