Process.StandardOutput Read方法返回空(有时)

时间:2017-10-12 11:02:31

标签: c# process wkhtmltopdf redirectstandardoutput

我正在使用wkhtmltopdf从HTML字符串生成PDF文件。代码几乎就是下面的代码:

// ...
processStartInfo.UseShellExecute = false;
processStartInfo.CreateNoWindow = true;
processStartInfo.RedirectStandardInput = true;
processStartInfo.RedirectStandardOutput = true;
processStartInfo.RedirectStandardError = true;

// ...
process = Process.Start(processStartInfo);
using (StreamWriter stramWriter = process.StandardInput)
{
    stramWriter.AutoFlush = true;
    stramWriter.Write(htmlCode);
}

byte[] buffer = new byte[32768], file;
using (var memoryStream = new MemoryStream())
{
    while (true)
    {
        int read = process.StandardOutput.BaseStream.Read(buffer, 0, buffer.Length);
        if (read <= 0)
            break;
        memoryStream.Write(buffer, 0, read);
    }
    file = memoryStream.ToArray();
}

process.WaitForExit(60000);
process.Close();

return file;

这可以按预期工作,但对于一个特定的HTML,第一次调用StandardOutput.BaseStream.Read方法返回一个空字节数组,在这种情况下StandardOutput.EndOfStream也是如此。

我通常会怀疑wkhtmltopdf工具因任何原因无法处理HTML输入,但问题是这只发生在大约五分之二的尝试中,所以我现在怀疑这可能与进程缓冲有关和输出流读数。但是,我似乎无法做到 弄清楚确切的问题是什么。

什么可能导致这种行为?

更新

读取StandardError是一种显而易见的方法,但没有帮助,它总是一个空字符串。根据我的知识,process.ExitCode(-1073741819)也没有说“过程崩溃”。

1 个答案:

答案 0 :(得分:0)

wkhtmltopdf经过近一年的生产使用后,开始工作,到目前为止,上述问题报道的次数不超过五次。

当在文档末尾的某个位置添加DIV时,如果该页面恰好是DIV,并且高度值足以导致最后一行文本移动到下一页(例如20px),则问题通常会消失。充分。

我们知道该工具有时无法正确地将HTML内容拆分为多个页面,因为在这种情况下,它生成了(例如)七个页面,而页面编号仅报告了六个;因此最后一页的编号为“ 6之7”。我们认为,也许有时它会完全失败并且根本无法生成页面。该文档是从高度动态的HTML内容生成的。在不使用虚拟DIV的情况下进行更改导致内容变短/变长的更改相对容易,这就是我们迄今为止解决错误的方法。

目前,我们正在测试puppeteer