优雅地处理损坏的状态异常

时间:2016-10-10 10:25:51

标签: c# .net access-violation fail-fast corrupted-state-exception

this question相关,我想强制CLR让我的.NET 4.5.2应用程序捕获损坏的状态异常,其唯一目的是记录它们然后终止应用程序。如果我在应用程序周围的几个地方catch (Exception ex),那么这样做的正确方法是什么?

因此,在我指定<legacyCorruptedStateExceptionsPolicy>属性后,如果我理解正确,那么所有catch (Exception ex)处理程序都会捕获AccessViolationException等异常并愉快地继续。

是的,我知道catch (Exception ex)是一个坏主意™,但如果CLR至少将正确的堆栈跟踪放入事件日志中,我将非常乐意向客户解释他的服务器应用程序失败凌晨1点快速离线,晚上离线是一件好事。但不幸的是,CLR将unrelated exception记录到事件日志中,然后关闭该过程,以便我无法找出实际发生的情况。

问题是,如何实现这一目标,进程广泛:

if the exception thrown is a Corrupted State Exception:
    - write the message to the log file
    - end the process 

(适用更新)

换句话说,这可能适用于简单应用中的大多数例外:

[HandleProcessCorruptedStateExceptions] 
[SecurityCritical]
static void Main() // main entry point
{
    try 
    {

    }
    catch (Exception ex)
    {
        // this will catch CSEs
    }
}

但是,它不适用于:

  • 未处理的应用程序域异常(即在非前台线程上抛出)
  • Windows服务应用(没有实际的Main入口点)

所以似乎<legacyCorruptedStateExceptionsPolicy>是使这项工作成功的唯一方法,在这种情况下,我不知道在记录CSE后如何失败?

3 个答案:

答案 0 :(得分:21)

不使用<legacyCorruptedStateExceptionsPolicy>,最好使用[HandleProcessCorruptedStateExceptions](和[SecurityCritical]),如下所示:

https://msdn.microsoft.com/en-us/magazine/dd419661.aspx

在此之后,您的Main方法应该如下所示:

[HandleProcessCorruptedStateExceptions, SecurityCritical]
static void Main(string[] args)
{
    try
    {
        ...
    }
    catch (Exception ex)
    {
        // Log the CSE.
    }
}

但要注意,这并没有抓住更严重的例外情况,例如StackOverflowExceptionExecutionEngineException

所有finally块的try也不会被执行:

https://csharp.2000things.com/2013/08/30/920-a-finally-block-is-not-executed-when-a-corrupted-state-exception-occurs/

对于其他未处理的appdomain例外,您可以使用:

  • AppDomain.CurrentDomain.UnhandledException
  • Application.Current.DispatcherUnhandledException
  • TaskScheduler.UnobservedTaskException

(请在特定处理程序适合您的情况时搜索详细信息。例如TaskScheduler.UnobservedTaskException有点棘手。)

如果您无法访问Main方法,则还可以将AppDomain异常处理程序标记为捕获CSE:

AppDomain.CurrentDomain.UnhandledException += CurrentDomain_UnhandledException;

...

[HandleProcessCorruptedStateExceptions, SecurityCritical]
private static void CurrentDomain_UnhandledException(object sender, UnhandledExceptionEventArgs e)
{
    // AccessViolationExceptions will get caught here but you cannot stop
    // the termination of the process if e.IsTerminating is true.
}

最后一道防线可能是一个非托管的UnhandledExceptionFilter,如下所示:

[DllImport("kernel32"), SuppressUnmanagedCodeSecurity]
private static extern int SetUnhandledExceptionFilter(Callback cb);
// This has to be an own non generic delegate because generic delegates cannot be marshalled to unmanaged code.
private delegate uint Callback(IntPtr ptrToExceptionInfo);

然后在流程开始的某个地方:

SetUnhandledExceptionFilter(ptrToExceptionInfo =>
{
    var errorCode = "0x" + Marshal.GetExceptionCode().ToString("x2");
    ...
    return 1;
});

您可以在此处找到有关可能的返回代码的更多信息:

https://msdn.microsoft.com/en-us/library/ms680634(VS.85).aspx

A&#34;专业&#34; UnhandledExceptionFilter的一个问题是,如果连接了调试器,则不会调用它。 (至少在我的情况下没有WPF应用程序。)所以要注意这一点。

如果从上面设置了所有相应的ExceptionHandler,则应记录可记录的所有异常。对于更严重的异常(例如StackOverflowExceptionExecutionEngineException),您必须找到另一种方法,因为整个过程在发生后无法使用。一种可能的方法可能是另一个监视主进程并记录任何致命错误的进程。

其他提示:

答案 1 :(得分:10)

感谢@haindl指出你也可以使用[HandleProcessCorruptedStateExceptions] 1 属性来装饰处理程序方法,所以我做了一个小测试应用程序只是为了确认事情是否真的起作用了应该是。

1 注意:大多数答案都说明我还应该包含[SecurityCritical]属性,尽管在下面的测试中省略它并没有改变行为(单独[HandleProcessCorruptedStateExceptions]似乎工作得很好)。但是,我将保留以下两个属性,因为我假设所有这些人都知道他们在说什么。这是&#34;从StackOverflow&#34;复制的学校示例行动中的模式。

显然,这个想法是从<legacyCorruptedStateExceptionsPolicy> 删除 app.config设置,即只允许我们的最外层(入门级)处理程序捕获异常,记录它,然后失败。添加设置将允许您的应用继续,如果您在某个内部处理程序中捕获异常,这不是您想要的:这个想法只是为了获得准确的异常信息,然后惨死。

我使用following method抛出异常:

static void DoSomeAccessViolation()
{
    // if you have any questions about why this throws,
    // the answer is "42", of course

    var ptr = new IntPtr(42);
    Marshal.StructureToPtr(42, ptr, true);
}

<强> 1。从Main抓取例外:

[SecurityCritical]
[HandleProcessCorruptedStateExceptions]
static void Main(string[] args)
{
    try
    {
        DoSomeAccessViolation();
    }
    catch (Exception ex)
    {
        // this will catch all CSEs in the main thread
        Log(ex);
    }
}

<强> 2。捕获所有异常,包括后台线程/任务:

// no need to add attributes here
static void Main(string[] args)
{
    AppDomain.CurrentDomain.UnhandledException += UnhandledException;

    // throw on a background thread
    var t = new Task(DoSomeAccessViolation);
    t.Start();
    t.Wait();
}

// but it's important that this method is marked
[SecurityCritical]
[HandleProcessCorruptedStateExceptions]
private static void UnhandledException(object sender, UnhandledExceptionEventArgs e)
{
    // this will catch all unhandled exceptions, including CSEs
    Log(e.ExceptionObject as Exception);
}

我建议只使用后一种方法,并从所有其他地方中删除[HandleProcessCorruptedStateExceptions],以确保异常不会被错误地抓住。即如果您在某个地方有try/catch块并且抛出了AccessViolationException,那么您希望CLR跳过catch块并在结束应用之前传播到UnhandledException

答案 2 :(得分:2)

聚会结束了吗?没那么快

Microsoft “使用应用程序域隔离可能导致进程中断的任务。”

下面的程序将保护您的主应用程序/线程免受不可恢复的故障的影响,而没有使用HandleProcessCorruptedStateExceptions<legacyCorruptedStateExceptionsPolicy>的风险

public class BoundaryLessExecHelper : MarshalByRefObject
{
    public void DoSomething(MethodParams parms, Action action)
    {
        if (action != null)
            action();
        parms.BeenThere = true; // example of return value
    }
}

public struct MethodParams
{
    public bool BeenThere { get; set; }
}

class Program
{
    static void InvokeCse()
    {
        IntPtr ptr = new IntPtr(123);
        System.Runtime.InteropServices.Marshal.StructureToPtr(123, ptr, true);
    }
    // This is a plain code that will prove that CSE is thrown and not handled
    // this method is not a solution. Solution is below 
    private static void ExecInThisDomain()
    {
        try
        {
            var o = new BoundaryLessExecHelper();
            var p = new MethodParams() { BeenThere = false };
            Console.WriteLine("Before call");

            o.DoSomething(p, CausesAccessViolation);
            Console.WriteLine("After call. param been there? : " + p.BeenThere.ToString()); //never stops here
        }
        catch (Exception exc)
        {
            Console.WriteLine($"CSE: {exc.ToString()}");
        }
        Console.ReadLine();
    }

    // This is a solution for CSE not to break your app. 
    private static void ExecInAnotherDomain()
    {
        AppDomain dom = null;

        try
        {
            dom = AppDomain.CreateDomain("newDomain");
            var p = new MethodParams() { BeenThere = false };
            var o = (BoundaryLessExecHelper)dom.CreateInstanceAndUnwrap(typeof(BoundaryLessExecHelper).Assembly.FullName, typeof(BoundaryLessExecHelper).FullName);         
            Console.WriteLine("Before call");

            o.DoSomething(p, CausesAccessViolation);
            Console.WriteLine("After call. param been there? : " + p.BeenThere.ToString()); // never gets to here
        }
        catch (Exception exc)
        {
            Console.WriteLine($"CSE: {exc.ToString()}");
        }
        finally
        {
            AppDomain.Unload(dom);
        }

        Console.ReadLine();
    }


    static void Main(string[] args)
    {
        ExecInAnotherDomain(); // this will not break app
        ExecInThisDomain();  // this will
    }
}