linux-kernel中的spinlock并发内核崩溃

时间:2015-10-02 16:37:04

标签: c linux concurrency linux-kernel locking

我想清除一个由内核定义的类型列表。我有两个主要结构,num_wrapper和num。当我执行del_all_node()函数时,num_wapper有一个num列表和内核崩溃。

我尝试标记list_del,内核不会崩溃。我不明白为什么会出现崩溃问题,因为我使用spin_lock来保护这个num_list。

任何提示都会受到欢迎。

以下是简化代码。

#include <linux/init.h>
#include <linux/module.h>
#include <linux/list.h>
#include <linux/slab.h>

struct num_wrapper {
    struct list_head num_list;
    spinlock_t list_lock;
    u8 check_num;
};

struct num {
    struct list_head node;
    int number;
    struct num_wrapper* num_w_ptr;
};

s32 del_all_node(struct num_wrapper *number_wrap)
{
    struct num *tmp;    
    struct num *num_head; 
    spin_lock(&number_wrap->list_lock); 
    list_for_each_entry_safe(num_head, tmp, &number_wrap->num_list, node) {
        printk("num_head is %d\n", num_head->number); 
        list_del(&num_head->node);//this line seems to have problem 
    }
    spin_unlock(&number_wrap->list_lock); 
    return 0;
}

static int __init hello_init(void)
{
    /*Setup Scenario*/     
    struct num_wrapper *number_wrap = kzalloc(sizeof(struct num_wrapper)
            , GFP_KERNEL);  
    struct num *number = kzalloc(sizeof(struct num), GFP_KERNEL);  
    number->number = 10; 
    number_wrap->check_num = 20;
    INIT_LIST_HEAD(&number->node);   
    INIT_LIST_HEAD(&number_wrap->num_list); 
    list_add_tail(&number->node, &number_wrap->num_list); 

    del_all_node(number_wrap);
    return 0;
}

static void hello_exit(void)
{
    printk(KERN_ALERT "Good, haha\n");
}

module_init(hello_init);
module_exit(hello_exit);

更新

做了一些调试之后,我似乎找到了根本原因...... 我的方案如下:

我有一个私有数据结构,它包含在net_device结构中。 以下是简化的方案:

struct xx_if *xx_if; //this is private data in net_device
struct xx_if *tmp;
list_for_each_entry_safe(xx_if, tmp, xx_if_wrap->if_list, list) {
    free_netdev(xx_if->ndev);
    list_del(&xx_if->list);
} 

由于free_netdev也将释放私有数据xx_if,代码被破坏...... 我的修复是改变这两个语句的顺序,它修复了崩溃问题。

还奇怪的是我检查xx_if是否为NULL,但如果我不交换这两个语句,仍会导致崩溃。

1 个答案:

答案 0 :(得分:0)

我不清楚以下代码:

INIT_LIST_HEAD(&number->node);   
INIT_LIST_HEAD(&number_wrap->num_list); 
list_add_tail(&number->node, &number_wrap->num_list); 

您初始化两个不同的结构,然后将一种类型的列表添加到另一种类型的列表中。

这是你能做的吗?

我想,你需要这样的东西:

  struct num{
        u8 check_num;
        struct list_head list;
    };

    struct num_wrapper{
        struct num* num_ptr;
        spinlock_t list_lock;
    };

    int init_num_wrapper(struct num_wrapper** prt){
        if(!ptr && *ptr){
            return -EINVAL;
        }

        *ptr = kzalloc(sizeof(struct num_wrapper), GFP_KERNEL);
        if(!*ptr){
            return -ENOMEM;
        }
        INIT_LIST_HEAD(& (*ptr)->num_ptr->list);
        ... init spinlock
        return 0;
    }

    int add_num(num_wrapper* prt_wrap, u8 check_num){
        ... checking pointers
        struct num num* = NULL;
        num = kmalloc(sizeof(struct num), GFP_KERNEL);
        if(! num){
            return -ENOMEM;
        }

        INIT_LIST_HEAD(&num->list);
        num->check_num = check_num;
        spin_lock(&prt_wrap->list_lock);
        list_add_tail(&num->list, &prt_wrap->num_ptr.list);
        spin_unlock(&prt_wrap->list_lock);
        return 0;
    }

    int remove_all_nodes(num_wrapper* prt_wrap){
        ... checking pointer
        struct num *tmp = NULL;    
        struct num *num_head = NULL; 
        spin_lock(&number_wrap->list_lock); 
        list_for_each_entry_safe(num_head, tmp, &prt_wrap->list, list)
        {
            printk("num_head is %d\n", num_head->number); 
            list_del(&num_head->node);//this line seems to have problem 
        }
        spin_unlock(&num_wrapper->list_lock); 
        return 0;
    }

<强>更新

然后,您可以使用上述函数来操作num_wrapper。 例如:

 //...
    struct num_wrapper* nums = NULL;
    init_num_wrapper(&nums); // after this call, you will have inited nums var, which can be used with others functions for manipulating with num_wrapper list.
     u8 num = 2;
     add_num(nums, num); // after this call new node with num will be added to num_wrapper 
    //...