如何正确初始化Raspberry?

时间:2012-12-07 20:11:45

标签: c assembly arm hardware cross-compiling

我写了一个电机控制器并且我在使用Arch Arm Linux发行版的respberry pi上测试,计算控制信号需要大约0.4ms,所以我认为如果我使用实时操作系统我可以做得更好,所以我开始使用ChibiOS,但运行时间是~2.5ms,首先我使用Crossfire交叉编译器而不是切换到linaro,运行时的linaro有点差~2.7ms。可能是什么问题?有可能我没有以最佳方式初始化硬件吗?

     /*
     * Stack pointers initialization.
     */
    ldr     r0, =__ram_end__
    /* Undefined */
    msr     CPSR_c, #MODE_UND | I_BIT | F_BIT
    mov     sp, r0
    ldr     r1, =__und_stack_size__
    sub     r0, r0, r1
    /* Abort */
    msr     CPSR_c, #MODE_ABT | I_BIT | F_BIT
    mov     sp, r0
    ldr     r1, =__abt_stack_size__
    sub     r0, r0, r1
    /* FIQ */
    msr     CPSR_c, #MODE_FIQ | I_BIT | F_BIT
    mov     sp, r0
    ldr     r1, =__fiq_stack_size__
    sub     r0, r0, r1
    /* IRQ */
    msr     CPSR_c, #MODE_IRQ | I_BIT | F_BIT
    mov     sp, r0
    ldr     r1, =__irq_stack_size__
    sub     r0, r0, r1
    /* Supervisor */
    msr     CPSR_c, #MODE_SVC | I_BIT | F_BIT
    mov     sp, r0
    ldr     r1, =__svc_stack_size__
    sub     r0, r0, r1
    /* System */
    msr     CPSR_c, #MODE_SYS | I_BIT | F_BIT
    mov     sp, r0

    mov r0,#0x8000
    mov r1,#0x0000
    ldmia r0!,{r2,r3,r4,r5,r6,r7,r8,r9}
    stmia r1!,{r2,r3,r4,r5,r6,r7,r8,r9}
    ldmia r0!,{r2,r3,r4,r5,r6,r7,r8,r9}
    stmia r1!,{r2,r3,r4,r5,r6,r7,r8,r9}


    ;@ enable fpu
    mrc p15, 0, r0, c1, c0, 2
    orr r0,r0,#0x300000 ;@ single precision
    orr r0,r0,#0xC00000 ;@ double precision
    mcr p15, 0, r0, c1, c0, 2
    mov r0,#0x40000000
    fmxr fpexc,r0
    mov     r0, #0
    ldr     r1, =_bss_start
    ldr     r2, =_bss_end

内存设置:

__und_stack_size__  = 0x0004;
__abt_stack_size__  = 0x0004;
__fiq_stack_size__  = 0x0010;
__irq_stack_size__  = 0x0080;
__svc_stack_size__  = 0x0004;
__sys_stack_size__  = 0x0400;
__stacks_total_size__   = __und_stack_size__ + __abt_stack_size__ + __fiq_stack_size__ + __irq_stack_size__ + __svc_stack_size__ + __sys_stack_size__;

MEMORY
{
    ram : org = 0x8000, len = 0x06000000 - 0x20
}

__ram_start__       = ORIGIN(ram);
__ram_size__        = LENGTH(ram);
__ram_end__     = __ram_start__ + __ram_size__;

SECTIONS
{
    . = 0;

    .text : ALIGN(16) SUBALIGN(16)
    {
        _text = .;
        KEEP(*(vectors))
        *(.text)
        *(.text.*)
        *(.rodata)
        *(.rodata.*)
        *(.glue_7t)
        *(.glue_7)
        *(.gcc*)
        *(.ctors)
        *(.dtors)
    } > ram

    .ARM.extab : {*(.ARM.extab* .gnu.linkonce.armextab.*)} > ram

    __exidx_start = .;
    .ARM.exidx : {*(.ARM.exidx* .gnu.linkonce.armexidx.*)} > ram
    __exidx_end = .;

    .eh_frame_hdr : {*(.eh_frame_hdr)}

    .eh_frame : ONLY_IF_RO {*(.eh_frame)}

    . = ALIGN(4);
    _etext = .;
    _textdata = _etext;

    .data :
    {
        _data = .;
        *(.data)
        . = ALIGN(4);
        *(.data.*)
        . = ALIGN(4);
        *(.ramtext)
        . = ALIGN(4);
        _edata = .;
    } > ram 

    .bss :
    {
        _bss_start = .;
        *(.bss)
        . = ALIGN(4);
        *(.bss.*)
        . = ALIGN(4);
        *(COMMON)
        . = ALIGN(4);
        _bss_end = .;
    } > ram    
}

PROVIDE(end = .);
_end = .;

__heap_base__              = _end;
__heap_end__               = __ram_end__ - __stacks_total_size__;
__main_thread_stack_base__ = __ram_end__ - __stacks_total_size__;

我在哪里犯错误?

1 个答案:

答案 0 :(得分:3)

很久以前(是的,这意味着前一个千禧年的某些事情),我使用旧的PC Speaker pcsp device driver(更多一点补丁here)来控制步进电机通过一个连接到并行端口的数据线 请注意,不是与当前pcspkr驱动程序相同的驱动程序(仅写入实际扬声器,而不是写入并行端口); pcsp的并行输出功能部分从未移植到2.6音频架构。

技巧是驱动程序可以注册(高优先级,如果需要)中断例程,该例程执行实际的器件寄存器/ IO端口写操作以更改线路状态。因此,您只需ioctl()对驱动程序的采样率,然后只是异步地写入“斜坡”(数据信号向上/向下/从特定速度上升/下移或执行多个步骤)在内存中 - 然后驱动程序将为您假脱机,而无需额外的定时/调度敏感代码。

最后,您在并行端口数据引脚上获得了一个8位数字信号,其定时精度与定时器中断允许的一样高。
有足够的线来驱动步进器;如果你想让它转过一定数量的步骤,你必须:

  • 创建一个“加速”以加速从静止到最快
  • 创建一个“矩形波”以使其保持转动
  • 创建一个“斜坡下降”以使其再次减速

如果步数很小,则一次性写入整个内容,另一方面,写入斜坡上升,然后根据需要写入尽可能多的矩形波块,然后减速。虽然你可以一次编程成千上万的步骤,但你只需要编写三块内存,每块几块,而驱动程序的中断处理程序则完成其余的工作。

如果连接电阻阵列DAC转换器,这听起来很有趣; - )

该方法可以推广到RaspPI;从中断例程开始,只需编写一个GPIO控制寄存器(在ARM上,器件寄存器始终是存储器映射的,所以它只是一个存储器访问)。

将“斜坡”/“控制信号”生成与时序敏感状态变化(实际上为“控制信号应用”)分离并将后者委托给设备驱动程序的中断部分允许执行此类任务“正常”的Linux。

您的定时精度再次受到定时器中断的速率和抖动的限制。 RaspPI能够运行比i386更高的定时器中断率。我很确定1ms不是这种方法的挑战(它不是在1995年)。如上所述,该方法依赖于预先创建信号的能力。