我正试图从拉撒路(Lazarus)导入一个.o
文件到Delphi。
function Test: boolean;
const
TestData: array[0..15] of byte = (0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0);
asm
movdqu xmm0,[rip+testData] //xmm0 should be all zeros
pcmpeqq xmm1,xmm1 //xmm1 is all ones
ptest xmm0,xmm1 //ZF = (xmm0 and xmm1) = 0
setz al //return true if test works, false if not
end;
以上例程在Delphi中有效,但在Lazarus中失败。
我正在使用导入.o文件
{$L 'C:\pathname\TestUnit.o'}
function TESTUNIT_TEST: boolean; external name 'TESTUNIT_$$_TEST$$BOOLEAN';
Lazarus将对TestData
的引用替换为零偏移量。
AVXGENERATE_TEST:
//never mind the stack frame
0000000000A0F3B0 488D6424F8 lea rsp,[rsp-$08]
// rel 0? why?
0000000000A0F3B5 F30F6F0500000000 movdqu xmm0,dqword ptr [rel $00000000]
0000000000A0F3BD 660F3829C9 pcmpeqq xmm1,xmm1
0000000000A0F3C2 660F3817C1 ptest xmm0,xmm1
0000000000A0F3C7 0F94C0 setz al
0000000000A0F3CA 488D642408 lea rsp,[rsp+$08]
0000000000A0F3CF C3 ret
这是`objdump -dr“ C:\ pathname \ TestUnit.o”的输出
Disassembly of section .text.n_avxgenerate_$$_test$$boolean:
0000000000000000 <AVXGENERATE_$$_TEST$$BOOLEAN>:
0: 48 8d 64 24 f8 lea -0x8(%rsp),%rsp
5: f3 0f 6f 05 00 00 00 movdqu 0x0(%rip),%xmm0 # d <AVXGENERATE_$$_TEST$$BOOLEAN+0xd>
c: 00
9: R_X86_64_PC32 .data.n_tc_$avxgenerate_$$_testdata
d: 66 0f 38 29 c9 pcmpeqq %xmm1,%xmm1
12: 66 0f 38 17 c1 ptest %xmm1,%xmm0
17: 0f 94 c0 sete %al
1a: 48 8d 64 24 08 lea 0x8(%rsp),%rsp
1f: c3
如何使lazarus正确地将常量读入xmm
寄存器中?
有没有解决此问题的方法?
我计划在Delphi程序中包含一些用lazarus编写的AVX
程序集。
出于测试目的,我仅在此处使用SSE
代码。
版本信息
FPC 3.0.0
Lazarus版本1.6.2
答案 0 :(得分:1)
一种解决方法是将要导入的例程放入DLL。
这意味着您不再将所有内容都存储在独立的.exe
文件中。
但是至少所有代码都正确链接。
在拉撒路
library Test_lib;
{$mode delphi}{$H+}
uses
Classes,
TestUnit;
{$R *.res}
exports
Test;
begin
end.
在Delphi中
const
Testlib = 'C:\pathname\Lazarus\Test_lib.dll';
function LazarusTest: boolean; external Testlib name 'Test';
现在输出为:
0000000110020570 488D6424F8 lea rsp,[rsp-$08]
{ links to the correct location VVVVVV}
0000000110020575 F30F6F0553930000 movdqu xmm0,dqword ptr [rel $00009353]
000000011002057D 660F3829C9 pcmpeqq xmm1,xmm1
0000000110020582 660F3817C1 ptest xmm0,xmm1
0000000110020587 0F94C0 setz al
000000011002058A 488D642408 lea rsp,[rsp+$08]
000000011002058F C3 ret