首页 > 编程语言> 文章详细

【ARM汇编学习】VFP 和 NEON

2022-07-31 22:05:25 阅读：242 来源： 互联网

标签：r0 Sd NEON F32 cond Sm F64 ARM VFP

VFP/NEON 指令相关知识

-mfpu=vfpv3-d16 编译选项可以开启 VFP/NEON 指令

浮点常量的表示

非 VFP 指令环境：以 IEEE 754 浮点编码的形式出现

例如：
- 全局变量 tst：

扩展寄存器组

NEON 和 VFPv3 使用相同的扩展寄存器组
VFPv3 视图：
- 32 个 32 位单精度寄存器 s0~s31
NEON 视图：
- 32 个 64 位双字寄存器 D0~D31，其中前 16 个也可以在 VFPv3 视图下使用

VFP 数据类型

条件代码

和 ARM 的含义略有不同：
注意：若要使用这些标记来控制条件指令，必须先使用 VMSR 指令将其赋值到 APSR

VMRS 和 VMSR 指令

在一个 ARM 寄存器和一个 NEON 和 VFP 系统寄存器之间传送内容

指令

    VMRS{cond} Rd, extsysreg
    VMSR{cond} extsysreg, Rd

举例

/*
	float tst2 = ...;
    float tst = ...;
    if (tst <= tst2) {
        ...
    }
*/
        vldr    s0, [sp, #4]
        vldr    s6, [sp, #8]
        vcmpe.f32       s0, s6
        vmrs    APSR_nzcv, fpscr	; 需要将fpscr载入apsr
        bhi     .LBB1_2
        b       .LBB1_1

VFP/NEON 指令

VLDR 和 VSTR

语法

 VLDR{cond}{.size} Fd, [Rn{, #offset}] 
 VSTR{cond}{.size} Fd, [Rn{, #offset}] 
 VLDR{cond}{.size} Fd, label 
 VSTR{cond}{.size} Fd, label

功能
- VLDR：从内存加载一个扩展寄存器
- VSTR：将一个扩展寄存器的内容保存到内存中

举例

        ldr     r0, .LCPI1_0
        vldr    s0, [r0]
        ......
.LCPI1_0:
        .long   tst
tst:
        .long   1082130432              @ float 4

VPOP 和 VPUSH

语法

VPOP{cond} Registers
VPUSH{cond} Registers

VMOV

从浮点常数或同类寄存器复制到另一个寄存器

语法

 VMOV{cond}.F32 Sd, #imm 
 VMOV{cond}.F64 Dd, #imm 
 VMOV{cond}.F32 Sd, Sm 
 VMOV{cond}.F64 Dd, Dm

可用常数范围：

大常数（或一般形式）的解决策略：

使用 ARM 指令的常数进行合成

例：

        mov     r0, #1851392			; 0x1C4000，符合灵活的第二操作数的形式
        orr     r0, r0, #1258291200		; 0x4B000000，符合灵活的第二操作数的形式
        str     r0, [sp]

使用 VLDR 和全局变量代替

例：

        ldr     r0, .LCPI1_0
        vldr    s0, [r0]
        ......
.LCPI1_0:
        .long   tst
tst:
        .long   1082130432              @ float 4

VCVT 类型转换指令

在单精度和双精度之间转换

语法

VCVT{cond}.F64.F32 Dd, Sm
VCVT{cond}.F32.F64 Sd, Dm

举例

/*
    float tst2 = 4.0;
    float tst = tst2 * 3.0;
*/
        mov     r0, #8388608			; 0x800000
        orr     r0, r0, #1073741824		; 0x40000000
        str     r0, [sp, #8]
        vldr    s0, [sp, #8]
        vcvt.f64.f32    d1, s0
        vmov.f64        d2, #3.000000e+00
        vmul.f64        d1, d1, d2
        vcvt.f32.f64    s0, d1
        vstr    s0, [sp, #4]

在浮点数和整数之间

语法

    VCVT{R}{cond}.type.F64 Sd, Dm
    VCVT{R}{cond}.type.F32 Sd, Sm
    VCVT{cond}.F64.type Dd, Sm
    VCVT{cond}.F32.type Sd, Sm

浮点运算指令

VADD/VSUB/VDIV

    Vop{cond}.F32 {Sd}, Sn, Sm
    Vop{cond}.F64 {Dd}, Dn, Dm

VABS/VNEG/VSQRT

浮点绝对值、求反、平方根

语法：

    Vop{cond}.F32 Sd, Sm
    Vop{cond}.F64 Dd, Dm

VMUL/VMLA/VMLS

浮点数的乘法、乘加、乘减

    V{N}op{cond}.F32 Sd, Sn, Sm
    V{N}op{cond}.F64 Dd, Dn, Dm

VCMP

语法

    VCMP{cond}.F32 Sd, Sm
    VCMP{cond}.F32 Sd, #0
    VCMP{cond}.F64 Dd, Dm
    VCMP{cond}.F64 Dd, #0

参考资料

RealView® 编译工具 3.1版汇编程序指南

ARM ASSEMBLY LANGUAGE Fundamentals and Techniques (SECOND EDITION)

标签：r0,Sd,NEON,F32,cond,Sm,F64,ARM,VFP
来源： https://www.cnblogs.com/wheater/p/16538217.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9