sky 发表于 2020-10-21 20:37:13

RV32执行64位的加减法及SLT/SLTU的作用

RISC-V没有条件码,如何处理32位加法溢出?如何处理32位减法借位?以及如执行64位数的加减法?

64位加法
写一段64位加法的程序:uint64_t add64u(uint64_t a, uint64_t b)
{
      uint64_t c;
      c = a + b;
      return c;
}
以RV32架构编译,然后反汇编:$ riscv64-unknown-elf-gcc -O2 -c -o 64.o -march=rv32i -mabi=ilp32 -Wall 64.c
$ riscv64-unknown-elf-objdump -d -M no-aliases 64.o
反汇编结果如果:00000000 <add64u>:
   0:      00050793                  addi      a5,a0,0
   4:      00c50533                  add      a0,a0,a2
   8:      00f537b3                  sltu      a5,a0,a5
   c:      00d585b3                  add      a1,a1,a3
10:      00b785b3                  add      a1,a5,a1
14:      00008067                  jalr      zero,0(ra)
按照函数调用规约,a0,a1存储第一个64位入参a,a2,a3存储第二个64位入参b,返回值c存储在a0,a1,低字节存储在编号较低的寄存器。

[*]0: 00050793 addi a5,a0,0: 首先保存一下a的低32位,后面还要用。
[*]4: 00c50533 add a0,a0,a2: a的低32位加上b的低32位。
[*]8: 00f537b3 sltu a5,a0,a5: 比较c的低32位和a的低32位,如果c的低32位比a的低32位小,那么说明加法溢出了,必须产生进位,此时a5寄存器赋值1;否则没有加法进位,a5寄存器赋值0。也就是说a5寄存器存储的是低32位加法的进位标志。从这可以看出SLTU指令的作用了吧。
[*]c: 00d585b3 add a1,a1,a3:a的高32位加上b的高32位。
[*]10: 00b785b3 add a1,a5,a1:低32位的进位标志存储在a5寄存器了,再加上进位标志。

RISC-V 没有进位标志位,它通过和是否小于加数来判断是否产生进位,然后再把进位累加进最终的和当中。利用了和大于任意一个加数这条数学规律。
和 Cortex-M 对比
相比之下,Cortex-M生成的指令要少得多,因为Cortex-M有进位标志,还有带进位的加法指令。00000000 <add64u>:
   0:      1880            adds      r0, r0, r2
   2:      eb41 0103         adc.w      r1, r1, r3
   6:      4770            bx      lr
那么,这能证明 Cortex-M 更优秀吗?一般使用32位处理器的应用不会有大量的64位运算,如果有大量64位运算的话,那应该改用64位处理器。RISC-V的设计哲学是让硬件尽可能的简单,剔除进位标志和带进位加法指令同样也是基于同样的设计哲学,硬件设计得简单,那么在同样的工艺下,可以达到更高的主频,同样的主频下消耗更少的能量。所以,别看 Cortex-M 在64位运算上占了便宜,综合起来,谁输谁赢真不一定。

其它64位运算


还有64位的有符号数加法,以及64位的减法,源代码如下:int64_t add64s(int64_t a, int64_t b)
{
      return a + b;
}

uint64_t sub64u(uint64_t a, uint64_t b)
{
      return a - b;
}

int64_t sub64s(int64_t a, int64_t b)
{
      return a - b;
}
反汇编如下:00000018 <add64s>:
18:      00050793                  addi      a5,a0,0
1c:      00c50533                  add      a0,a0,a2
20:      00f537b3                  sltu      a5,a0,a5
24:      00d585b3                  add      a1,a1,a3
28:      00b785b3                  add      a1,a5,a1
2c:      00008067                  jalr      zero,0(ra)

00000030 <sub64u>:
30:      00050793                  addi      a5,a0,0
34:      40c50533                  sub      a0,a0,a2
38:      00a7b7b3                  sltu      a5,a5,a0
3c:      40d585b3                  sub      a1,a1,a3
40:      40f585b3                  sub      a1,a1,a5
44:      00008067                  jalr      zero,0(ra)

00000048 <sub64s>:
48:      00050793                  addi      a5,a0,0
4c:      40c50533                  sub      a0,a0,a2
50:      00a7b7b3                  sltu      a5,a5,a0
54:      40d585b3                  sub      a1,a1,a3
58:      40f585b3                  sub      a1,a1,a5
5c:      00008067                  jalr      zero,0(ra)


页: [1]
查看完整版本: RV32执行64位的加减法及SLT/SLTU的作用