Vdsp(bf561)中的浮点运算(13):fract16乘法运算
vdsp提供了三种不同的方式进行fract16的乘法运算。 1.1 mult_fr1x16函数 这个函数定义为:
从这里可以看出我们实际可以使用__builtin_mult_fr1x16这一函数调用。 写一个很简单的程序:
__builtin_mult_fr1x16展开后的汇编代码为:
因而完成这样一个运算将只需要一个cycle的时间。 这里的乘法运算使用了(T)尾缀,文档里这样解释: Signed fraction with truncation. Truncate Accumulator 9.31 format value at bit 16. (Perform no rounding.) Saturate the result to 1.15 precision in destination register half. Result is between minimum -1 and maximum 1-2-15 (or, expressed in hex, between minimum 0x8000 and maximum 0x7FFF). 这种计算方式直接将累加器里的数进行截断而不进行任何舍入的处理。 1.2 multr_fr1x16 这个函数定义为:
它实际使用__builtin_multr_fr1x16完成计算,展开后的汇编代码就是:
它不使用尾缀进行乘法计算,关于这种计算方式,文档这样描述: Signed fraction. Multiply 1.15 * 1.15 to produce 1.31 results after left-shift correction. Round 1.31 format value at bit 16. (RND_MOD bit in the ASTAT register controls the rounding.) Saturate the result to 1.15 precision in destination register half. Result is between minimum -1 and maximum 1-2-15 (or, expressed in hex, between minimum 0x8000 and maximum 0x7FFF). 也就是说它将对结果进行舍入操作,当然和截断相比,它们之间的差值最大也就是2-15。 1.3 multu_fr1x16 这个函数在文档里面没有记载,其定义为:
展开__builtin_multu_fr1x16的汇编代码为:
它使用了FU尾缀进行乘法运算,文档这样描述: Unsigned fraction. Multiply 0.16 * 0.16 to produce 0.32 results. No shift correction. Round 0.32 format value at bit 16. (RND_MOD bit in the ASTAT register controls the rounding.) Saturate the result to 0.16 precision in destination register half. Result is between minimum 0 and maximum 1-2-16 (or, expressed in hex, between minimum 0x0000 and maximum 0xFFFF). 它采用的是0.16的格式,而不是fract16的1.15格式,难怪在文档里面没有记载,嘿嘿。 |
凌众科技专业提供服务器租用、服务器托管、企业邮局、虚拟主机等服务,公司网站:http://www.lingzhong.cn 为了给广大客户了解更多的技术信息,本技术文章收集来源于网络,凌众科技尊重文章作者的版权,如果有涉及你的版权有必要删除你的文章,请和我们联系。以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢! |