fract16是VDSP的另一种浮点类型,它使用1.15的格式:
最高位为符号位,其余为数据位,没有指数和尾数的概念。
最大值:+0.999969482421875
最小值:-1
分辨率:2-15 = 0.000030517578125
在blackfin里面使用fract类型进行计算可以获得最好的性能,但是要求在使用之前对需要进行计算的数据进行归一化,而且必须保证在计算过程中不会产生溢出。
在对数据归一化的时候,通常是需要进行浮点计算的,因此要产生很多额外的开销,如果使用fract进行的计算量小于归一化的计算量,那就没有必要使用它。比如vdsp文档里面提及的那个例子:
/* return a*b calculated using fract implementation */
float mul_fp(float a, float b) {
int sign_a, sign_b, sign_res;
float scaled_a, scaled_b, fract_div_res, result;
int exp_a, exp_b, exp_res;
fract32 fract_a, fract_b, fract_res;
fract32 fract_exp_a, fract_exp_b, fract_exp_res;
fract16 fract_reshi, fract_reslo;
/* if either input is 0, return 0. */
if (a == 0.0 || b == 0.0)
return 0.0;
/* get sign and take absolute of inputs */
if (*(unsigned int *)&a & 0x80000000) {
sign_a=-1;
a = fabs(a);
} else
sign_a=1;
if (*(unsigned int *)&b & 0x80000000) {
sign_b=-1;
b = fabs(b);
} else
sign_b=1;
/* compute sign of result */
sign_res = sign_a * sign_b;
/* scale inputs */
scaled_a = frexpf(a, &exp_a);
scaled_b = frexpf(b, &exp_b);
/* convert scaled inputs to fract */
fract_a = float_to_fr32(scaled_a);
fract_b = float_to_fr32(scaled_b);
/* compose extended precision ETSI inputs */
fract_exp_a = L_Comp(extract_h(fract_a),
extract_l(fract_a));
fract_exp_b = L_Comp(extract_h(fract_b),
extract_l(fract_b));
/* do fractional multiplication in extended precision */
fract_res = Mpy_32(extract_h(fract_exp_a),
extract_l(fract_exp_a),
extract_h(fract_exp_b),
extract_l(fract_exp_b));
/* multiply exponents by adding */
exp_res = exp_a + exp_b;
/* convert mul result back to float */
fract_div_res = fr32_to_float(fract_res);
/* compose the floating-point result */
result = ldexpf(fract_div_res, exp_res);
/* negate result if necessary */
result = result * sign_res;
/* return result */
return result;
} /* mul_fp */
这个例子用于完成两个浮点数的乘法,它的乘法计算使用fract类型来完成,但是它需要将float类型转换为fract类型,计算完成后再把fract类型转换为float类型,整个过程需要743个cycle,远远大于直接使用float进行计算的92个cycle,想必没有人会愿意使用这样的方法吧。
使用这种类型的数据,由于它不使用指数位,自然也没有nan和inf这样的概念,使用时更加需要小心!
在vdsp的编译器里面,fract16不是作为一个内置类型出现的,而是使用了一个typedef来完成:
typedef short fract16;
由此造成的问题是在vdsp下无法直接查看fract16类型变量的值,非得通过寄存器窗口手动将数据类型设置为fract16,很是有点别扭!
注意fract16的表示,它的最高位表示 -20,也就是说,如果这一位为1,那么整个数将在-1的基础上加上后面的那一串值,这与float的最高位单纯的表示符号位不同。因此在float类型中,只要简单改变最高位的状态即可改变浮点数的符号,但是对于fract这却是非常错误的做法。
比如对于0.2,以float表示时的十六进制值为0x3e4c cccd,而-0.2的值以十六进制表示则为0xbe4c cccd,即它们只差一个最高位。
但0.2如果表示为fract16的值为0x1999,但是-0.2的值却是0xe666,它们的值相加刚好是0xffff。
使用negate_fr1x16可以改变一个fract16数值的符号位:
/* Returns the 16-bit result of the negation of the input parameter (-_x). If
* the input is 0x8000, saturation occurs and 0x7fff is returned. */
#pragma inline
#pragma always_inline
static fract16 negate_fr1x16(fract16 _x)
{ return (fract16)__builtin_negate_fr2x16((int)_x); }
展开__builtin_negate_fr2x16可以发现它其它就是这样的操作:
R1 = - R0 (V);
R1 = R1.L (X);
直接使用整数的取反。 |