m68k/fpe/fpu_exp.c

1.5.12.1       tls /*	$NetBSD: fpu_exp.c,v 1.5.12.2 2017/12/03 11:36:23 jdolecek Exp $	*/
     1.1    briggs
     1.1    briggs /*
     1.1    briggs  * Copyright (c) 1995  Ken Nakata
     1.1    briggs  *	All rights reserved.
     1.1    briggs  *
     1.1    briggs  * Redistribution and use in source and binary forms, with or without
     1.1    briggs  * modification, are permitted provided that the following conditions
     1.1    briggs  * are met:
     1.1    briggs  * 1. Redistributions of source code must retain the above copyright
     1.1    briggs  *    notice, this list of conditions and the following disclaimer.
     1.1    briggs  * 2. Redistributions in binary form must reproduce the above copyright
     1.1    briggs  *    notice, this list of conditions and the following disclaimer in the
     1.1    briggs  *    documentation and/or other materials provided with the distribution.
     1.1    briggs  * 3. Neither the name of the author nor the names of its contributors
     1.1    briggs  *    may be used to endorse or promote products derived from this software
     1.1    briggs  *    without specific prior written permission.
     1.1    briggs  *
     1.1    briggs  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
     1.1    briggs  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
     1.1    briggs  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
     1.1    briggs  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
     1.1    briggs  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
     1.1    briggs  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
     1.1    briggs  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
     1.1    briggs  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
     1.1    briggs  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
     1.1    briggs  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
     1.1    briggs  * SUCH DAMAGE.
     1.1    briggs  *
     1.1    briggs  *	@(#)fpu_exp.c	10/24/95
     1.1    briggs  */
     1.2     lukem
     1.2     lukem #include <sys/cdefs.h>
1.5.12.1       tls __KERNEL_RCSID(0, "$NetBSD: fpu_exp.c,v 1.5.12.2 2017/12/03 11:36:23 jdolecek Exp $");
1.5.12.1       tls
1.5.12.1       tls #include <machine/ieee.h>
     1.1    briggs
     1.1    briggs #include "fpu_emulate.h"
     1.1    briggs
1.5.12.1       tls /* The number of items to terminate the Taylor expansion */
1.5.12.1       tls #define MAX_ITEMS	(2000)
1.5.12.1       tls
     1.1    briggs /*
     1.1    briggs  * fpu_exp.c: defines fpu_etox(), fpu_etoxm1(), fpu_tentox(), and fpu_twotox();
     1.1    briggs  */
     1.1    briggs
1.5.12.1       tls /*
1.5.12.1       tls  *                  x^2   x^3   x^4
1.5.12.1       tls  * exp(x) = 1 + x + --- + --- + --- + ...
1.5.12.1       tls  *                   2!    3!    4!
1.5.12.1       tls  */
1.5.12.1       tls static struct fpn *
1.5.12.1       tls fpu_etox_taylor(struct fpemu *fe)
1.5.12.1       tls {
1.5.12.1       tls 	struct fpn res;
1.5.12.1       tls 	struct fpn x;
1.5.12.1       tls 	struct fpn s0;
1.5.12.1       tls 	struct fpn *s1;
1.5.12.1       tls 	struct fpn *r;
1.5.12.1       tls 	uint32_t k;
1.5.12.1       tls
1.5.12.1       tls 	CPYFPN(&x, &fe->fe_f2);
1.5.12.1       tls 	CPYFPN(&s0, &fe->fe_f2);
1.5.12.1       tls
1.5.12.1       tls 	/* res := 1 + x */
1.5.12.1       tls 	fpu_const(&fe->fe_f1, FPU_CONST_1);
1.5.12.1       tls 	r = fpu_add(fe);
1.5.12.1       tls 	CPYFPN(&res, r);
1.5.12.1       tls
1.5.12.1       tls 	k = 2;
1.5.12.1       tls 	for (; k < MAX_ITEMS; k++) {
1.5.12.1       tls 		/* s1 = s0 * x / k */
1.5.12.1       tls 		CPYFPN(&fe->fe_f1, &s0);
1.5.12.1       tls 		CPYFPN(&fe->fe_f2, &x);
1.5.12.1       tls 		r = fpu_mul(fe);
1.5.12.1       tls
1.5.12.1       tls 		CPYFPN(&fe->fe_f1, r);
1.5.12.1       tls 		fpu_explode(fe, &fe->fe_f2, FTYPE_LNG, &k);
1.5.12.1       tls 		s1 = fpu_div(fe);
1.5.12.1       tls
1.5.12.1       tls 		/* break if s1 is enough small */
1.5.12.1       tls 		if (ISZERO(s1))
1.5.12.1       tls 			break;
1.5.12.1       tls 		if (res.fp_exp - s1->fp_exp >= EXT_FRACBITS)
1.5.12.1       tls 			break;
1.5.12.1       tls
1.5.12.1       tls 		/* s0 := s1 for next loop */
1.5.12.1       tls 		CPYFPN(&s0, s1);
1.5.12.1       tls
1.5.12.1       tls 		/* res += s1 */
1.5.12.1       tls 		CPYFPN(&fe->fe_f2, s1);
1.5.12.1       tls 		CPYFPN(&fe->fe_f1, &res);
1.5.12.1       tls 		r = fpu_add(fe);
1.5.12.1       tls 		CPYFPN(&res, r);
1.5.12.1       tls 	}
1.5.12.1       tls
1.5.12.1       tls 	CPYFPN(&fe->fe_f2, &res);
1.5.12.1       tls 	return &fe->fe_f2;
1.5.12.1       tls }
1.5.12.1       tls
1.5.12.1       tls /*
1.5.12.2  jdolecek  * exp(x) = 2^k * exp(r) with k = round(x / ln2) and r = x - k * ln2
1.5.12.2  jdolecek  *
1.5.12.2  jdolecek  * Algorithm partially taken from libm, where exp(r) is approximated by a
1.5.12.2  jdolecek  * rational function of r. We use the Taylor expansion instead.
1.5.12.1       tls  */
     1.1    briggs struct fpn *
     1.4       dsl fpu_etox(struct fpemu *fe)
     1.1    briggs {
1.5.12.2  jdolecek 	struct fpn x, *fp;
1.5.12.2  jdolecek 	int k;
1.5.12.1       tls
1.5.12.1       tls 	if (ISNAN(&fe->fe_f2))
1.5.12.1       tls 		return &fe->fe_f2;
1.5.12.1       tls 	if (ISINF(&fe->fe_f2)) {
1.5.12.1       tls 		if (fe->fe_f2.fp_sign)
1.5.12.1       tls 			fpu_const(&fe->fe_f2, FPU_CONST_0);
1.5.12.1       tls 		return &fe->fe_f2;
1.5.12.1       tls 	}
1.5.12.1       tls
1.5.12.2  jdolecek 	/*
1.5.12.2  jdolecek 	 * return inf if x >=  2^14
1.5.12.2  jdolecek 	 * return +0  if x <= -2^14
1.5.12.2  jdolecek 	 */
1.5.12.2  jdolecek 	if (fe->fe_f2.fp_exp >= 14) {
1.5.12.2  jdolecek 		if (fe->fe_f2.fp_sign) {
1.5.12.2  jdolecek 			fe->fe_f2.fp_class = FPC_ZERO;
1.5.12.2  jdolecek 			fe->fe_f2.fp_sign = 0;
1.5.12.2  jdolecek 		} else {
1.5.12.2  jdolecek 			fe->fe_f2.fp_class = FPC_INF;
1.5.12.2  jdolecek 		}
1.5.12.2  jdolecek 		return &fe->fe_f2;
1.5.12.2  jdolecek 	}
1.5.12.2  jdolecek
1.5.12.2  jdolecek 	CPYFPN(&x, &fe->fe_f2);
1.5.12.1       tls
1.5.12.2  jdolecek 	/* k = round(x / ln2) */
1.5.12.2  jdolecek 	CPYFPN(&fe->fe_f1, &fe->fe_f2);
1.5.12.2  jdolecek 	fpu_const(&fe->fe_f2, FPU_CONST_LN_2);
1.5.12.2  jdolecek 	fp = fpu_div(fe);
1.5.12.2  jdolecek 	CPYFPN(&fe->fe_f2, fp);
1.5.12.2  jdolecek 	fp = fpu_int(fe);
1.5.12.2  jdolecek 	if (ISZERO(fp)) {
1.5.12.2  jdolecek 		/* k = 0 */
1.5.12.2  jdolecek 		CPYFPN(&fe->fe_f2, &x);
1.5.12.2  jdolecek 		fp = fpu_etox_taylor(fe);
1.5.12.2  jdolecek 		return fp;
1.5.12.1       tls 	}
1.5.12.2  jdolecek 	/* extract k as integer format from fpn format */
1.5.12.2  jdolecek 	k = fp->fp_mant[0] >> (FP_LG - fp->fp_exp);
1.5.12.2  jdolecek 	if (fp->fp_sign)
1.5.12.2  jdolecek 		k *= -1;
1.5.12.2  jdolecek
1.5.12.2  jdolecek 	/* exp(r) = exp(x - k * ln2) */
1.5.12.2  jdolecek 	CPYFPN(&fe->fe_f1, fp);
1.5.12.2  jdolecek 	fpu_const(&fe->fe_f2, FPU_CONST_LN_2);
1.5.12.2  jdolecek 	fp = fpu_mul(fe);
1.5.12.2  jdolecek 	fp->fp_sign = !fp->fp_sign;
1.5.12.2  jdolecek 	CPYFPN(&fe->fe_f1, fp);
1.5.12.2  jdolecek 	CPYFPN(&fe->fe_f2, &x);
1.5.12.2  jdolecek 	fp = fpu_add(fe);
1.5.12.2  jdolecek 	CPYFPN(&fe->fe_f2, fp);
1.5.12.2  jdolecek 	fp = fpu_etox_taylor(fe);
1.5.12.2  jdolecek
1.5.12.2  jdolecek 	/* 2^k */
1.5.12.2  jdolecek 	fp->fp_exp += k;
1.5.12.2  jdolecek
1.5.12.1       tls 	return fp;
     1.1    briggs }
     1.1    briggs
1.5.12.1       tls /*
1.5.12.1       tls  * exp(x) - 1
1.5.12.1       tls  */
     1.1    briggs struct fpn *
     1.4       dsl fpu_etoxm1(struct fpemu *fe)
     1.1    briggs {
1.5.12.1       tls 	struct fpn *fp;
1.5.12.1       tls
1.5.12.1       tls 	fp = fpu_etox(fe);
1.5.12.1       tls
1.5.12.1       tls 	CPYFPN(&fe->fe_f1, fp);
1.5.12.1       tls 	/* build a 1.0 */
1.5.12.1       tls 	fp = fpu_const(&fe->fe_f2, FPU_CONST_1);
1.5.12.1       tls 	fe->fe_f2.fp_sign = !fe->fe_f2.fp_sign;
1.5.12.1       tls 	/* fp = f2 - 1.0 */
1.5.12.1       tls 	fp = fpu_add(fe);
1.5.12.1       tls
1.5.12.1       tls 	return fp;
     1.1    briggs }
     1.1    briggs
1.5.12.1       tls /*
1.5.12.1       tls  * 10^x = exp(x * ln10)
1.5.12.1       tls  */
     1.1    briggs struct fpn *
     1.4       dsl fpu_tentox(struct fpemu *fe)
     1.1    briggs {
1.5.12.1       tls 	struct fpn *fp;
1.5.12.1       tls
1.5.12.1       tls 	/* build a ln10 */
1.5.12.1       tls 	fp = fpu_const(&fe->fe_f1, FPU_CONST_LN_10);
1.5.12.1       tls 	/* fp = ln10 * f2 */
1.5.12.1       tls 	fp = fpu_mul(fe);
1.5.12.1       tls
1.5.12.1       tls 	/* copy the result to the src opr */
1.5.12.1       tls 	CPYFPN(&fe->fe_f2, fp);
1.5.12.1       tls
1.5.12.1       tls 	return fpu_etox(fe);
     1.1    briggs }
     1.1    briggs
1.5.12.1       tls /*
1.5.12.1       tls  * 2^x = exp(x * ln2)
1.5.12.1       tls  */
     1.1    briggs struct fpn *
     1.4       dsl fpu_twotox(struct fpemu *fe)
     1.1    briggs {
1.5.12.1       tls 	struct fpn *fp;
1.5.12.1       tls
1.5.12.1       tls 	/* build a ln2 */
1.5.12.1       tls 	fp = fpu_const(&fe->fe_f1, FPU_CONST_LN_2);
1.5.12.1       tls 	/* fp = ln2 * f2 */
1.5.12.1       tls 	fp = fpu_mul(fe);
1.5.12.1       tls
1.5.12.1       tls 	/* copy the result to the src opr */
1.5.12.1       tls 	CPYFPN(&fe->fe_f2, fp);
1.5.12.1       tls
1.5.12.1       tls 	return fpu_etox(fe);
     1.1    briggs }