config/libbid/bid128_div.c

1.12  mrg /* Copyright (C) 2007-2022 Free Software Foundation, Inc.
 1.1  mrg
 1.1  mrg This file is part of GCC.
 1.1  mrg
 1.1  mrg GCC is free software; you can redistribute it and/or modify it under
 1.1  mrg the terms of the GNU General Public License as published by the Free
 1.1  mrg Software Foundation; either version 3, or (at your option) any later
 1.1  mrg version.
 1.1  mrg
 1.1  mrg GCC is distributed in the hope that it will be useful, but WITHOUT ANY
 1.1  mrg WARRANTY; without even the implied warranty of MERCHANTABILITY or
 1.1  mrg FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
 1.1  mrg for more details.
 1.1  mrg
 1.1  mrg Under Section 7 of GPL version 3, you are granted additional
 1.1  mrg permissions described in the GCC Runtime Library Exception, version
 1.1  mrg 3.1, as published by the Free Software Foundation.
 1.1  mrg
 1.1  mrg You should have received a copy of the GNU General Public License and
 1.1  mrg a copy of the GCC Runtime Library Exception along with this program;
 1.1  mrg see the files COPYING3 and COPYING.RUNTIME respectively.  If not, see
 1.1  mrg <http://www.gnu.org/licenses/>.  */
 1.1  mrg
 1.1  mrg #define BID_128RES
 1.1  mrg #include "bid_div_macros.h"
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg #include <fenv.h>
 1.1  mrg
 1.1  mrg #define FE_ALL_FLAGS FE_INVALID|FE_DIVBYZERO|FE_OVERFLOW|FE_UNDERFLOW|FE_INEXACT
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg extern UINT32 convert_table[5][128][2];
 1.1  mrg extern SINT8 factors[][2];
 1.1  mrg extern UINT8 packed_10000_zeros[];
 1.1  mrg
 1.1  mrg BID128_FUNCTION_ARG2 (bid128_div, x, y)
 1.1  mrg
 1.1  mrg      UINT256 CA4, CA4r, P256;
 1.5  mrg      UINT128 CX, CY, T128, CQ, CR, CA, TP128, Qh, res;
 1.1  mrg      UINT64 sign_x, sign_y, T, carry64, D, Q_high, Q_low, QX, PD,
 1.1  mrg        valid_y;
 1.1  mrg      int_float fx, fy, f64;
 1.1  mrg      UINT32 QX32, tdigit[3], digit, digit_h, digit_low;
 1.1  mrg      int exponent_x, exponent_y, bin_index, bin_expon, diff_expon, ed2,
 1.1  mrg        digits_q, amount;
 1.1  mrg      int nzeros, i, j, k, d5;
 1.1  mrg      unsigned rmode;
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg      fexcept_t binaryflags = 0;
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg valid_y = unpack_BID128_value (&sign_y, &exponent_y, &CY, y);
 1.1  mrg
 1.1  mrg   // unpack arguments, check for NaN or Infinity
 1.1  mrg if (!unpack_BID128_value (&sign_x, &exponent_x, &CX, x)) {
 1.1  mrg     // test if x is NaN
 1.1  mrg if ((x.w[1] & 0x7c00000000000000ull) == 0x7c00000000000000ull) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   if ((x.w[1] & 0x7e00000000000000ull) == 0x7e00000000000000ull ||	// sNaN
 1.1  mrg       (y.w[1] & 0x7e00000000000000ull) == 0x7e00000000000000ull)
 1.1  mrg     __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   res.w[1] = (CX.w[1]) & QUIET_MASK64;
 1.1  mrg   res.w[0] = CX.w[0];
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg     // x is Infinity?
 1.1  mrg if ((x.w[1] & 0x7800000000000000ull) == 0x7800000000000000ull) {
 1.1  mrg   // check if y is Inf.
 1.1  mrg   if (((y.w[1] & 0x7c00000000000000ull) == 0x7800000000000000ull))
 1.1  mrg     // return NaN
 1.1  mrg   {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg     res.w[1] = 0x7c00000000000000ull;
 1.1  mrg     res.w[0] = 0;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // y is NaN?
 1.1  mrg   if (((y.w[1] & 0x7c00000000000000ull) != 0x7c00000000000000ull))
 1.1  mrg     // return NaN
 1.1  mrg   {
 1.1  mrg     // return +/-Inf
 1.1  mrg     res.w[1] = ((x.w[1] ^ y.w[1]) & 0x8000000000000000ull) |
 1.1  mrg       0x7800000000000000ull;
 1.1  mrg     res.w[0] = 0;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg }
 1.1  mrg     // x is 0
 1.1  mrg if ((y.w[1] & 0x7800000000000000ull) < 0x7800000000000000ull) {
 1.1  mrg   if ((!CY.w[0]) && !(CY.w[1] & 0x0001ffffffffffffull)) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg     // x=y=0, return NaN
 1.1  mrg     res.w[1] = 0x7c00000000000000ull;
 1.1  mrg     res.w[0] = 0;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // return 0
 1.1  mrg   res.w[1] = (x.w[1] ^ y.w[1]) & 0x8000000000000000ull;
 1.1  mrg   exponent_x = exponent_x - exponent_y + DECIMAL_EXPONENT_BIAS_128;
 1.1  mrg   if (exponent_x > DECIMAL_MAX_EXPON_128)
 1.1  mrg     exponent_x = DECIMAL_MAX_EXPON_128;
 1.1  mrg   else if (exponent_x < 0)
 1.1  mrg     exponent_x = 0;
 1.1  mrg   res.w[1] |= (((UINT64) exponent_x) << 49);
 1.1  mrg   res.w[0] = 0;
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg }
 1.1  mrg if (!valid_y) {
 1.1  mrg   // y is Inf. or NaN
 1.1  mrg
 1.1  mrg   // test if y is NaN
 1.1  mrg   if ((y.w[1] & 0x7c00000000000000ull) == 0x7c00000000000000ull) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     if ((y.w[1] & 0x7e00000000000000ull) == 0x7e00000000000000ull)	// sNaN
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg     res.w[1] = CY.w[1] & QUIET_MASK64;
 1.1  mrg     res.w[0] = CY.w[0];
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // y is Infinity?
 1.1  mrg   if ((y.w[1] & 0x7800000000000000ull) == 0x7800000000000000ull) {
 1.1  mrg     // return +/-0
 1.1  mrg     res.w[1] = sign_x ^ sign_y;
 1.1  mrg     res.w[0] = 0;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // y is 0, return +/-Inf
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   __set_status_flags (pfpsf, ZERO_DIVIDE_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   res.w[1] =
 1.1  mrg     ((x.w[1] ^ y.w[1]) & 0x8000000000000000ull) | 0x7800000000000000ull;
 1.1  mrg   res.w[0] = 0;
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg (void) fegetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg diff_expon = exponent_x - exponent_y + DECIMAL_EXPONENT_BIAS_128;
 1.1  mrg
 1.1  mrg if (__unsigned_compare_gt_128 (CY, CX)) {
 1.1  mrg   // CX < CY
 1.1  mrg
 1.1  mrg   // 2^64
 1.1  mrg   f64.i = 0x5f800000;
 1.1  mrg
 1.1  mrg   // fx ~ CX,   fy ~ CY
 1.1  mrg   fx.d = (float) CX.w[1] * f64.d + (float) CX.w[0];
 1.1  mrg   fy.d = (float) CY.w[1] * f64.d + (float) CY.w[0];
 1.1  mrg   // expon_cy - expon_cx
 1.1  mrg   bin_index = (fy.i - fx.i) >> 23;
 1.1  mrg
 1.1  mrg   if (CX.w[1]) {
 1.1  mrg     T = power10_index_binexp_128[bin_index].w[0];
 1.1  mrg     __mul_64x128_short (CA, T, CX);
 1.1  mrg   } else {
 1.1  mrg     T128 = power10_index_binexp_128[bin_index];
 1.1  mrg     __mul_64x128_short (CA, CX.w[0], T128);
 1.1  mrg   }
 1.1  mrg
 1.1  mrg   ed2 = 33;
 1.1  mrg   if (__unsigned_compare_gt_128 (CY, CA))
 1.1  mrg     ed2++;
 1.1  mrg
 1.1  mrg   T128 = power10_table_128[ed2];
 1.1  mrg   __mul_128x128_to_256 (CA4, CA, T128);
 1.1  mrg
 1.1  mrg   ed2 += estimate_decimal_digits[bin_index];
 1.1  mrg   CQ.w[0] = CQ.w[1] = 0;
 1.1  mrg   diff_expon = diff_expon - ed2;
 1.1  mrg
 1.1  mrg } else {
 1.1  mrg   // get CQ = CX/CY
 1.1  mrg   __div_128_by_128 (&CQ, &CR, CX, CY);
 1.1  mrg
 1.1  mrg   if (!CR.w[1] && !CR.w[0]) {
 1.1  mrg     get_BID128 (&res, sign_x ^ sign_y, diff_expon, CQ, &rnd_mode,
 1.1  mrg 		pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // get number of decimal digits in CQ
 1.1  mrg   // 2^64
 1.1  mrg   f64.i = 0x5f800000;
 1.1  mrg   fx.d = (float) CQ.w[1] * f64.d + (float) CQ.w[0];
 1.1  mrg   // binary expon. of CQ
 1.1  mrg   bin_expon = (fx.i - 0x3f800000) >> 23;
 1.1  mrg
 1.1  mrg   digits_q = estimate_decimal_digits[bin_expon];
 1.1  mrg   TP128.w[0] = power10_index_binexp_128[bin_expon].w[0];
 1.1  mrg   TP128.w[1] = power10_index_binexp_128[bin_expon].w[1];
 1.1  mrg   if (__unsigned_compare_ge_128 (CQ, TP128))
 1.1  mrg     digits_q++;
 1.1  mrg
 1.1  mrg   ed2 = 34 - digits_q;
 1.1  mrg   T128.w[0] = power10_table_128[ed2].w[0];
 1.1  mrg   T128.w[1] = power10_table_128[ed2].w[1];
 1.1  mrg   __mul_128x128_to_256 (CA4, CR, T128);
 1.1  mrg   diff_expon = diff_expon - ed2;
 1.1  mrg   __mul_128x128_low (CQ, CQ, T128);
 1.1  mrg
 1.1  mrg }
 1.1  mrg
 1.1  mrg __div_256_by_128 (&CQ, &CA4, CY);
 1.1  mrg
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg if (CA4.w[0] || CA4.w[1]) {
 1.1  mrg   // set status flags
 1.1  mrg   __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg }
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg else
 1.1  mrg #endif
 1.1  mrg #else
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg if (!CA4.w[0] && !CA4.w[1])
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   // check whether result is exact
 1.1  mrg {
 1.1  mrg   // check whether CX, CY are short
 1.1  mrg   if (!CX.w[1] && !CY.w[1] && (CX.w[0] <= 1024) && (CY.w[0] <= 1024)) {
 1.1  mrg     i = (int) CY.w[0] - 1;
 1.1  mrg     j = (int) CX.w[0] - 1;
 1.1  mrg     // difference in powers of 2 factors for Y and X
 1.1  mrg     nzeros = ed2 - factors[i][0] + factors[j][0];
 1.1  mrg     // difference in powers of 5 factors
 1.1  mrg     d5 = ed2 - factors[i][1] + factors[j][1];
 1.1  mrg     if (d5 < nzeros)
 1.1  mrg       nzeros = d5;
 1.1  mrg     // get P*(2^M[extra_digits])/10^extra_digits
 1.5  mrg     __mul_128x128_high (Qh, CQ, reciprocals10_128[nzeros]);
 1.1  mrg
 1.1  mrg     // now get P/10^extra_digits: shift Q_high right by M[extra_digits]-128
 1.1  mrg     amount = recip_scale[nzeros];
 1.1  mrg     __shr_128_long (CQ, Qh, amount);
 1.1  mrg
 1.1  mrg     diff_expon += nzeros;
 1.1  mrg   } else {
 1.1  mrg     // decompose Q as Qh*10^17 + Ql
 1.1  mrg     //T128 = reciprocals10_128[17];
 1.1  mrg     T128.w[0] = 0x44909befeb9fad49ull;
 1.1  mrg     T128.w[1] = 0x000b877aa3236a4bull;
 1.1  mrg     __mul_128x128_to_256 (P256, CQ, T128);
 1.1  mrg     //amount = recip_scale[17];
 1.1  mrg     Q_high = (P256.w[2] >> 44) | (P256.w[3] << (64 - 44));
 1.1  mrg     Q_low = CQ.w[0] - Q_high * 100000000000000000ull;
 1.1  mrg
 1.1  mrg     if (!Q_low) {
 1.1  mrg       diff_expon += 17;
 1.1  mrg
 1.1  mrg       tdigit[0] = Q_high & 0x3ffffff;
 1.1  mrg       tdigit[1] = 0;
 1.1  mrg       QX = Q_high >> 26;
 1.1  mrg       QX32 = QX;
 1.1  mrg       nzeros = 0;
 1.1  mrg
 1.1  mrg       for (j = 0; QX32; j++, QX32 >>= 7) {
 1.1  mrg 	k = (QX32 & 127);
 1.1  mrg 	tdigit[0] += convert_table[j][k][0];
 1.1  mrg 	tdigit[1] += convert_table[j][k][1];
 1.1  mrg 	if (tdigit[0] >= 100000000) {
 1.1  mrg 	  tdigit[0] -= 100000000;
 1.1  mrg 	  tdigit[1]++;
 1.1  mrg 	}
 1.1  mrg       }
 1.1  mrg
 1.1  mrg       if (tdigit[1] >= 100000000) {
 1.1  mrg 	tdigit[1] -= 100000000;
 1.1  mrg 	if (tdigit[1] >= 100000000)
 1.1  mrg 	  tdigit[1] -= 100000000;
 1.1  mrg       }
 1.1  mrg
 1.1  mrg       digit = tdigit[0];
 1.1  mrg       if (!digit && !tdigit[1])
 1.1  mrg 	nzeros += 16;
 1.1  mrg       else {
 1.1  mrg 	if (!digit) {
 1.1  mrg 	  nzeros += 8;
 1.1  mrg 	  digit = tdigit[1];
 1.1  mrg 	}
 1.1  mrg 	// decompose digit
 1.1  mrg 	PD = (UINT64) digit *0x068DB8BBull;
 1.1  mrg 	digit_h = (UINT32) (PD >> 40);
 1.1  mrg 	digit_low = digit - digit_h * 10000;
 1.1  mrg
 1.1  mrg 	if (!digit_low)
 1.1  mrg 	  nzeros += 4;
 1.1  mrg 	else
 1.1  mrg 	  digit_h = digit_low;
 1.1  mrg
 1.1  mrg 	if (!(digit_h & 1))
 1.1  mrg 	  nzeros +=
 1.1  mrg 	    3 & (UINT32) (packed_10000_zeros[digit_h >> 3] >>
 1.1  mrg 			  (digit_h & 7));
 1.1  mrg       }
 1.1  mrg
 1.1  mrg       if (nzeros) {
 1.1  mrg 	__mul_64x64_to_128 (CQ, Q_high, reciprocals10_64[nzeros]);
 1.1  mrg
 1.1  mrg 	// now get P/10^extra_digits: shift C64 right by M[extra_digits]-64
 1.1  mrg 	amount = short_recip_scale[nzeros];
 1.1  mrg 	CQ.w[0] = CQ.w[1] >> amount;
 1.1  mrg       } else
 1.1  mrg 	CQ.w[0] = Q_high;
 1.1  mrg       CQ.w[1] = 0;
 1.1  mrg
 1.1  mrg       diff_expon += nzeros;
 1.1  mrg     } else {
 1.1  mrg       tdigit[0] = Q_low & 0x3ffffff;
 1.1  mrg       tdigit[1] = 0;
 1.1  mrg       QX = Q_low >> 26;
 1.1  mrg       QX32 = QX;
 1.1  mrg       nzeros = 0;
 1.1  mrg
 1.1  mrg       for (j = 0; QX32; j++, QX32 >>= 7) {
 1.1  mrg 	k = (QX32 & 127);
 1.1  mrg 	tdigit[0] += convert_table[j][k][0];
 1.1  mrg 	tdigit[1] += convert_table[j][k][1];
 1.1  mrg 	if (tdigit[0] >= 100000000) {
 1.1  mrg 	  tdigit[0] -= 100000000;
 1.1  mrg 	  tdigit[1]++;
 1.1  mrg 	}
 1.1  mrg       }
 1.1  mrg
 1.1  mrg       if (tdigit[1] >= 100000000) {
 1.1  mrg 	tdigit[1] -= 100000000;
 1.1  mrg 	if (tdigit[1] >= 100000000)
 1.1  mrg 	  tdigit[1] -= 100000000;
 1.1  mrg       }
 1.1  mrg
 1.1  mrg       digit = tdigit[0];
 1.1  mrg       if (!digit && !tdigit[1])
 1.1  mrg 	nzeros += 16;
 1.1  mrg       else {
 1.1  mrg 	if (!digit) {
 1.1  mrg 	  nzeros += 8;
 1.1  mrg 	  digit = tdigit[1];
 1.1  mrg 	}
 1.1  mrg 	// decompose digit
 1.1  mrg 	PD = (UINT64) digit *0x068DB8BBull;
 1.1  mrg 	digit_h = (UINT32) (PD >> 40);
 1.1  mrg 	digit_low = digit - digit_h * 10000;
 1.1  mrg
 1.1  mrg 	if (!digit_low)
 1.1  mrg 	  nzeros += 4;
 1.1  mrg 	else
 1.1  mrg 	  digit_h = digit_low;
 1.1  mrg
 1.1  mrg 	if (!(digit_h & 1))
 1.1  mrg 	  nzeros +=
 1.1  mrg 	    3 & (UINT32) (packed_10000_zeros[digit_h >> 3] >>
 1.1  mrg 			  (digit_h & 7));
 1.1  mrg       }
 1.1  mrg
 1.1  mrg       if (nzeros) {
 1.1  mrg 	// get P*(2^M[extra_digits])/10^extra_digits
 1.5  mrg 	__mul_128x128_high (Qh, CQ, reciprocals10_128[nzeros]);
 1.1  mrg
 1.1  mrg 	//now get P/10^extra_digits: shift Q_high right by M[extra_digits]-128
 1.1  mrg 	amount = recip_scale[nzeros];
 1.1  mrg 	__shr_128 (CQ, Qh, amount);
 1.1  mrg       }
 1.1  mrg       diff_expon += nzeros;
 1.1  mrg
 1.1  mrg     }
 1.1  mrg   }
 1.1  mrg   get_BID128 (&res, sign_x ^ sign_y, diff_expon, CQ, &rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg   (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg if (diff_expon >= 0) {
 1.1  mrg #ifdef IEEE_ROUND_NEAREST
 1.1  mrg   // rounding
 1.1  mrg   // 2*CA4 - CY
 1.1  mrg   CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg   CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg   __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg   CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg
 1.1  mrg   D = (CA4r.w[1] | CA4r.w[0]) ? 1 : 0;
 1.1  mrg   carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) & ((CQ.w[0]) | D);
 1.1  mrg
 1.1  mrg   CQ.w[0] += carry64;
 1.1  mrg   if (CQ.w[0] < carry64)
 1.1  mrg     CQ.w[1]++;
 1.1  mrg #else
 1.1  mrg #ifdef IEEE_ROUND_NEAREST_TIES_AWAY
 1.1  mrg   // rounding
 1.1  mrg   // 2*CA4 - CY
 1.1  mrg   CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg   CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg   __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg   CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg
 1.1  mrg   D = (CA4r.w[1] | CA4r.w[0]) ? 0 : 1;
 1.1  mrg   carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) | D;
 1.1  mrg
 1.1  mrg   CQ.w[0] += carry64;
 1.1  mrg   if (CQ.w[0] < carry64)
 1.1  mrg     CQ.w[1]++;
 1.1  mrg #else
 1.1  mrg   rmode = rnd_mode;
 1.1  mrg   if (sign_x ^ sign_y && (unsigned) (rmode - 1) < 2)
 1.1  mrg     rmode = 3 - rmode;
 1.1  mrg   switch (rmode) {
 1.1  mrg   case ROUNDING_TO_NEAREST:	// round to nearest code
 1.1  mrg     // rounding
 1.1  mrg     // 2*CA4 - CY
 1.1  mrg     CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg     CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg     __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg     CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg     D = (CA4r.w[1] | CA4r.w[0]) ? 1 : 0;
 1.1  mrg     carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) & ((CQ.w[0]) | D);
 1.1  mrg     CQ.w[0] += carry64;
 1.1  mrg     if (CQ.w[0] < carry64)
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   case ROUNDING_TIES_AWAY:
 1.1  mrg     // rounding
 1.1  mrg     // 2*CA4 - CY
 1.1  mrg     CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg     CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg     __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg     CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg     D = (CA4r.w[1] | CA4r.w[0]) ? 0 : 1;
 1.1  mrg     carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) | D;
 1.1  mrg     CQ.w[0] += carry64;
 1.1  mrg     if (CQ.w[0] < carry64)
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   case ROUNDING_DOWN:
 1.1  mrg   case ROUNDING_TO_ZERO:
 1.1  mrg     break;
 1.1  mrg   default:	// rounding up
 1.1  mrg     CQ.w[0]++;
 1.1  mrg     if (!CQ.w[0])
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg } else {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   if (CA4.w[0] || CA4.w[1]) {
 1.1  mrg     // set status flags
 1.1  mrg     __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg   handle_UF_128_rem (&res, sign_x ^ sign_y, diff_expon, CQ,
 1.1  mrg 		     CA4.w[1] | CA4.w[0], &rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg   (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg   BID_RETURN (res);
 1.1  mrg
 1.1  mrg }
 1.1  mrg
 1.1  mrg get_BID128 (&res, sign_x ^ sign_y, diff_expon, CQ, &rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg BID_RETURN (res);
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg //#define LEAVE_TRAILING_ZEROS
 1.1  mrg
 1.1  mrg TYPE0_FUNCTION_ARGTYPE1_ARGTYPE2 (UINT128, bid128dd_div, UINT64, x,
 1.1  mrg 				  UINT64, y)
 1.1  mrg
 1.1  mrg      UINT256 CA4, CA4r, P256;
 1.5  mrg      UINT128 CX, CY, T128, CQ, CR, CA, TP128, Qh, res;
 1.1  mrg      UINT64 sign_x, sign_y, T, carry64, D, Q_high, Q_low, QX, PD,
 1.1  mrg        valid_y;
 1.1  mrg      int_float fx, fy, f64;
 1.1  mrg      UINT32 QX32, tdigit[3], digit, digit_h, digit_low;
 1.1  mrg      int exponent_x, exponent_y, bin_index, bin_expon, diff_expon, ed2,
 1.1  mrg        digits_q, amount;
 1.1  mrg      int nzeros, i, j, k, d5;
 1.1  mrg      unsigned rmode;
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg      fexcept_t binaryflags = 0;
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg valid_y = unpack_BID64 (&sign_y, &exponent_y, &CY.w[0], y);
 1.1  mrg
 1.1  mrg 	// unpack arguments, check for NaN or Infinity
 1.1  mrg CX.w[1] = 0;
 1.1  mrg if (!unpack_BID64 (&sign_x, &exponent_x, &CX.w[0], (x))) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg if ((y & SNAN_MASK64) == SNAN_MASK64)	// y is sNaN
 1.1  mrg   __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg     // test if x is NaN
 1.1  mrg if ((x & NAN_MASK64) == NAN_MASK64) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   if ((x & SNAN_MASK64) == SNAN_MASK64)	// sNaN
 1.1  mrg     __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   res.w[0] = (CX.w[0] & 0x0003ffffffffffffull);
 1.1  mrg   __mul_64x64_to_128 (res, res.w[0], power10_table_128[18].w[0]);
 1.1  mrg   res.w[1] |= ((CX.w[0]) & 0xfc00000000000000ull);
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg 	   // x is Infinity?
 1.1  mrg if (((x) & 0x7800000000000000ull) == 0x7800000000000000ull) {
 1.1  mrg   // check if y is Inf.
 1.1  mrg   if ((((y) & 0x7c00000000000000ull) == 0x7800000000000000ull))
 1.1  mrg     // return NaN
 1.1  mrg   {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   res.w[1] = 0x7c00000000000000ull;
 1.1  mrg   res.w[0] = 0;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   if ((((y) & 0x7c00000000000000ull) != 0x7c00000000000000ull)) {
 1.1  mrg   // otherwise return +/-Inf
 1.1  mrg   res.w[1] =
 1.1  mrg     (((x) ^ (y)) & 0x8000000000000000ull) | 0x7800000000000000ull;
 1.1  mrg   res.w[0] = 0;
 1.1  mrg   BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg }
 1.1  mrg 	   // x is 0
 1.1  mrg if ((((y) & 0x7800000000000000ull) != 0x7800000000000000ull)) {
 1.1  mrg     if(!CY.w[0]) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   // x=y=0, return NaN
 1.1  mrg   res.w[1] = 0x7c00000000000000ull;
 1.1  mrg   res.w[0] = 0;
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg 	   // return 0
 1.1  mrg res.w[1] = ((x) ^ (y)) & 0x8000000000000000ull;
 1.1  mrg if (((y) & 0x6000000000000000ull) == 0x6000000000000000ull)
 1.1  mrg   exponent_y = ((UINT32) ((y) >> 51)) & 0x3ff;
 1.1  mrg else
 1.1  mrg   exponent_y = ((UINT32) ((y) >> 53)) & 0x3ff;
 1.1  mrg exponent_x = exponent_x - exponent_y + DECIMAL_EXPONENT_BIAS_128;
 1.1  mrg if (exponent_x > DECIMAL_MAX_EXPON_128)
 1.1  mrg   exponent_x = DECIMAL_MAX_EXPON_128;
 1.1  mrg else if (exponent_x < 0)
 1.1  mrg   exponent_x = 0;
 1.1  mrg res.w[1] |= (((UINT64) exponent_x) << 49);
 1.1  mrg res.w[0] = 0;
 1.1  mrg BID_RETURN (res);
 1.1  mrg }
 1.1  mrg }
 1.1  mrg
 1.1  mrg CY.w[1] = 0;
 1.1  mrg if (!valid_y) {
 1.1  mrg   // y is Inf. or NaN
 1.1  mrg
 1.1  mrg   // test if y is NaN
 1.1  mrg   if ((y & NAN_MASK64) == NAN_MASK64) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     if ((y & SNAN_MASK64) == SNAN_MASK64)	// sNaN
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   res.w[0] = (CY.w[0] & 0x0003ffffffffffffull);
 1.1  mrg   __mul_64x64_to_128 (res, res.w[0], power10_table_128[18].w[0]);
 1.1  mrg   res.w[1] |= ((CY.w[0]) & 0xfc00000000000000ull);
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // y is Infinity?
 1.1  mrg   if (((y) & 0x7800000000000000ull) == 0x7800000000000000ull) {
 1.1  mrg     // return +/-0
 1.1  mrg     res.w[1] = sign_x ^ sign_y;
 1.1  mrg     res.w[0] = 0;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // y is 0, return +/-Inf
 1.1  mrg   res.w[1] =
 1.1  mrg     (((x) ^ (y)) & 0x8000000000000000ull) | 0x7800000000000000ull;
 1.1  mrg   res.w[0] = 0;
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   __set_status_flags (pfpsf, ZERO_DIVIDE_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg (void) fegetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg diff_expon = exponent_x - exponent_y + DECIMAL_EXPONENT_BIAS_128;
 1.1  mrg
 1.1  mrg if (__unsigned_compare_gt_128 (CY, CX)) {
 1.1  mrg   // CX < CY
 1.1  mrg
 1.1  mrg   // 2^64
 1.1  mrg   f64.i = 0x5f800000;
 1.1  mrg
 1.1  mrg   // fx ~ CX,   fy ~ CY
 1.1  mrg   fx.d = (float) CX.w[1] * f64.d + (float) CX.w[0];
 1.1  mrg   fy.d = (float) CY.w[1] * f64.d + (float) CY.w[0];
 1.1  mrg   // expon_cy - expon_cx
 1.1  mrg   bin_index = (fy.i - fx.i) >> 23;
 1.1  mrg
 1.1  mrg   if (CX.w[1]) {
 1.1  mrg     T = power10_index_binexp_128[bin_index].w[0];
 1.1  mrg     __mul_64x128_short (CA, T, CX);
 1.1  mrg   } else {
 1.1  mrg     T128 = power10_index_binexp_128[bin_index];
 1.1  mrg     __mul_64x128_short (CA, CX.w[0], T128);
 1.1  mrg   }
 1.1  mrg
 1.1  mrg   ed2 = 33;
 1.1  mrg   if (__unsigned_compare_gt_128 (CY, CA))
 1.1  mrg     ed2++;
 1.1  mrg
 1.1  mrg   T128 = power10_table_128[ed2];
 1.1  mrg   __mul_128x128_to_256 (CA4, CA, T128);
 1.1  mrg
 1.1  mrg   ed2 += estimate_decimal_digits[bin_index];
 1.1  mrg   CQ.w[0] = CQ.w[1] = 0;
 1.1  mrg   diff_expon = diff_expon - ed2;
 1.1  mrg
 1.1  mrg } else {
 1.1  mrg   // get CQ = CX/CY
 1.1  mrg   __div_128_by_128 (&CQ, &CR, CX, CY);
 1.1  mrg
 1.1  mrg   if (!CR.w[1] && !CR.w[0]) {
 1.1  mrg     get_BID128 (&res, sign_x ^ sign_y, diff_expon, CQ, &rnd_mode,
 1.1  mrg 		pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // get number of decimal digits in CQ
 1.1  mrg   // 2^64
 1.1  mrg   f64.i = 0x5f800000;
 1.1  mrg   fx.d = (float) CQ.w[1] * f64.d + (float) CQ.w[0];
 1.1  mrg   // binary expon. of CQ
 1.1  mrg   bin_expon = (fx.i - 0x3f800000) >> 23;
 1.1  mrg
 1.1  mrg   digits_q = estimate_decimal_digits[bin_expon];
 1.1  mrg   TP128.w[0] = power10_index_binexp_128[bin_expon].w[0];
 1.1  mrg   TP128.w[1] = power10_index_binexp_128[bin_expon].w[1];
 1.1  mrg   if (__unsigned_compare_ge_128 (CQ, TP128))
 1.1  mrg     digits_q++;
 1.1  mrg
 1.1  mrg   ed2 = 34 - digits_q;
 1.1  mrg   T128.w[0] = power10_table_128[ed2].w[0];
 1.1  mrg   T128.w[1] = power10_table_128[ed2].w[1];
 1.1  mrg   __mul_128x128_to_256 (CA4, CR, T128);
 1.1  mrg   diff_expon = diff_expon - ed2;
 1.1  mrg   __mul_128x128_low (CQ, CQ, T128);
 1.1  mrg
 1.1  mrg }
 1.1  mrg
 1.1  mrg __div_256_by_128 (&CQ, &CA4, CY);
 1.1  mrg
 1.1  mrg
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   if (CA4.w[0] || CA4.w[1]) {
 1.1  mrg     // set status flags
 1.1  mrg     __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg   }
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   else
 1.1  mrg #endif
 1.1  mrg #else
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   if (!CA4.w[0] && !CA4.w[1])
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg     // check whether result is exact
 1.1  mrg   {
 1.1  mrg     // check whether CX, CY are short
 1.1  mrg     if (!CX.w[1] && !CY.w[1] && (CX.w[0] <= 1024) && (CY.w[0] <= 1024)) {
 1.1  mrg       i = (int) CY.w[0] - 1;
 1.1  mrg       j = (int) CX.w[0] - 1;
 1.1  mrg       // difference in powers of 2 factors for Y and X
 1.1  mrg       nzeros = ed2 - factors[i][0] + factors[j][0];
 1.1  mrg       // difference in powers of 5 factors
 1.1  mrg       d5 = ed2 - factors[i][1] + factors[j][1];
 1.1  mrg       if (d5 < nzeros)
 1.1  mrg 	nzeros = d5;
 1.1  mrg       // get P*(2^M[extra_digits])/10^extra_digits
 1.5  mrg       __mul_128x128_high (Qh, CQ, reciprocals10_128[nzeros]);
 1.1  mrg       //__mul_128x128_to_256(P256, CQ, reciprocals10_128[nzeros]);Qh.w[1]=P256.w[3];Qh.w[0]=P256.w[2];
 1.1  mrg
 1.1  mrg       // now get P/10^extra_digits: shift Q_high right by M[extra_digits]-128
 1.1  mrg       amount = recip_scale[nzeros];
 1.1  mrg       __shr_128_long (CQ, Qh, amount);
 1.1  mrg
 1.1  mrg       diff_expon += nzeros;
 1.1  mrg     } else {
 1.1  mrg       // decompose Q as Qh*10^17 + Ql
 1.1  mrg       //T128 = reciprocals10_128[17];
 1.1  mrg       T128.w[0] = 0x44909befeb9fad49ull;
 1.1  mrg       T128.w[1] = 0x000b877aa3236a4bull;
 1.1  mrg       __mul_128x128_to_256 (P256, CQ, T128);
 1.1  mrg       //amount = recip_scale[17];
 1.1  mrg       Q_high = (P256.w[2] >> 44) | (P256.w[3] << (64 - 44));
 1.1  mrg       Q_low = CQ.w[0] - Q_high * 100000000000000000ull;
 1.1  mrg
 1.1  mrg       if (!Q_low) {
 1.1  mrg 	diff_expon += 17;
 1.1  mrg
 1.1  mrg 	tdigit[0] = Q_high & 0x3ffffff;
 1.1  mrg 	tdigit[1] = 0;
 1.1  mrg 	QX = Q_high >> 26;
 1.1  mrg 	QX32 = QX;
 1.1  mrg 	nzeros = 0;
 1.1  mrg
 1.1  mrg 	for (j = 0; QX32; j++, QX32 >>= 7) {
 1.1  mrg 	  k = (QX32 & 127);
 1.1  mrg 	  tdigit[0] += convert_table[j][k][0];
 1.1  mrg 	  tdigit[1] += convert_table[j][k][1];
 1.1  mrg 	  if (tdigit[0] >= 100000000) {
 1.1  mrg 	    tdigit[0] -= 100000000;
 1.1  mrg 	    tdigit[1]++;
 1.1  mrg 	  }
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg
 1.1  mrg 	if (tdigit[1] >= 100000000) {
 1.1  mrg 	  tdigit[1] -= 100000000;
 1.1  mrg 	  if (tdigit[1] >= 100000000)
 1.1  mrg 	    tdigit[1] -= 100000000;
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	digit = tdigit[0];
 1.1  mrg 	if (!digit && !tdigit[1])
 1.1  mrg 	  nzeros += 16;
 1.1  mrg 	else {
 1.1  mrg 	  if (!digit) {
 1.1  mrg 	    nzeros += 8;
 1.1  mrg 	    digit = tdigit[1];
 1.1  mrg 	  }
 1.1  mrg 	  // decompose digit
 1.1  mrg 	  PD = (UINT64) digit *0x068DB8BBull;
 1.1  mrg 	  digit_h = (UINT32) (PD >> 40);
 1.1  mrg 	  digit_low = digit - digit_h * 10000;
 1.1  mrg
 1.1  mrg 	  if (!digit_low)
 1.1  mrg 	    nzeros += 4;
 1.1  mrg 	  else
 1.1  mrg 	    digit_h = digit_low;
 1.1  mrg
 1.1  mrg 	  if (!(digit_h & 1))
 1.1  mrg 	    nzeros +=
 1.1  mrg 	      3 & (UINT32) (packed_10000_zeros[digit_h >> 3] >>
 1.1  mrg 			    (digit_h & 7));
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	if (nzeros) {
 1.1  mrg 	  __mul_64x64_to_128 (CQ, Q_high, reciprocals10_64[nzeros]);
 1.1  mrg
 1.1  mrg 	  // now get P/10^extra_digits: shift C64 right by M[extra_digits]-64
 1.1  mrg 	  amount = short_recip_scale[nzeros];
 1.1  mrg 	  CQ.w[0] = CQ.w[1] >> amount;
 1.1  mrg 	} else
 1.1  mrg 	  CQ.w[0] = Q_high;
 1.1  mrg 	CQ.w[1] = 0;
 1.1  mrg
 1.1  mrg 	diff_expon += nzeros;
 1.1  mrg       } else {
 1.1  mrg 	tdigit[0] = Q_low & 0x3ffffff;
 1.1  mrg 	tdigit[1] = 0;
 1.1  mrg 	QX = Q_low >> 26;
 1.1  mrg 	QX32 = QX;
 1.1  mrg 	nzeros = 0;
 1.1  mrg
 1.1  mrg 	for (j = 0; QX32; j++, QX32 >>= 7) {
 1.1  mrg 	  k = (QX32 & 127);
 1.1  mrg 	  tdigit[0] += convert_table[j][k][0];
 1.1  mrg 	  tdigit[1] += convert_table[j][k][1];
 1.1  mrg 	  if (tdigit[0] >= 100000000) {
 1.1  mrg 	    tdigit[0] -= 100000000;
 1.1  mrg 	    tdigit[1]++;
 1.1  mrg 	  }
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	if (tdigit[1] >= 100000000) {
 1.1  mrg 	  tdigit[1] -= 100000000;
 1.1  mrg 	  if (tdigit[1] >= 100000000)
 1.1  mrg 	    tdigit[1] -= 100000000;
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	digit = tdigit[0];
 1.1  mrg 	if (!digit && !tdigit[1])
 1.1  mrg 	  nzeros += 16;
 1.1  mrg 	else {
 1.1  mrg 	  if (!digit) {
 1.1  mrg 	    nzeros += 8;
 1.1  mrg 	    digit = tdigit[1];
 1.1  mrg 	  }
 1.1  mrg 	  // decompose digit
 1.1  mrg 	  PD = (UINT64) digit *0x068DB8BBull;
 1.1  mrg 	  digit_h = (UINT32) (PD >> 40);
 1.1  mrg 	  digit_low = digit - digit_h * 10000;
 1.1  mrg
 1.1  mrg 	  if (!digit_low)
 1.1  mrg 	    nzeros += 4;
 1.1  mrg 	  else
 1.1  mrg 	    digit_h = digit_low;
 1.1  mrg
 1.1  mrg 	  if (!(digit_h & 1))
 1.1  mrg 	    nzeros +=
 1.1  mrg 	      3 & (UINT32) (packed_10000_zeros[digit_h >> 3] >>
 1.1  mrg 			    (digit_h & 7));
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	if (nzeros) {
 1.1  mrg 	  // get P*(2^M[extra_digits])/10^extra_digits
 1.5  mrg 	  __mul_128x128_high (Qh, CQ, reciprocals10_128[nzeros]);
 1.1  mrg
 1.1  mrg 	  // now get P/10^extra_digits: shift Q_high right by M[extra_digits]-128
 1.1  mrg 	  amount = recip_scale[nzeros];
 1.1  mrg 	  __shr_128 (CQ, Qh, amount);
 1.1  mrg 	}
 1.1  mrg 	diff_expon += nzeros;
 1.1  mrg
 1.1  mrg       }
 1.1  mrg     }
 1.1  mrg     get_BID128(&res, sign_x ^ sign_y, diff_expon, CQ, &rnd_mode,pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg if (diff_expon >= 0) {
 1.1  mrg #ifdef IEEE_ROUND_NEAREST
 1.1  mrg   // rounding
 1.1  mrg   // 2*CA4 - CY
 1.1  mrg   CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg   CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg   __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg   CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg
 1.1  mrg   D = (CA4r.w[1] | CA4r.w[0]) ? 1 : 0;
 1.1  mrg   carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) & ((CQ.w[0]) | D);
 1.1  mrg
 1.1  mrg   CQ.w[0] += carry64;
 1.1  mrg   if (CQ.w[0] < carry64)
 1.1  mrg     CQ.w[1]++;
 1.1  mrg #else
 1.1  mrg #ifdef IEEE_ROUND_NEAREST_TIES_AWAY
 1.1  mrg   // rounding
 1.1  mrg   // 2*CA4 - CY
 1.1  mrg   CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg   CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg   __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg   CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg
 1.1  mrg   D = (CA4r.w[1] | CA4r.w[0]) ? 0 : 1;
 1.1  mrg   carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) | D;
 1.1  mrg
 1.1  mrg   CQ.w[0] += carry64;
 1.1  mrg   if (CQ.w[0] < carry64)
 1.1  mrg     CQ.w[1]++;
 1.1  mrg #else
 1.1  mrg   rmode = rnd_mode;
 1.1  mrg   if (sign_x ^ sign_y && (unsigned) (rmode - 1) < 2)
 1.1  mrg     rmode = 3 - rmode;
 1.1  mrg   switch (rmode) {
 1.1  mrg   case ROUNDING_TO_NEAREST:	// round to nearest code
 1.1  mrg     // rounding
 1.1  mrg     // 2*CA4 - CY
 1.1  mrg     CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg     CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg     __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg     CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg     D = (CA4r.w[1] | CA4r.w[0]) ? 1 : 0;
 1.1  mrg     carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) & ((CQ.w[0]) | D);
 1.1  mrg     CQ.w[0] += carry64;
 1.1  mrg     if (CQ.w[0] < carry64)
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   case ROUNDING_TIES_AWAY:
 1.1  mrg     // rounding
 1.1  mrg     // 2*CA4 - CY
 1.1  mrg     CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg     CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg     __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg     CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg     D = (CA4r.w[1] | CA4r.w[0]) ? 0 : 1;
 1.1  mrg     carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) | D;
 1.1  mrg     CQ.w[0] += carry64;
 1.1  mrg     if (CQ.w[0] < carry64)
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   case ROUNDING_DOWN:
 1.1  mrg   case ROUNDING_TO_ZERO:
 1.1  mrg     break;
 1.1  mrg   default:	// rounding up
 1.1  mrg     CQ.w[0]++;
 1.1  mrg     if (!CQ.w[0])
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg } else {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   if (CA4.w[0] || CA4.w[1]) {
 1.1  mrg     // set status flags
 1.1  mrg     __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg   handle_UF_128_rem (&res, sign_x ^ sign_y, diff_expon, CQ,
 1.1  mrg 		     CA4.w[1] | CA4.w[0], &rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg   (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg   BID_RETURN (res);
 1.1  mrg
 1.1  mrg }
 1.1  mrg
 1.1  mrg get_BID128 (&res, sign_x ^ sign_y, diff_expon, CQ, &rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg BID_RETURN (res);
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg BID128_FUNCTION_ARGTYPE1_ARG128 (bid128dq_div, UINT64, x, y)
 1.1  mrg      UINT256 CA4, CA4r, P256;
 1.5  mrg      UINT128 CX, CY, T128, CQ, CR, CA, TP128, Qh, res;
 1.1  mrg      UINT64 sign_x, sign_y, T, carry64, D, Q_high, Q_low, QX, valid_y,
 1.1  mrg        PD;
 1.1  mrg      int_float fx, fy, f64;
 1.1  mrg      UINT32 QX32, tdigit[3], digit, digit_h, digit_low;
 1.1  mrg      int exponent_x, exponent_y, bin_index, bin_expon, diff_expon, ed2,
 1.1  mrg        digits_q, amount;
 1.1  mrg      int nzeros, i, j, k, d5;
 1.1  mrg      unsigned rmode;
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg      fexcept_t binaryflags = 0;
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg valid_y = unpack_BID128_value (&sign_y, &exponent_y, &CY, y);
 1.1  mrg
 1.1  mrg 	// unpack arguments, check for NaN or Infinity
 1.1  mrg CX.w[1] = 0;
 1.1  mrg if (!unpack_BID64 (&sign_x, &exponent_x, &CX.w[0], x)) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg if ((y.w[1] & SNAN_MASK64) == SNAN_MASK64)	// y is sNaN
 1.1  mrg   __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg     // test if x is NaN
 1.1  mrg if ((x & NAN_MASK64) == NAN_MASK64) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   if ((x & SNAN_MASK64) == SNAN_MASK64)	// sNaN
 1.1  mrg     __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   res.w[0] = (CX.w[0] & 0x0003ffffffffffffull);
 1.1  mrg   __mul_64x64_to_128 (res, res.w[0], power10_table_128[18].w[0]);
 1.1  mrg   res.w[1] |= ((CX.w[0]) & 0xfc00000000000000ull);
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg 	   // x is Infinity?
 1.1  mrg if ((x & 0x7800000000000000ull) == 0x7800000000000000ull) {
 1.1  mrg   // check if y is Inf.
 1.1  mrg   if (((y.w[1] & 0x7c00000000000000ull) == 0x7800000000000000ull))
 1.1  mrg     // return NaN
 1.1  mrg   {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg     res.w[1] = 0x7c00000000000000ull;
 1.1  mrg     res.w[0] = 0;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   if (((y.w[1] & 0x7c00000000000000ull) != 0x7c00000000000000ull)) {
 1.1  mrg   // otherwise return +/-Inf
 1.1  mrg   res.w[1] =
 1.1  mrg     ((x ^ y.w[1]) & 0x8000000000000000ull) | 0x7800000000000000ull;
 1.1  mrg   res.w[0] = 0;
 1.1  mrg   BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg }
 1.1  mrg 	   // x is 0
 1.1  mrg if ((y.w[1] & INFINITY_MASK64) != INFINITY_MASK64) {
 1.1  mrg   if ((!CY.w[0]) && !(CY.w[1] & 0x0001ffffffffffffull)) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg     // x=y=0, return NaN
 1.1  mrg     res.w[1] = 0x7c00000000000000ull;
 1.1  mrg     res.w[0] = 0;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // return 0
 1.1  mrg   res.w[1] = (x ^ y.w[1]) & 0x8000000000000000ull;
 1.1  mrg   exponent_x = exponent_x - exponent_y + (DECIMAL_EXPONENT_BIAS_128<<1) - DECIMAL_EXPONENT_BIAS;
 1.1  mrg   if (exponent_x > DECIMAL_MAX_EXPON_128)
 1.1  mrg     exponent_x = DECIMAL_MAX_EXPON_128;
 1.1  mrg   else if (exponent_x < 0)
 1.1  mrg     exponent_x = 0;
 1.1  mrg   res.w[1] |= (((UINT64) exponent_x) << 49);
 1.1  mrg   res.w[0] = 0;
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg }
 1.1  mrg exponent_x += (DECIMAL_EXPONENT_BIAS_128 - DECIMAL_EXPONENT_BIAS);
 1.1  mrg
 1.1  mrg if (!valid_y) {
 1.1  mrg   // y is Inf. or NaN
 1.1  mrg
 1.1  mrg   // test if y is NaN
 1.1  mrg   if ((y.w[1] & 0x7c00000000000000ull) == 0x7c00000000000000ull) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     if ((y.w[1] & 0x7e00000000000000ull) == 0x7e00000000000000ull)	// sNaN
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg     res.w[1] = CY.w[1] & QUIET_MASK64;
 1.1  mrg     res.w[0] = CY.w[0];
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // y is Infinity?
 1.1  mrg   if ((y.w[1] & 0x7800000000000000ull) == 0x7800000000000000ull) {
 1.1  mrg     // return +/-0
 1.1  mrg     res.w[1] = sign_x ^ sign_y;
 1.1  mrg     res.w[0] = 0;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // y is 0, return +/-Inf
 1.1  mrg   res.w[1] =
 1.1  mrg     ((x ^ y.w[1]) & 0x8000000000000000ull) | 0x7800000000000000ull;
 1.1  mrg   res.w[0] = 0;
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   __set_status_flags (pfpsf, ZERO_DIVIDE_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg (void) fegetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg diff_expon = exponent_x - exponent_y + DECIMAL_EXPONENT_BIAS_128;
 1.1  mrg
 1.1  mrg if (__unsigned_compare_gt_128 (CY, CX)) {
 1.1  mrg   // CX < CY
 1.1  mrg
 1.1  mrg   // 2^64
 1.1  mrg   f64.i = 0x5f800000;
 1.1  mrg
 1.1  mrg   // fx ~ CX,   fy ~ CY
 1.1  mrg   fx.d = (float) CX.w[1] * f64.d + (float) CX.w[0];
 1.1  mrg   fy.d = (float) CY.w[1] * f64.d + (float) CY.w[0];
 1.1  mrg   // expon_cy - expon_cx
 1.1  mrg   bin_index = (fy.i - fx.i) >> 23;
 1.1  mrg
 1.1  mrg   if (CX.w[1]) {
 1.1  mrg     T = power10_index_binexp_128[bin_index].w[0];
 1.1  mrg     __mul_64x128_short (CA, T, CX);
 1.1  mrg   } else {
 1.1  mrg     T128 = power10_index_binexp_128[bin_index];
 1.1  mrg     __mul_64x128_short (CA, CX.w[0], T128);
 1.1  mrg   }
 1.1  mrg
 1.1  mrg   ed2 = 33;
 1.1  mrg   if (__unsigned_compare_gt_128 (CY, CA))
 1.1  mrg     ed2++;
 1.1  mrg
 1.1  mrg   T128 = power10_table_128[ed2];
 1.1  mrg   __mul_128x128_to_256 (CA4, CA, T128);
 1.1  mrg
 1.1  mrg   ed2 += estimate_decimal_digits[bin_index];
 1.1  mrg   CQ.w[0] = CQ.w[1] = 0;
 1.1  mrg   diff_expon = diff_expon - ed2;
 1.1  mrg
 1.1  mrg } else {
 1.1  mrg   // get CQ = CX/CY
 1.1  mrg   __div_128_by_128 (&CQ, &CR, CX, CY);
 1.1  mrg
 1.1  mrg   if (!CR.w[1] && !CR.w[0]) {
 1.1  mrg     get_BID128 (&res, sign_x ^ sign_y, diff_expon, CQ, &rnd_mode,
 1.1  mrg 		pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // get number of decimal digits in CQ
 1.1  mrg   // 2^64
 1.1  mrg   f64.i = 0x5f800000;
 1.1  mrg   fx.d = (float) CQ.w[1] * f64.d + (float) CQ.w[0];
 1.1  mrg   // binary expon. of CQ
 1.1  mrg   bin_expon = (fx.i - 0x3f800000) >> 23;
 1.1  mrg
 1.1  mrg   digits_q = estimate_decimal_digits[bin_expon];
 1.1  mrg   TP128.w[0] = power10_index_binexp_128[bin_expon].w[0];
 1.1  mrg   TP128.w[1] = power10_index_binexp_128[bin_expon].w[1];
 1.1  mrg   if (__unsigned_compare_ge_128 (CQ, TP128))
 1.1  mrg     digits_q++;
 1.1  mrg
 1.1  mrg   ed2 = 34 - digits_q;
 1.1  mrg   T128.w[0] = power10_table_128[ed2].w[0];
 1.1  mrg   T128.w[1] = power10_table_128[ed2].w[1];
 1.1  mrg   __mul_128x128_to_256 (CA4, CR, T128);
 1.1  mrg   diff_expon = diff_expon - ed2;
 1.1  mrg   __mul_128x128_low (CQ, CQ, T128);
 1.1  mrg
 1.1  mrg }
 1.1  mrg
 1.1  mrg __div_256_by_128 (&CQ, &CA4, CY);
 1.1  mrg
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   if (CA4.w[0] || CA4.w[1]) {
 1.1  mrg     // set status flags
 1.1  mrg     __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg   }
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   else
 1.1  mrg #endif
 1.1  mrg #else
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   if (!CA4.w[0] && !CA4.w[1])
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg     // check whether result is exact
 1.1  mrg   {
 1.1  mrg     //printf("ed2=%d,nz=%d,a=%d,CQ="LX16","LX16", RH="LX16", RL="LX16"\n",ed2,nzeros,amount,CQ.w[1],CQ.w[0],reciprocals10_128[nzeros].w[1],reciprocals10_128[nzeros].w[0]);fflush(stdout);
 1.1  mrg     // check whether CX, CY are short
 1.1  mrg     if (!CX.w[1] && !CY.w[1] && (CX.w[0] <= 1024) && (CY.w[0] <= 1024)) {
 1.1  mrg       i = (int) CY.w[0] - 1;
 1.1  mrg       j = (int) CX.w[0] - 1;
 1.1  mrg       // difference in powers of 2 factors for Y and X
 1.1  mrg       nzeros = ed2 - factors[i][0] + factors[j][0];
 1.1  mrg       // difference in powers of 5 factors
 1.1  mrg       d5 = ed2 - factors[i][1] + factors[j][1];
 1.1  mrg       if (d5 < nzeros)
 1.1  mrg 	nzeros = d5;
 1.1  mrg       // get P*(2^M[extra_digits])/10^extra_digits
 1.5  mrg       __mul_128x128_high (Qh, CQ, reciprocals10_128[nzeros]);
 1.1  mrg       //__mul_128x128_to_256(P256, CQ, reciprocals10_128[nzeros]);Qh.w[1]=P256.w[3];Qh.w[0]=P256.w[2];
 1.1  mrg
 1.1  mrg       // now get P/10^extra_digits: shift Q_high right by M[extra_digits]-128
 1.1  mrg       amount = recip_scale[nzeros];
 1.1  mrg       __shr_128_long (CQ, Qh, amount);
 1.1  mrg
 1.1  mrg       diff_expon += nzeros;
 1.1  mrg     } else {
 1.1  mrg       // decompose Q as Qh*10^17 + Ql
 1.1  mrg       //T128 = reciprocals10_128[17];
 1.1  mrg       T128.w[0] = 0x44909befeb9fad49ull;
 1.1  mrg       T128.w[1] = 0x000b877aa3236a4bull;
 1.1  mrg       __mul_128x128_to_256 (P256, CQ, T128);
 1.1  mrg       //amount = recip_scale[17];
 1.1  mrg       Q_high = (P256.w[2] >> 44) | (P256.w[3] << (64 - 44));
 1.1  mrg       Q_low = CQ.w[0] - Q_high * 100000000000000000ull;
 1.1  mrg
 1.1  mrg       if (!Q_low) {
 1.1  mrg 	diff_expon += 17;
 1.1  mrg
 1.1  mrg 	tdigit[0] = Q_high & 0x3ffffff;
 1.1  mrg 	tdigit[1] = 0;
 1.1  mrg 	QX = Q_high >> 26;
 1.1  mrg 	QX32 = QX;
 1.1  mrg 	nzeros = 0;
 1.1  mrg
 1.1  mrg 	for (j = 0; QX32; j++, QX32 >>= 7) {
 1.1  mrg 	  k = (QX32 & 127);
 1.1  mrg 	  tdigit[0] += convert_table[j][k][0];
 1.1  mrg 	  tdigit[1] += convert_table[j][k][1];
 1.1  mrg 	  if (tdigit[0] >= 100000000) {
 1.1  mrg 	    tdigit[0] -= 100000000;
 1.1  mrg 	    tdigit[1]++;
 1.1  mrg 	  }
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg
 1.1  mrg 	if (tdigit[1] >= 100000000) {
 1.1  mrg 	  tdigit[1] -= 100000000;
 1.1  mrg 	  if (tdigit[1] >= 100000000)
 1.1  mrg 	    tdigit[1] -= 100000000;
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	digit = tdigit[0];
 1.1  mrg 	if (!digit && !tdigit[1])
 1.1  mrg 	  nzeros += 16;
 1.1  mrg 	else {
 1.1  mrg 	  if (!digit) {
 1.1  mrg 	    nzeros += 8;
 1.1  mrg 	    digit = tdigit[1];
 1.1  mrg 	  }
 1.1  mrg 	  // decompose digit
 1.1  mrg 	  PD = (UINT64) digit *0x068DB8BBull;
 1.1  mrg 	  digit_h = (UINT32) (PD >> 40);
 1.1  mrg 	  //printf("i=%d, nz=%d, digit=%d (%d, %016I64x %016I64x)\n",i,nzeros,digit_h,digit,PD,digit_h);fflush(stdout);
 1.1  mrg 	  digit_low = digit - digit_h * 10000;
 1.1  mrg
 1.1  mrg 	  if (!digit_low)
 1.1  mrg 	    nzeros += 4;
 1.1  mrg 	  else
 1.1  mrg 	    digit_h = digit_low;
 1.1  mrg
 1.1  mrg 	  if (!(digit_h & 1))
 1.1  mrg 	    nzeros +=
 1.1  mrg 	      3 & (UINT32) (packed_10000_zeros[digit_h >> 3] >>
 1.1  mrg 			    (digit_h & 7));
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	if (nzeros) {
 1.1  mrg 	  __mul_64x64_to_128 (CQ, Q_high, reciprocals10_64[nzeros]);
 1.1  mrg
 1.1  mrg 	  // now get P/10^extra_digits: shift C64 right by M[extra_digits]-64
 1.1  mrg 	  amount = short_recip_scale[nzeros];
 1.1  mrg 	  CQ.w[0] = CQ.w[1] >> amount;
 1.1  mrg 	} else
 1.1  mrg 	  CQ.w[0] = Q_high;
 1.1  mrg 	CQ.w[1] = 0;
 1.1  mrg
 1.1  mrg 	diff_expon += nzeros;
 1.1  mrg       } else {
 1.1  mrg 	tdigit[0] = Q_low & 0x3ffffff;
 1.1  mrg 	tdigit[1] = 0;
 1.1  mrg 	QX = Q_low >> 26;
 1.1  mrg 	QX32 = QX;
 1.1  mrg 	nzeros = 0;
 1.1  mrg
 1.1  mrg 	for (j = 0; QX32; j++, QX32 >>= 7) {
 1.1  mrg 	  k = (QX32 & 127);
 1.1  mrg 	  tdigit[0] += convert_table[j][k][0];
 1.1  mrg 	  tdigit[1] += convert_table[j][k][1];
 1.1  mrg 	  if (tdigit[0] >= 100000000) {
 1.1  mrg 	    tdigit[0] -= 100000000;
 1.1  mrg 	    tdigit[1]++;
 1.1  mrg 	  }
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	if (tdigit[1] >= 100000000) {
 1.1  mrg 	  tdigit[1] -= 100000000;
 1.1  mrg 	  if (tdigit[1] >= 100000000)
 1.1  mrg 	    tdigit[1] -= 100000000;
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	digit = tdigit[0];
 1.1  mrg 	if (!digit && !tdigit[1])
 1.1  mrg 	  nzeros += 16;
 1.1  mrg 	else {
 1.1  mrg 	  if (!digit) {
 1.1  mrg 	    nzeros += 8;
 1.1  mrg 	    digit = tdigit[1];
 1.1  mrg 	  }
 1.1  mrg 	  // decompose digit
 1.1  mrg 	  PD = (UINT64) digit *0x068DB8BBull;
 1.1  mrg 	  digit_h = (UINT32) (PD >> 40);
 1.1  mrg 	  //printf("i=%d, nz=%d, digit=%d (%d, %016I64x %016I64x)\n",i,nzeros,digit_h,digit,PD,digit_h);fflush(stdout);
 1.1  mrg 	  digit_low = digit - digit_h * 10000;
 1.1  mrg
 1.1  mrg 	  if (!digit_low)
 1.1  mrg 	    nzeros += 4;
 1.1  mrg 	  else
 1.1  mrg 	    digit_h = digit_low;
 1.1  mrg
 1.1  mrg 	  if (!(digit_h & 1))
 1.1  mrg 	    nzeros +=
 1.1  mrg 	      3 & (UINT32) (packed_10000_zeros[digit_h >> 3] >>
 1.1  mrg 			    (digit_h & 7));
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	if (nzeros) {
 1.1  mrg 	  // get P*(2^M[extra_digits])/10^extra_digits
 1.5  mrg 	  __mul_128x128_high (Qh, CQ, reciprocals10_128[nzeros]);
 1.1  mrg
 1.1  mrg 	  // now get P/10^extra_digits: shift Q_high right by M[extra_digits]-128
 1.1  mrg 	  amount = recip_scale[nzeros];
 1.1  mrg 	  __shr_128 (CQ, Qh, amount);
 1.1  mrg 	}
 1.1  mrg 	diff_expon += nzeros;
 1.1  mrg
 1.1  mrg       }
 1.1  mrg     }
 1.1  mrg     get_BID128 (&res, sign_x ^ sign_y, diff_expon, CQ, &rnd_mode,
 1.1  mrg 		pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg if (diff_expon >= 0) {
 1.1  mrg #ifdef IEEE_ROUND_NEAREST
 1.1  mrg   // rounding
 1.1  mrg   // 2*CA4 - CY
 1.1  mrg   CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg   CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg   __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg   CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg
 1.1  mrg   D = (CA4r.w[1] | CA4r.w[0]) ? 1 : 0;
 1.1  mrg   carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) & ((CQ.w[0]) | D);
 1.1  mrg
 1.1  mrg   CQ.w[0] += carry64;
 1.1  mrg   if (CQ.w[0] < carry64)
 1.1  mrg     CQ.w[1]++;
 1.1  mrg #else
 1.1  mrg #ifdef IEEE_ROUND_NEAREST_TIES_AWAY
 1.1  mrg   // rounding
 1.1  mrg   // 2*CA4 - CY
 1.1  mrg   CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg   CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg   __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg   CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg
 1.1  mrg   D = (CA4r.w[1] | CA4r.w[0]) ? 0 : 1;
 1.1  mrg   carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) | D;
 1.1  mrg
 1.1  mrg   CQ.w[0] += carry64;
 1.1  mrg   if (CQ.w[0] < carry64)
 1.1  mrg     CQ.w[1]++;
 1.1  mrg #else
 1.1  mrg   rmode = rnd_mode;
 1.1  mrg   if (sign_x ^ sign_y && (unsigned) (rmode - 1) < 2)
 1.1  mrg     rmode = 3 - rmode;
 1.1  mrg   switch (rmode) {
 1.1  mrg   case ROUNDING_TO_NEAREST:	// round to nearest code
 1.1  mrg     // rounding
 1.1  mrg     // 2*CA4 - CY
 1.1  mrg     CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg     CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg     __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg     CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg     D = (CA4r.w[1] | CA4r.w[0]) ? 1 : 0;
 1.1  mrg     carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) & ((CQ.w[0]) | D);
 1.1  mrg     CQ.w[0] += carry64;
 1.1  mrg     if (CQ.w[0] < carry64)
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   case ROUNDING_TIES_AWAY:
 1.1  mrg     // rounding
 1.1  mrg     // 2*CA4 - CY
 1.1  mrg     CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg     CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg     __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg     CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg     D = (CA4r.w[1] | CA4r.w[0]) ? 0 : 1;
 1.1  mrg     carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) | D;
 1.1  mrg     CQ.w[0] += carry64;
 1.1  mrg     if (CQ.w[0] < carry64)
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   case ROUNDING_DOWN:
 1.1  mrg   case ROUNDING_TO_ZERO:
 1.1  mrg     break;
 1.1  mrg   default:	// rounding up
 1.1  mrg     CQ.w[0]++;
 1.1  mrg     if (!CQ.w[0])
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg } else {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   if (CA4.w[0] || CA4.w[1]) {
 1.1  mrg     // set status flags
 1.1  mrg     __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg   handle_UF_128_rem (&res, sign_x ^ sign_y, diff_expon, CQ,
 1.1  mrg 		     CA4.w[1] | CA4.w[0], &rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg   (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg
 1.1  mrg get_BID128 (&res, sign_x ^ sign_y, diff_expon, CQ, &rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg BID_RETURN (res);
 1.1  mrg
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg BID128_FUNCTION_ARG128_ARGTYPE2 (bid128qd_div, x, UINT64, y)
 1.1  mrg      UINT256 CA4, CA4r, P256;
 1.5  mrg      UINT128 CX, CY, T128, CQ, CR, CA, TP128, Qh, res;
 1.1  mrg      UINT64 sign_x, sign_y, T, carry64, D, Q_high, Q_low, QX, PD,
 1.1  mrg        valid_y;
 1.1  mrg      int_float fx, fy, f64;
 1.1  mrg      UINT32 QX32, tdigit[3], digit, digit_h, digit_low;
 1.1  mrg      int exponent_x, exponent_y, bin_index, bin_expon, diff_expon, ed2,
 1.1  mrg        digits_q, amount;
 1.1  mrg      int nzeros, i, j, k, d5, rmode;
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg      fexcept_t binaryflags = 0;
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg
 1.1  mrg valid_y = unpack_BID64 (&sign_y, &exponent_y, &CY.w[0], y);
 1.1  mrg 	// unpack arguments, check for NaN or Infinity
 1.1  mrg if (!unpack_BID128_value (&sign_x, &exponent_x, &CX, x)) {
 1.1  mrg     // test if x is NaN
 1.1  mrg if ((x.w[1] & 0x7c00000000000000ull) == 0x7c00000000000000ull) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   if ((x.w[1] & 0x7e00000000000000ull) == 0x7e00000000000000ull ||	// sNaN
 1.1  mrg       (y & 0x7e00000000000000ull) == 0x7e00000000000000ull)
 1.1  mrg     __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   res.w[1] = (CX.w[1]) & QUIET_MASK64;
 1.1  mrg   res.w[0] = CX.w[0];
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg     // x is Infinity?
 1.1  mrg if ((x.w[1] & 0x7800000000000000ull) == 0x7800000000000000ull) {
 1.1  mrg   // check if y is Inf.
 1.1  mrg   if (((y & 0x7c00000000000000ull) == 0x7800000000000000ull))
 1.1  mrg     // return NaN
 1.1  mrg   {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg     res.w[1] = 0x7c00000000000000ull;
 1.1  mrg     res.w[0] = 0;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // y is NaN?
 1.1  mrg   if (((y & 0x7c00000000000000ull) != 0x7c00000000000000ull))
 1.1  mrg     // return NaN
 1.1  mrg   {
 1.1  mrg     // return +/-Inf
 1.1  mrg     res.w[1] = ((x.w[1] ^ y) & 0x8000000000000000ull) |
 1.1  mrg       0x7800000000000000ull;
 1.1  mrg     res.w[0] = 0;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg }
 1.1  mrg     // x is 0
 1.1  mrg if ((y & 0x7800000000000000ull) < 0x7800000000000000ull) {
 1.1  mrg 	if (!CY.w[0]) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg     // x=y=0, return NaN
 1.1  mrg     res.w[1] = 0x7c00000000000000ull;
 1.1  mrg     res.w[0] = 0;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // return 0
 1.1  mrg   res.w[1] = (x.w[1] ^ y) & 0x8000000000000000ull;
 1.1  mrg   exponent_x = exponent_x - exponent_y + DECIMAL_EXPONENT_BIAS;
 1.1  mrg   if (exponent_x > DECIMAL_MAX_EXPON_128)
 1.1  mrg     exponent_x = DECIMAL_MAX_EXPON_128;
 1.1  mrg   else if (exponent_x < 0)
 1.1  mrg     exponent_x = 0;
 1.1  mrg   res.w[1] |= (((UINT64) exponent_x) << 49);
 1.1  mrg   res.w[0] = 0;
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg }
 1.1  mrg CY.w[1] = 0;
 1.1  mrg if (!valid_y) {
 1.1  mrg   // y is Inf. or NaN
 1.1  mrg
 1.1  mrg   // test if y is NaN
 1.1  mrg   if ((y & NAN_MASK64) == NAN_MASK64) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     if ((y & SNAN_MASK64) == SNAN_MASK64)	// sNaN
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   res.w[0] = (CY.w[0] & 0x0003ffffffffffffull);
 1.1  mrg   __mul_64x64_to_128 (res, res.w[0], power10_table_128[18].w[0]);
 1.1  mrg   res.w[1] |= ((CY.w[0]) & 0xfc00000000000000ull);
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // y is Infinity?
 1.1  mrg   if ((y & INFINITY_MASK64) == INFINITY_MASK64) {
 1.1  mrg     // return +/-0
 1.1  mrg     res.w[1] = ((x.w[1] ^ y) & 0x8000000000000000ull);
 1.1  mrg     res.w[0] = 0;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // y is 0
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   __set_status_flags (pfpsf, ZERO_DIVIDE_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   res.w[1] = (sign_x ^ sign_y) | INFINITY_MASK64;
 1.1  mrg   res.w[0] = 0;
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg (void) fegetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg diff_expon = exponent_x - exponent_y + DECIMAL_EXPONENT_BIAS;
 1.1  mrg
 1.1  mrg if (__unsigned_compare_gt_128 (CY, CX)) {
 1.1  mrg   // CX < CY
 1.1  mrg
 1.1  mrg   // 2^64
 1.1  mrg   f64.i = 0x5f800000;
 1.1  mrg
 1.1  mrg   // fx ~ CX,   fy ~ CY
 1.1  mrg   fx.d = (float) CX.w[1] * f64.d + (float) CX.w[0];
 1.1  mrg   fy.d = (float) CY.w[1] * f64.d + (float) CY.w[0];
 1.1  mrg   // expon_cy - expon_cx
 1.1  mrg   bin_index = (fy.i - fx.i) >> 23;
 1.1  mrg
 1.1  mrg   if (CX.w[1]) {
 1.1  mrg     T = power10_index_binexp_128[bin_index].w[0];
 1.1  mrg     __mul_64x128_short (CA, T, CX);
 1.1  mrg   } else {
 1.1  mrg     T128 = power10_index_binexp_128[bin_index];
 1.1  mrg     __mul_64x128_short (CA, CX.w[0], T128);
 1.1  mrg   }
 1.1  mrg
 1.1  mrg   ed2 = 33;
 1.1  mrg   if (__unsigned_compare_gt_128 (CY, CA))
 1.1  mrg     ed2++;
 1.1  mrg
 1.1  mrg   T128 = power10_table_128[ed2];
 1.1  mrg   __mul_128x128_to_256 (CA4, CA, T128);
 1.1  mrg
 1.1  mrg   ed2 += estimate_decimal_digits[bin_index];
 1.1  mrg   CQ.w[0] = CQ.w[1] = 0;
 1.1  mrg   diff_expon = diff_expon - ed2;
 1.1  mrg
 1.1  mrg } else {
 1.1  mrg   // get CQ = CX/CY
 1.1  mrg   __div_128_by_128 (&CQ, &CR, CX, CY);
 1.1  mrg
 1.1  mrg   if (!CR.w[1] && !CR.w[0]) {
 1.1  mrg     get_BID128 (&res, sign_x ^ sign_y, diff_expon, CQ, &rnd_mode,
 1.1  mrg 		pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // get number of decimal digits in CQ
 1.1  mrg   // 2^64
 1.1  mrg   f64.i = 0x5f800000;
 1.1  mrg   fx.d = (float) CQ.w[1] * f64.d + (float) CQ.w[0];
 1.1  mrg   // binary expon. of CQ
 1.1  mrg   bin_expon = (fx.i - 0x3f800000) >> 23;
 1.1  mrg
 1.1  mrg   digits_q = estimate_decimal_digits[bin_expon];
 1.1  mrg   TP128.w[0] = power10_index_binexp_128[bin_expon].w[0];
 1.1  mrg   TP128.w[1] = power10_index_binexp_128[bin_expon].w[1];
 1.1  mrg   if (__unsigned_compare_ge_128 (CQ, TP128))
 1.1  mrg     digits_q++;
 1.1  mrg
 1.1  mrg   ed2 = 34 - digits_q;
 1.1  mrg   T128.w[0] = power10_table_128[ed2].w[0];
 1.1  mrg   T128.w[1] = power10_table_128[ed2].w[1];
 1.1  mrg   __mul_128x128_to_256 (CA4, CR, T128);
 1.1  mrg   diff_expon = diff_expon - ed2;
 1.1  mrg   __mul_128x128_low (CQ, CQ, T128);
 1.1  mrg
 1.1  mrg }
 1.1  mrg
 1.1  mrg __div_256_by_128 (&CQ, &CA4, CY);
 1.1  mrg
 1.1  mrg
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   if (CA4.w[0] || CA4.w[1]) {
 1.1  mrg     // set status flags
 1.1  mrg     __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg   }
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   else
 1.1  mrg #endif
 1.1  mrg #else
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   if (!CA4.w[0] && !CA4.w[1])
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg     // check whether result is exact
 1.1  mrg   {
 1.1  mrg     // check whether CX, CY are short
 1.1  mrg     if (!CX.w[1] && !CY.w[1] && (CX.w[0] <= 1024) && (CY.w[0] <= 1024)) {
 1.1  mrg       i = (int) CY.w[0] - 1;
 1.1  mrg       j = (int) CX.w[0] - 1;
 1.1  mrg       // difference in powers of 2 factors for Y and X
 1.1  mrg       nzeros = ed2 - factors[i][0] + factors[j][0];
 1.1  mrg       // difference in powers of 5 factors
 1.1  mrg       d5 = ed2 - factors[i][1] + factors[j][1];
 1.1  mrg       if (d5 < nzeros)
 1.1  mrg 	nzeros = d5;
 1.1  mrg       // get P*(2^M[extra_digits])/10^extra_digits
 1.5  mrg       __mul_128x128_high (Qh, CQ, reciprocals10_128[nzeros]);
 1.1  mrg       //__mul_128x128_to_256(P256, CQ, reciprocals10_128[nzeros]);Qh.w[1]=P256.w[3];Qh.w[0]=P256.w[2];
 1.1  mrg
 1.1  mrg       // now get P/10^extra_digits: shift Q_high right by M[extra_digits]-128
 1.1  mrg       amount = recip_scale[nzeros];
 1.1  mrg       __shr_128_long (CQ, Qh, amount);
 1.1  mrg
 1.1  mrg       diff_expon += nzeros;
 1.1  mrg     } else {
 1.1  mrg       // decompose Q as Qh*10^17 + Ql
 1.1  mrg       //T128 = reciprocals10_128[17];
 1.1  mrg       T128.w[0] = 0x44909befeb9fad49ull;
 1.1  mrg       T128.w[1] = 0x000b877aa3236a4bull;
 1.1  mrg       __mul_128x128_to_256 (P256, CQ, T128);
 1.1  mrg       //amount = recip_scale[17];
 1.1  mrg       Q_high = (P256.w[2] >> 44) | (P256.w[3] << (64 - 44));
 1.1  mrg       Q_low = CQ.w[0] - Q_high * 100000000000000000ull;
 1.1  mrg
 1.1  mrg       if (!Q_low) {
 1.1  mrg 	diff_expon += 17;
 1.1  mrg
 1.1  mrg 	tdigit[0] = Q_high & 0x3ffffff;
 1.1  mrg 	tdigit[1] = 0;
 1.1  mrg 	QX = Q_high >> 26;
 1.1  mrg 	QX32 = QX;
 1.1  mrg 	nzeros = 0;
 1.1  mrg
 1.1  mrg 	for (j = 0; QX32; j++, QX32 >>= 7) {
 1.1  mrg 	  k = (QX32 & 127);
 1.1  mrg 	  tdigit[0] += convert_table[j][k][0];
 1.1  mrg 	  tdigit[1] += convert_table[j][k][1];
 1.1  mrg 	  if (tdigit[0] >= 100000000) {
 1.1  mrg 	    tdigit[0] -= 100000000;
 1.1  mrg 	    tdigit[1]++;
 1.1  mrg 	  }
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg
 1.1  mrg 	if (tdigit[1] >= 100000000) {
 1.1  mrg 	  tdigit[1] -= 100000000;
 1.1  mrg 	  if (tdigit[1] >= 100000000)
 1.1  mrg 	    tdigit[1] -= 100000000;
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	digit = tdigit[0];
 1.1  mrg 	if (!digit && !tdigit[1])
 1.1  mrg 	  nzeros += 16;
 1.1  mrg 	else {
 1.1  mrg 	  if (!digit) {
 1.1  mrg 	    nzeros += 8;
 1.1  mrg 	    digit = tdigit[1];
 1.1  mrg 	  }
 1.1  mrg 	  // decompose digit
 1.1  mrg 	  PD = (UINT64) digit *0x068DB8BBull;
 1.1  mrg 	  digit_h = (UINT32) (PD >> 40);
 1.1  mrg 	  digit_low = digit - digit_h * 10000;
 1.1  mrg
 1.1  mrg 	  if (!digit_low)
 1.1  mrg 	    nzeros += 4;
 1.1  mrg 	  else
 1.1  mrg 	    digit_h = digit_low;
 1.1  mrg
 1.1  mrg 	  if (!(digit_h & 1))
 1.1  mrg 	    nzeros +=
 1.1  mrg 	      3 & (UINT32) (packed_10000_zeros[digit_h >> 3] >>
 1.1  mrg 			    (digit_h & 7));
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	if (nzeros) {
 1.1  mrg 	  __mul_64x64_to_128 (CQ, Q_high, reciprocals10_64[nzeros]);
 1.1  mrg
 1.1  mrg 	  // now get P/10^extra_digits: shift C64 right by M[extra_digits]-64
 1.1  mrg 	  amount = short_recip_scale[nzeros];
 1.1  mrg 	  CQ.w[0] = CQ.w[1] >> amount;
 1.1  mrg 	} else
 1.1  mrg 	  CQ.w[0] = Q_high;
 1.1  mrg 	CQ.w[1] = 0;
 1.1  mrg
 1.1  mrg 	diff_expon += nzeros;
 1.1  mrg       } else {
 1.1  mrg 	tdigit[0] = Q_low & 0x3ffffff;
 1.1  mrg 	tdigit[1] = 0;
 1.1  mrg 	QX = Q_low >> 26;
 1.1  mrg 	QX32 = QX;
 1.1  mrg 	nzeros = 0;
 1.1  mrg
 1.1  mrg 	for (j = 0; QX32; j++, QX32 >>= 7) {
 1.1  mrg 	  k = (QX32 & 127);
 1.1  mrg 	  tdigit[0] += convert_table[j][k][0];
 1.1  mrg 	  tdigit[1] += convert_table[j][k][1];
 1.1  mrg 	  if (tdigit[0] >= 100000000) {
 1.1  mrg 	    tdigit[0] -= 100000000;
 1.1  mrg 	    tdigit[1]++;
 1.1  mrg 	  }
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	if (tdigit[1] >= 100000000) {
 1.1  mrg 	  tdigit[1] -= 100000000;
 1.1  mrg 	  if (tdigit[1] >= 100000000)
 1.1  mrg 	    tdigit[1] -= 100000000;
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	digit = tdigit[0];
 1.1  mrg 	if (!digit && !tdigit[1])
 1.1  mrg 	  nzeros += 16;
 1.1  mrg 	else {
 1.1  mrg 	  if (!digit) {
 1.1  mrg 	    nzeros += 8;
 1.1  mrg 	    digit = tdigit[1];
 1.1  mrg 	  }
 1.1  mrg 	  // decompose digit
 1.1  mrg 	  PD = (UINT64) digit *0x068DB8BBull;
 1.1  mrg 	  digit_h = (UINT32) (PD >> 40);
 1.1  mrg 	  digit_low = digit - digit_h * 10000;
 1.1  mrg
 1.1  mrg 	  if (!digit_low)
 1.1  mrg 	    nzeros += 4;
 1.1  mrg 	  else
 1.1  mrg 	    digit_h = digit_low;
 1.1  mrg
 1.1  mrg 	  if (!(digit_h & 1))
 1.1  mrg 	    nzeros +=
 1.1  mrg 	      3 & (UINT32) (packed_10000_zeros[digit_h >> 3] >>
 1.1  mrg 			    (digit_h & 7));
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	if (nzeros) {
 1.1  mrg 	  // get P*(2^M[extra_digits])/10^extra_digits
 1.5  mrg 	  __mul_128x128_high (Qh, CQ, reciprocals10_128[nzeros]);
 1.1  mrg
 1.1  mrg 	  // now get P/10^extra_digits: shift Q_high right by M[extra_digits]-128
 1.1  mrg 	  amount = recip_scale[nzeros];
 1.1  mrg 	  __shr_128 (CQ, Qh, amount);
 1.1  mrg 	}
 1.1  mrg 	diff_expon += nzeros;
 1.1  mrg
 1.1  mrg       }
 1.1  mrg     }
 1.1  mrg     get_BID128 (&res, sign_x ^ sign_y, diff_expon, CQ, &rnd_mode,pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg if (diff_expon >= 0) {
 1.1  mrg #ifdef IEEE_ROUND_NEAREST
 1.1  mrg   // rounding
 1.1  mrg   // 2*CA4 - CY
 1.1  mrg   CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg   CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg   __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg   CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg
 1.1  mrg   D = (CA4r.w[1] | CA4r.w[0]) ? 1 : 0;
 1.1  mrg   carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) & ((CQ.w[0]) | D);
 1.1  mrg
 1.1  mrg   CQ.w[0] += carry64;
 1.1  mrg   if (CQ.w[0] < carry64)
 1.1  mrg     CQ.w[1]++;
 1.1  mrg #else
 1.1  mrg #ifdef IEEE_ROUND_NEAREST_TIES_AWAY
 1.1  mrg   // rounding
 1.1  mrg   // 2*CA4 - CY
 1.1  mrg   CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg   CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg   __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg   CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg
 1.1  mrg   D = (CA4r.w[1] | CA4r.w[0]) ? 0 : 1;
 1.1  mrg   carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) | D;
 1.1  mrg
 1.1  mrg   CQ.w[0] += carry64;
 1.1  mrg   if (CQ.w[0] < carry64)
 1.1  mrg     CQ.w[1]++;
 1.1  mrg #else
 1.1  mrg   rmode = rnd_mode;
 1.1  mrg   if (sign_x ^ sign_y && (unsigned) (rmode - 1) < 2)
 1.1  mrg     rmode = 3 - rmode;
 1.1  mrg   switch (rmode) {
 1.1  mrg   case ROUNDING_TO_NEAREST:	// round to nearest code
 1.1  mrg     // rounding
 1.1  mrg     // 2*CA4 - CY
 1.1  mrg     CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg     CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg     __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg     CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg     D = (CA4r.w[1] | CA4r.w[0]) ? 1 : 0;
 1.1  mrg     carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) & ((CQ.w[0]) | D);
 1.1  mrg     CQ.w[0] += carry64;
 1.1  mrg     if (CQ.w[0] < carry64)
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   case ROUNDING_TIES_AWAY:
 1.1  mrg     // rounding
 1.1  mrg     // 2*CA4 - CY
 1.1  mrg     CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg     CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg     __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg     CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg     D = (CA4r.w[1] | CA4r.w[0]) ? 0 : 1;
 1.1  mrg     carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) | D;
 1.1  mrg     CQ.w[0] += carry64;
 1.1  mrg     if (CQ.w[0] < carry64)
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   case ROUNDING_DOWN:
 1.1  mrg   case ROUNDING_TO_ZERO:
 1.1  mrg     break;
 1.1  mrg   default:	// rounding up
 1.1  mrg     CQ.w[0]++;
 1.1  mrg     if (!CQ.w[0])
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg } else {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   if (CA4.w[0] || CA4.w[1]) {
 1.1  mrg     // set status flags
 1.1  mrg     __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg   handle_UF_128_rem (&res, sign_x ^ sign_y, diff_expon, CQ,
 1.1  mrg 		     CA4.w[1] | CA4.w[0], &rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg   (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg   BID_RETURN (res);
 1.1  mrg
 1.1  mrg }
 1.1  mrg
 1.1  mrg get_BID128 (&res, sign_x ^ sign_y, diff_expon, CQ, &rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg BID_RETURN (res);
 1.1  mrg
 1.1  mrg }