config/libbid/bid64_div.c

1.12  mrg /* Copyright (C) 2007-2022 Free Software Foundation, Inc.
 1.1  mrg
 1.1  mrg This file is part of GCC.
 1.1  mrg
 1.1  mrg GCC is free software; you can redistribute it and/or modify it under
 1.1  mrg the terms of the GNU General Public License as published by the Free
 1.1  mrg Software Foundation; either version 3, or (at your option) any later
 1.1  mrg version.
 1.1  mrg
 1.1  mrg GCC is distributed in the hope that it will be useful, but WITHOUT ANY
 1.1  mrg WARRANTY; without even the implied warranty of MERCHANTABILITY or
 1.1  mrg FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
 1.1  mrg for more details.
 1.1  mrg
 1.1  mrg Under Section 7 of GPL version 3, you are granted additional
 1.1  mrg permissions described in the GCC Runtime Library Exception, version
 1.1  mrg 3.1, as published by the Free Software Foundation.
 1.1  mrg
 1.1  mrg You should have received a copy of the GNU General Public License and
 1.1  mrg a copy of the GCC Runtime Library Exception along with this program;
 1.1  mrg see the files COPYING3 and COPYING.RUNTIME respectively.  If not, see
 1.1  mrg <http://www.gnu.org/licenses/>.  */
 1.1  mrg
 1.1  mrg /*****************************************************************************
 1.1  mrg  *    BID64 divide
 1.1  mrg  *****************************************************************************
 1.1  mrg  *
 1.1  mrg  *  Algorithm description:
 1.1  mrg  *
 1.1  mrg  *  if(coefficient_x<coefficient_y)
 1.1  mrg  *    p = number_digits(coefficient_y) - number_digits(coefficient_x)
 1.1  mrg  *    A = coefficient_x*10^p
 1.1  mrg  *    B = coefficient_y
 1.1  mrg  *    CA= A*10^(15+j), j=0 for A>=B, 1 otherwise
 1.1  mrg  *    Q = 0
 1.1  mrg  *  else
 1.1  mrg  *    get Q=(int)(coefficient_x/coefficient_y)
 1.1  mrg  *        (based on double precision divide)
 1.1  mrg  *    check for exact divide case
 1.1  mrg  *    Let R = coefficient_x - Q*coefficient_y
 1.1  mrg  *    Let m=16-number_digits(Q)
 1.1  mrg  *    CA=R*10^m, Q=Q*10^m
 1.1  mrg  *    B = coefficient_y
 1.1  mrg  *  endif
 1.1  mrg  *    if (CA<2^64)
 1.1  mrg  *      Q += CA/B  (64-bit unsigned divide)
 1.1  mrg  *    else
 1.1  mrg  *      get final Q using double precision divide, followed by 3 integer
 1.1  mrg  *          iterations
 1.1  mrg  *    if exact result, eliminate trailing zeros
 1.1  mrg  *    check for underflow
 1.1  mrg  *    round coefficient to nearest
 1.1  mrg  *
 1.1  mrg  ****************************************************************************/
 1.1  mrg
 1.1  mrg #include "bid_internal.h"
 1.1  mrg #include "bid_div_macros.h"
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg #include <fenv.h>
 1.1  mrg
 1.1  mrg #define FE_ALL_FLAGS FE_INVALID|FE_DIVBYZERO|FE_OVERFLOW|FE_UNDERFLOW|FE_INEXACT
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg extern UINT32 convert_table[5][128][2];
 1.1  mrg extern SINT8 factors[][2];
 1.1  mrg extern UINT8 packed_10000_zeros[];
 1.1  mrg
 1.1  mrg
 1.1  mrg #if DECIMAL_CALL_BY_REFERENCE
 1.1  mrg
 1.1  mrg void
 1.1  mrg bid64_div (UINT64 * pres, UINT64 * px,
 1.1  mrg 	   UINT64 *
 1.1  mrg 	   py _RND_MODE_PARAM _EXC_FLAGS_PARAM _EXC_MASKS_PARAM
 1.1  mrg 	   _EXC_INFO_PARAM) {
 1.1  mrg   UINT64 x, y;
 1.1  mrg #else
 1.1  mrg
 1.1  mrg UINT64
 1.1  mrg bid64_div (UINT64 x,
 1.1  mrg 	   UINT64 y _RND_MODE_PARAM _EXC_FLAGS_PARAM
 1.1  mrg 	   _EXC_MASKS_PARAM _EXC_INFO_PARAM) {
 1.1  mrg #endif
 1.1  mrg   UINT128 CA, CT;
 1.1  mrg   UINT64 sign_x, sign_y, coefficient_x, coefficient_y, A, B, QX, PD;
 1.1  mrg   UINT64 A2, Q, Q2, B2, B4, B5, R, T, DU, res;
 1.1  mrg   UINT64 valid_x, valid_y;
 1.1  mrg   SINT64 D;
 1.1  mrg   int_double t_scale, tempq, temp_b;
 1.1  mrg   int_float tempx, tempy;
 1.1  mrg   double da, db, dq, da_h, da_l;
 1.1  mrg   int exponent_x, exponent_y, bin_expon_cx;
 1.1  mrg   int diff_expon, ed1, ed2, bin_index;
 1.1  mrg   int rmode, amount;
 1.1  mrg   int nzeros, i, j, k, d5;
 1.1  mrg   UINT32 QX32, tdigit[3], digit, digit_h, digit_low;
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg   fexcept_t binaryflags = 0;
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg #if DECIMAL_CALL_BY_REFERENCE
 1.1  mrg #if !DECIMAL_GLOBAL_ROUNDING
 1.1  mrg   _IDEC_round rnd_mode = *prnd_mode;
 1.1  mrg #endif
 1.1  mrg   x = *px;
 1.1  mrg   y = *py;
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg   valid_x = unpack_BID64 (&sign_x, &exponent_x, &coefficient_x, x);
 1.1  mrg   valid_y = unpack_BID64 (&sign_y, &exponent_y, &coefficient_y, y);
 1.1  mrg
 1.1  mrg   // unpack arguments, check for NaN or Infinity
 1.1  mrg   if (!valid_x) {
 1.1  mrg     // x is Inf. or NaN
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     if ((y & SNAN_MASK64) == SNAN_MASK64)	// y is sNaN
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg     // test if x is NaN
 1.1  mrg     if ((x & NAN_MASK64) == NAN_MASK64) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg       if ((x & SNAN_MASK64) == SNAN_MASK64)	// sNaN
 1.1  mrg 	__set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg       BID_RETURN (coefficient_x & QUIET_MASK64);
 1.1  mrg     }
 1.1  mrg     // x is Infinity?
 1.1  mrg     if ((x & INFINITY_MASK64) == INFINITY_MASK64) {
 1.1  mrg       // check if y is Inf or NaN
 1.1  mrg       if ((y & INFINITY_MASK64) == INFINITY_MASK64) {
 1.1  mrg 	// y==Inf, return NaN
 1.1  mrg 	if ((y & NAN_MASK64) == INFINITY_MASK64) {	// Inf/Inf
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg 	  __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg 	  BID_RETURN (NAN_MASK64);
 1.1  mrg 	}
 1.1  mrg       } else {
 1.1  mrg 	// otherwise return +/-Inf
 1.1  mrg 	BID_RETURN (((x ^ y) & 0x8000000000000000ull) |
 1.1  mrg 		    INFINITY_MASK64);
 1.1  mrg       }
 1.1  mrg     }
 1.1  mrg     // x==0
 1.1  mrg     if (((y & INFINITY_MASK64) != INFINITY_MASK64)
 1.1  mrg 	&& !(coefficient_y)) {
 1.1  mrg       // y==0 , return NaN
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg       BID_RETURN (NAN_MASK64);
 1.1  mrg     }
 1.1  mrg     if (((y & INFINITY_MASK64) != INFINITY_MASK64)) {
 1.1  mrg       if ((y & SPECIAL_ENCODING_MASK64) == SPECIAL_ENCODING_MASK64)
 1.1  mrg 	exponent_y = ((UINT32) (y >> 51)) & 0x3ff;
 1.1  mrg       else
 1.1  mrg 	exponent_y = ((UINT32) (y >> 53)) & 0x3ff;
 1.1  mrg       sign_y = y & 0x8000000000000000ull;
 1.1  mrg
 1.1  mrg       exponent_x = exponent_x - exponent_y + DECIMAL_EXPONENT_BIAS;
 1.1  mrg       if (exponent_x > DECIMAL_MAX_EXPON_64)
 1.1  mrg 	exponent_x = DECIMAL_MAX_EXPON_64;
 1.1  mrg       else if (exponent_x < 0)
 1.1  mrg 	exponent_x = 0;
 1.1  mrg       BID_RETURN ((sign_x ^ sign_y) | (((UINT64) exponent_x) << 53));
 1.1  mrg     }
 1.1  mrg
 1.1  mrg   }
 1.1  mrg   if (!valid_y) {
 1.1  mrg     // y is Inf. or NaN
 1.1  mrg
 1.1  mrg     // test if y is NaN
 1.1  mrg     if ((y & NAN_MASK64) == NAN_MASK64) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg       if ((y & SNAN_MASK64) == SNAN_MASK64)	// sNaN
 1.1  mrg 	__set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg       BID_RETURN (coefficient_y & QUIET_MASK64);
 1.1  mrg     }
 1.1  mrg     // y is Infinity?
 1.1  mrg     if ((y & INFINITY_MASK64) == INFINITY_MASK64) {
 1.1  mrg       // return +/-0
 1.1  mrg       BID_RETURN (((x ^ y) & 0x8000000000000000ull));
 1.1  mrg     }
 1.1  mrg     // y is 0
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     __set_status_flags (pfpsf, ZERO_DIVIDE_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN ((sign_x ^ sign_y) | INFINITY_MASK64);
 1.1  mrg   }
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg   (void) fegetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg   diff_expon = exponent_x - exponent_y + DECIMAL_EXPONENT_BIAS;
 1.1  mrg
 1.1  mrg   if (coefficient_x < coefficient_y) {
 1.1  mrg     // get number of decimal digits for c_x, c_y
 1.1  mrg
 1.1  mrg     //--- get number of bits in the coefficients of x and y ---
 1.1  mrg     tempx.d = (float) coefficient_x;
 1.1  mrg     tempy.d = (float) coefficient_y;
 1.1  mrg     bin_index = (tempy.i - tempx.i) >> 23;
 1.1  mrg
 1.1  mrg     A = coefficient_x * power10_index_binexp[bin_index];
 1.1  mrg     B = coefficient_y;
 1.1  mrg
 1.1  mrg     temp_b.d = (double) B;
 1.1  mrg
 1.1  mrg     // compare A, B
 1.1  mrg     DU = (A - B) >> 63;
 1.1  mrg     ed1 = 15 + (int) DU;
 1.1  mrg     ed2 = estimate_decimal_digits[bin_index] + ed1;
 1.1  mrg     T = power10_table_128[ed1].w[0];
 1.1  mrg     __mul_64x64_to_128 (CA, A, T);
 1.1  mrg
 1.1  mrg     Q = 0;
 1.1  mrg     diff_expon = diff_expon - ed2;
 1.1  mrg
 1.1  mrg     // adjust double precision db, to ensure that later A/B - (int)(da/db) > -1
 1.1  mrg     if (coefficient_y < 0x0020000000000000ull) {
 1.1  mrg       temp_b.i += 1;
 1.1  mrg       db = temp_b.d;
 1.1  mrg     } else
 1.1  mrg       db = (double) (B + 2 + (B & 1));
 1.1  mrg
 1.1  mrg   } else {
 1.1  mrg     // get c_x/c_y
 1.1  mrg
 1.1  mrg     //  set last bit before conversion to DP
 1.1  mrg     A2 = coefficient_x | 1;
 1.1  mrg     da = (double) A2;
 1.1  mrg
 1.1  mrg     db = (double) coefficient_y;
 1.1  mrg
 1.1  mrg     tempq.d = da / db;
 1.1  mrg     Q = (UINT64) tempq.d;
 1.1  mrg
 1.1  mrg     R = coefficient_x - coefficient_y * Q;
 1.1  mrg
 1.1  mrg     // will use to get number of dec. digits of Q
 1.1  mrg     bin_expon_cx = (tempq.i >> 52) - 0x3ff;
 1.1  mrg
 1.1  mrg     // R<0 ?
 1.1  mrg     D = ((SINT64) R) >> 63;
 1.1  mrg     Q += D;
 1.1  mrg     R += (coefficient_y & D);
 1.1  mrg
 1.1  mrg     // exact result ?
 1.1  mrg     if (((SINT64) R) <= 0) {
 1.1  mrg       // can have R==-1 for coeff_y==1
 1.1  mrg       res =
 1.1  mrg 	get_BID64 (sign_x ^ sign_y, diff_expon, (Q + R), rnd_mode,
 1.1  mrg 		   pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg       (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg       BID_RETURN (res);
 1.1  mrg     }
 1.1  mrg     // get decimal digits of Q
 1.1  mrg     DU = power10_index_binexp[bin_expon_cx] - Q - 1;
 1.1  mrg     DU >>= 63;
 1.1  mrg
 1.1  mrg     ed2 = 16 - estimate_decimal_digits[bin_expon_cx] - (int) DU;
 1.1  mrg
 1.1  mrg     T = power10_table_128[ed2].w[0];
 1.1  mrg     __mul_64x64_to_128 (CA, R, T);
 1.1  mrg     B = coefficient_y;
 1.1  mrg
 1.1  mrg     Q *= power10_table_128[ed2].w[0];
 1.1  mrg     diff_expon -= ed2;
 1.1  mrg
 1.1  mrg   }
 1.1  mrg
 1.1  mrg   if (!CA.w[1]) {
 1.1  mrg     Q2 = CA.w[0] / B;
 1.1  mrg     B2 = B + B;
 1.1  mrg     B4 = B2 + B2;
 1.1  mrg     R = CA.w[0] - Q2 * B;
 1.1  mrg     Q += Q2;
 1.1  mrg   } else {
 1.1  mrg
 1.1  mrg     // 2^64
 1.1  mrg     t_scale.i = 0x43f0000000000000ull;
 1.1  mrg     // convert CA to DP
 1.1  mrg     da_h = CA.w[1];
 1.1  mrg     da_l = CA.w[0];
 1.1  mrg     da = da_h * t_scale.d + da_l;
 1.1  mrg
 1.1  mrg     // quotient
 1.1  mrg     dq = da / db;
 1.1  mrg     Q2 = (UINT64) dq;
 1.1  mrg
 1.1  mrg     // get w[0] remainder
 1.1  mrg     R = CA.w[0] - Q2 * B;
 1.1  mrg
 1.1  mrg     // R<0 ?
 1.1  mrg     D = ((SINT64) R) >> 63;
 1.1  mrg     Q2 += D;
 1.1  mrg     R += (B & D);
 1.1  mrg
 1.1  mrg     // now R<6*B
 1.1  mrg
 1.1  mrg     // quick divide
 1.1  mrg
 1.1  mrg     // 4*B
 1.1  mrg     B2 = B + B;
 1.1  mrg     B4 = B2 + B2;
 1.1  mrg
 1.1  mrg     R = R - B4;
 1.1  mrg     // R<0 ?
 1.1  mrg     D = ((SINT64) R) >> 63;
 1.1  mrg     // restore R if negative
 1.1  mrg     R += (B4 & D);
 1.1  mrg     Q2 += ((~D) & 4);
 1.1  mrg
 1.1  mrg     R = R - B2;
 1.1  mrg     // R<0 ?
 1.1  mrg     D = ((SINT64) R) >> 63;
 1.1  mrg     // restore R if negative
 1.1  mrg     R += (B2 & D);
 1.1  mrg     Q2 += ((~D) & 2);
 1.1  mrg
 1.1  mrg     R = R - B;
 1.1  mrg     // R<0 ?
 1.1  mrg     D = ((SINT64) R) >> 63;
 1.1  mrg     // restore R if negative
 1.1  mrg     R += (B & D);
 1.1  mrg     Q2 += ((~D) & 1);
 1.1  mrg
 1.1  mrg     Q += Q2;
 1.1  mrg   }
 1.1  mrg
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   if (R) {
 1.1  mrg     // set status flags
 1.1  mrg     __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg   }
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   else
 1.1  mrg #endif
 1.1  mrg #else
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   if (!R)
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   {
 1.1  mrg     // eliminate trailing zeros
 1.1  mrg
 1.1  mrg     // check whether CX, CY are short
 1.1  mrg     if ((coefficient_x <= 1024) && (coefficient_y <= 1024)) {
 1.1  mrg       i = (int) coefficient_y - 1;
 1.1  mrg       j = (int) coefficient_x - 1;
 1.1  mrg       // difference in powers of 2 factors for Y and X
 1.1  mrg       nzeros = ed2 - factors[i][0] + factors[j][0];
 1.1  mrg       // difference in powers of 5 factors
 1.1  mrg       d5 = ed2 - factors[i][1] + factors[j][1];
 1.1  mrg       if (d5 < nzeros)
 1.1  mrg 	nzeros = d5;
 1.1  mrg
 1.1  mrg       __mul_64x64_to_128 (CT, Q, reciprocals10_64[nzeros]);
 1.1  mrg
 1.1  mrg       // now get P/10^extra_digits: shift C64 right by M[extra_digits]-128
 1.1  mrg       amount = short_recip_scale[nzeros];
 1.1  mrg       Q = CT.w[1] >> amount;
 1.1  mrg
 1.1  mrg       diff_expon += nzeros;
 1.1  mrg     } else {
 1.1  mrg       tdigit[0] = Q & 0x3ffffff;
 1.1  mrg       tdigit[1] = 0;
 1.1  mrg       QX = Q >> 26;
 1.1  mrg       QX32 = QX;
 1.1  mrg       nzeros = 0;
 1.1  mrg
 1.1  mrg       for (j = 0; QX32; j++, QX32 >>= 7) {
 1.1  mrg 	k = (QX32 & 127);
 1.1  mrg 	tdigit[0] += convert_table[j][k][0];
 1.1  mrg 	tdigit[1] += convert_table[j][k][1];
 1.1  mrg 	if (tdigit[0] >= 100000000) {
 1.1  mrg 	  tdigit[0] -= 100000000;
 1.1  mrg 	  tdigit[1]++;
 1.1  mrg 	}
 1.1  mrg       }
 1.1  mrg
 1.1  mrg       digit = tdigit[0];
 1.1  mrg       if (!digit && !tdigit[1])
 1.1  mrg 	nzeros += 16;
 1.1  mrg       else {
 1.1  mrg 	if (!digit) {
 1.1  mrg 	  nzeros += 8;
 1.1  mrg 	  digit = tdigit[1];
 1.1  mrg 	}
 1.1  mrg 	// decompose digit
 1.1  mrg 	PD = (UINT64) digit *0x068DB8BBull;
 1.1  mrg 	digit_h = (UINT32) (PD >> 40);
 1.1  mrg 	digit_low = digit - digit_h * 10000;
 1.1  mrg
 1.1  mrg 	if (!digit_low)
 1.1  mrg 	  nzeros += 4;
 1.1  mrg 	else
 1.1  mrg 	  digit_h = digit_low;
 1.1  mrg
 1.1  mrg 	if (!(digit_h & 1))
 1.1  mrg 	  nzeros +=
 1.1  mrg 	    3 & (UINT32) (packed_10000_zeros[digit_h >> 3] >>
 1.1  mrg 			  (digit_h & 7));
 1.1  mrg       }
 1.1  mrg
 1.1  mrg       if (nzeros) {
 1.1  mrg 	__mul_64x64_to_128 (CT, Q, reciprocals10_64[nzeros]);
 1.1  mrg
 1.1  mrg 	// now get P/10^extra_digits: shift C64 right by M[extra_digits]-128
 1.1  mrg 	amount = short_recip_scale[nzeros];
 1.1  mrg 	Q = CT.w[1] >> amount;
 1.1  mrg       }
 1.1  mrg       diff_expon += nzeros;
 1.1  mrg
 1.1  mrg     }
 1.1  mrg     if (diff_expon >= 0) {
 1.1  mrg       res =
 1.1  mrg 	fast_get_BID64_check_OF (sign_x ^ sign_y, diff_expon, Q,
 1.1  mrg 				 rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg       (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg       BID_RETURN (res);
 1.1  mrg     }
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg   if (diff_expon >= 0) {
 1.1  mrg #ifdef IEEE_ROUND_NEAREST
 1.1  mrg     // round to nearest code
 1.1  mrg     // R*10
 1.1  mrg     R += R;
 1.1  mrg     R = (R << 2) + R;
 1.1  mrg     B5 = B4 + B;
 1.1  mrg
 1.1  mrg     // compare 10*R to 5*B
 1.1  mrg     R = B5 - R;
 1.1  mrg     // correction for (R==0 && (Q&1))
 1.1  mrg     R -= (Q & 1);
 1.1  mrg     // R<0 ?
 1.1  mrg     D = ((UINT64) R) >> 63;
 1.1  mrg     Q += D;
 1.1  mrg #else
 1.1  mrg #ifdef IEEE_ROUND_NEAREST_TIES_AWAY
 1.1  mrg     // round to nearest code
 1.1  mrg     // R*10
 1.1  mrg     R += R;
 1.1  mrg     R = (R << 2) + R;
 1.1  mrg     B5 = B4 + B;
 1.1  mrg
 1.1  mrg     // compare 10*R to 5*B
 1.1  mrg     R = B5 - R;
 1.1  mrg     // correction for (R==0 && (Q&1))
 1.1  mrg     R -= (Q & 1);
 1.1  mrg     // R<0 ?
 1.1  mrg     D = ((UINT64) R) >> 63;
 1.1  mrg     Q += D;
 1.1  mrg #else
 1.1  mrg     rmode = rnd_mode;
 1.1  mrg     if (sign_x ^ sign_y && (unsigned) (rmode - 1) < 2)
 1.1  mrg       rmode = 3 - rmode;
 1.1  mrg     switch (rmode) {
 1.1  mrg     case 0:	// round to nearest code
 1.1  mrg     case ROUNDING_TIES_AWAY:
 1.1  mrg       // R*10
 1.1  mrg       R += R;
 1.1  mrg       R = (R << 2) + R;
 1.1  mrg       B5 = B4 + B;
 1.1  mrg       // compare 10*R to 5*B
 1.1  mrg       R = B5 - R;
 1.1  mrg       // correction for (R==0 && (Q&1))
 1.1  mrg       R -= ((Q | (rmode >> 2)) & 1);
 1.1  mrg       // R<0 ?
 1.1  mrg       D = ((UINT64) R) >> 63;
 1.1  mrg       Q += D;
 1.1  mrg       break;
 1.1  mrg     case ROUNDING_DOWN:
 1.1  mrg     case ROUNDING_TO_ZERO:
 1.1  mrg       break;
 1.1  mrg     default:	// rounding up
 1.1  mrg       Q++;
 1.1  mrg       break;
 1.1  mrg     }
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg     res =
 1.1  mrg       fast_get_BID64_check_OF (sign_x ^ sign_y, diff_expon, Q, rnd_mode,
 1.1  mrg 			       pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   } else {
 1.1  mrg     // UF occurs
 1.1  mrg
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     if ((diff_expon + 16 < 0)) {
 1.1  mrg       // set status flags
 1.1  mrg       __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg     }
 1.1  mrg #endif
 1.1  mrg     rmode = rnd_mode;
 1.1  mrg     res =
 1.1  mrg       get_BID64_UF (sign_x ^ sign_y, diff_expon, Q, R, rmode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg
 1.1  mrg   }
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg
 1.1  mrg TYPE0_FUNCTION_ARGTYPE1_ARG128 (UINT64, bid64dq_div, UINT64, x, y)
 1.1  mrg      UINT256 CA4 =
 1.1  mrg        { {0x0ull, 0x0ull, 0x0ull, 0x0ull} }, CA4r, P256, QB256;
 1.5  mrg UINT128 CX, CY, T128, CQ, CQ2, CR, CA, TP128, Qh, Tmp;
 1.1  mrg UINT64 sign_x, sign_y, T, carry64, D, Q_low, QX, valid_y, PD, res;
 1.1  mrg int_float fx, fy, f64;
 1.1  mrg UINT32 QX32, tdigit[3], digit, digit_h, digit_low;
 1.1  mrg int exponent_x, exponent_y, bin_index, bin_expon, diff_expon, ed2,
 1.1  mrg   digits_q, amount;
 1.1  mrg int nzeros, i, j, k, d5, done = 0;
 1.1  mrg unsigned rmode;
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg fexcept_t binaryflags = 0;
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg valid_y = unpack_BID128_value (&sign_y, &exponent_y, &CY, y);
 1.1  mrg
 1.1  mrg 	// unpack arguments, check for NaN or Infinity
 1.1  mrg CX.w[1] = 0;
 1.1  mrg if (!unpack_BID64 (&sign_x, &exponent_x, &CX.w[0], (x))) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     if (((y.w[1] & SNAN_MASK64) == SNAN_MASK64) ||	// y is sNaN
 1.1  mrg 		((x & SNAN_MASK64) == SNAN_MASK64))
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   // test if x is NaN
 1.1  mrg   if (((x) & 0x7c00000000000000ull) == 0x7c00000000000000ull) {
 1.1  mrg     res = CX.w[0];
 1.1  mrg     BID_RETURN (res & QUIET_MASK64);
 1.1  mrg   }
 1.1  mrg   // x is Infinity?
 1.1  mrg   if (((x) & 0x7800000000000000ull) == 0x7800000000000000ull) {
 1.1  mrg     // check if y is Inf.
 1.1  mrg     if (((y.w[1] & 0x7c00000000000000ull) == 0x7800000000000000ull))
 1.1  mrg       // return NaN
 1.1  mrg     {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg       res = 0x7c00000000000000ull;
 1.1  mrg       BID_RETURN (res);
 1.1  mrg     }
 1.1  mrg 	if (((y.w[1] & 0x7c00000000000000ull) != 0x7c00000000000000ull)) {
 1.1  mrg     // otherwise return +/-Inf
 1.1  mrg     res =
 1.1  mrg       (((x) ^ y.w[1]) & 0x8000000000000000ull) | 0x7800000000000000ull;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg 	}
 1.1  mrg   }
 1.1  mrg   // x is 0
 1.1  mrg   if ((y.w[1] & INFINITY_MASK64) != INFINITY_MASK64) {
 1.1  mrg     if ((!CY.w[0]) && !(CY.w[1] & 0x0001ffffffffffffull)) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg       // x=y=0, return NaN
 1.1  mrg       res = 0x7c00000000000000ull;
 1.1  mrg       BID_RETURN (res);
 1.1  mrg     }
 1.1  mrg     // return 0
 1.1  mrg     res = ((x) ^ y.w[1]) & 0x8000000000000000ull;
 1.1  mrg     exponent_x = exponent_x - exponent_y + DECIMAL_EXPONENT_BIAS_128;
 1.1  mrg     if (exponent_x > DECIMAL_MAX_EXPON_64)
 1.1  mrg       exponent_x = DECIMAL_MAX_EXPON_64;
 1.1  mrg     else if (exponent_x < 0)
 1.1  mrg       exponent_x = 0;
 1.1  mrg     res |= (((UINT64) exponent_x) << 53);
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg }
 1.1  mrg exponent_x += (DECIMAL_EXPONENT_BIAS_128 - DECIMAL_EXPONENT_BIAS);
 1.1  mrg if (!valid_y) {
 1.1  mrg   // y is Inf. or NaN
 1.1  mrg
 1.1  mrg   // test if y is NaN
 1.1  mrg   if ((y.w[1] & 0x7c00000000000000ull) == 0x7c00000000000000ull) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     if ((y.w[1] & 0x7e00000000000000ull) == 0x7e00000000000000ull)	// sNaN
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg     Tmp.w[1] = (CY.w[1] & 0x00003fffffffffffull);
 1.1  mrg     Tmp.w[0] = CY.w[0];
 1.1  mrg     TP128 = reciprocals10_128[18];
 1.5  mrg     __mul_128x128_high (Qh, Tmp, TP128);
 1.1  mrg     amount = recip_scale[18];
 1.1  mrg     __shr_128 (Tmp, Qh, amount);
 1.1  mrg     res = (CY.w[1] & 0xfc00000000000000ull) | Tmp.w[0];
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // y is Infinity?
 1.1  mrg   if ((y.w[1] & 0x7800000000000000ull) == 0x7800000000000000ull) {
 1.1  mrg     // return +/-0
 1.1  mrg     res = sign_x ^ sign_y;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // y is 0, return +/-Inf
 1.1  mrg   res =
 1.1  mrg     (((x) ^ y.w[1]) & 0x8000000000000000ull) | 0x7800000000000000ull;
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   __set_status_flags (pfpsf, ZERO_DIVIDE_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg (void) fegetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg diff_expon = exponent_x - exponent_y + DECIMAL_EXPONENT_BIAS;
 1.1  mrg
 1.1  mrg if (__unsigned_compare_gt_128 (CY, CX)) {
 1.1  mrg   // CX < CY
 1.1  mrg
 1.1  mrg   // 2^64
 1.1  mrg   f64.i = 0x5f800000;
 1.1  mrg
 1.1  mrg   // fx ~ CX,   fy ~ CY
 1.1  mrg   fx.d = (float) CX.w[1] * f64.d + (float) CX.w[0];
 1.1  mrg   fy.d = (float) CY.w[1] * f64.d + (float) CY.w[0];
 1.1  mrg   // expon_cy - expon_cx
 1.1  mrg   bin_index = (fy.i - fx.i) >> 23;
 1.1  mrg
 1.1  mrg   if (CX.w[1]) {
 1.1  mrg     T = power10_index_binexp_128[bin_index].w[0];
 1.1  mrg     __mul_64x128_short (CA, T, CX);
 1.1  mrg   } else {
 1.1  mrg     T128 = power10_index_binexp_128[bin_index];
 1.1  mrg     __mul_64x128_short (CA, CX.w[0], T128);
 1.1  mrg   }
 1.1  mrg
 1.1  mrg   ed2 = 15;
 1.1  mrg   if (__unsigned_compare_gt_128 (CY, CA))
 1.1  mrg     ed2++;
 1.1  mrg
 1.1  mrg   T128 = power10_table_128[ed2];
 1.1  mrg   __mul_128x128_to_256 (CA4, CA, T128);
 1.1  mrg
 1.1  mrg   ed2 += estimate_decimal_digits[bin_index];
 1.1  mrg   CQ.w[0] = CQ.w[1] = 0;
 1.1  mrg   diff_expon = diff_expon - ed2;
 1.1  mrg
 1.1  mrg } else {
 1.1  mrg   // get CQ = CX/CY
 1.1  mrg   __div_128_by_128 (&CQ, &CR, CX, CY);
 1.1  mrg
 1.1  mrg   // get number of decimal digits in CQ
 1.1  mrg   // 2^64
 1.1  mrg   f64.i = 0x5f800000;
 1.1  mrg   fx.d = (float) CQ.w[1] * f64.d + (float) CQ.w[0];
 1.1  mrg   // binary expon. of CQ
 1.1  mrg   bin_expon = (fx.i - 0x3f800000) >> 23;
 1.1  mrg
 1.1  mrg   digits_q = estimate_decimal_digits[bin_expon];
 1.1  mrg   TP128.w[0] = power10_index_binexp_128[bin_expon].w[0];
 1.1  mrg   TP128.w[1] = power10_index_binexp_128[bin_expon].w[1];
 1.1  mrg   if (__unsigned_compare_ge_128 (CQ, TP128))
 1.1  mrg     digits_q++;
 1.1  mrg
 1.1  mrg   if (digits_q <= 16) {
 1.1  mrg     if (!CR.w[1] && !CR.w[0]) {
 1.1  mrg       res = get_BID64 (sign_x ^ sign_y, diff_expon,
 1.1  mrg 		       CQ.w[0], rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg       (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg       BID_RETURN (res);
 1.1  mrg     }
 1.1  mrg
 1.1  mrg     ed2 = 16 - digits_q;
 1.1  mrg     T128.w[0] = power10_table_128[ed2].w[0];
 1.1  mrg     __mul_64x128_to_192 (CA4, (T128.w[0]), CR);
 1.1  mrg     diff_expon = diff_expon - ed2;
 1.1  mrg     CQ.w[0] *= T128.w[0];
 1.1  mrg   } else {
 1.1  mrg     ed2 = digits_q - 16;
 1.1  mrg     diff_expon += ed2;
 1.1  mrg     T128 = reciprocals10_128[ed2];
 1.1  mrg     __mul_128x128_to_256 (P256, CQ, T128);
 1.1  mrg     amount = recip_scale[ed2];
 1.1  mrg     CQ.w[0] = (P256.w[2] >> amount) | (P256.w[3] << (64 - amount));
 1.1  mrg     CQ.w[1] = 0;
 1.1  mrg
 1.1  mrg     __mul_64x64_to_128 (CQ2, CQ.w[0], (power10_table_128[ed2].w[0]));
 1.1  mrg
 1.1  mrg     __mul_64x64_to_128 (QB256, CQ2.w[0], CY.w[0]);
 1.1  mrg     QB256.w[1] += CQ2.w[0] * CY.w[1] + CQ2.w[1] * CY.w[0];
 1.1  mrg
 1.1  mrg     CA4.w[1] = CX.w[1] - QB256.w[1];
 1.1  mrg     CA4.w[0] = CX.w[0] - QB256.w[0];
 1.1  mrg     if (CX.w[0] < QB256.w[0])
 1.1  mrg       CA4.w[1]--;
 1.1  mrg     if (CR.w[0] || CR.w[1])
 1.1  mrg       CA4.w[0] |= 1;
 1.1  mrg     done = 1;
 1.1  mrg
 1.1  mrg   }
 1.1  mrg
 1.1  mrg }
 1.1  mrg if (!done) {
 1.1  mrg   __div_256_by_128 (&CQ, &CA4, CY);
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   if (CA4.w[0] || CA4.w[1]) {
 1.1  mrg     // set status flags
 1.1  mrg     __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg   }
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   else
 1.1  mrg #endif
 1.1  mrg #else
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   if (!CA4.w[0] && !CA4.w[1])
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg     // check whether result is exact
 1.1  mrg   {
 1.1  mrg     // check whether CX, CY are short
 1.1  mrg     if (!CX.w[1] && !CY.w[1] && (CX.w[0] <= 1024) && (CY.w[0] <= 1024)) {
 1.1  mrg       i = (int) CY.w[0] - 1;
 1.1  mrg       j = (int) CX.w[0] - 1;
 1.1  mrg       // difference in powers of 2 factors for Y and X
 1.1  mrg       nzeros = ed2 - factors[i][0] + factors[j][0];
 1.1  mrg       // difference in powers of 5 factors
 1.1  mrg       d5 = ed2 - factors[i][1] + factors[j][1];
 1.1  mrg       if (d5 < nzeros)
 1.1  mrg 	nzeros = d5;
 1.1  mrg       // get P*(2^M[extra_digits])/10^extra_digits
 1.5  mrg       __mul_128x128_high (Qh, CQ, reciprocals10_128[nzeros]);
 1.1  mrg
 1.1  mrg       // now get P/10^extra_digits: shift Q_high right by M[extra_digits]-128
 1.1  mrg       amount = recip_scale[nzeros];
 1.1  mrg       __shr_128_long (CQ, Qh, amount);
 1.1  mrg
 1.1  mrg       diff_expon += nzeros;
 1.1  mrg     } else {
 1.1  mrg       // decompose Q as Qh*10^17 + Ql
 1.1  mrg       Q_low = CQ.w[0];
 1.1  mrg
 1.1  mrg       {
 1.1  mrg 	tdigit[0] = Q_low & 0x3ffffff;
 1.1  mrg 	tdigit[1] = 0;
 1.1  mrg 	QX = Q_low >> 26;
 1.1  mrg 	QX32 = QX;
 1.1  mrg 	nzeros = 0;
 1.1  mrg
 1.1  mrg 	for (j = 0; QX32; j++, QX32 >>= 7) {
 1.1  mrg 	  k = (QX32 & 127);
 1.1  mrg 	  tdigit[0] += convert_table[j][k][0];
 1.1  mrg 	  tdigit[1] += convert_table[j][k][1];
 1.1  mrg 	  if (tdigit[0] >= 100000000) {
 1.1  mrg 	    tdigit[0] -= 100000000;
 1.1  mrg 	    tdigit[1]++;
 1.1  mrg 	  }
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	if (tdigit[1] >= 100000000) {
 1.1  mrg 	  tdigit[1] -= 100000000;
 1.1  mrg 	  if (tdigit[1] >= 100000000)
 1.1  mrg 	    tdigit[1] -= 100000000;
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	digit = tdigit[0];
 1.1  mrg 	if (!digit && !tdigit[1])
 1.1  mrg 	  nzeros += 16;
 1.1  mrg 	else {
 1.1  mrg 	  if (!digit) {
 1.1  mrg 	    nzeros += 8;
 1.1  mrg 	    digit = tdigit[1];
 1.1  mrg 	  }
 1.1  mrg 	  // decompose digit
 1.1  mrg 	  PD = (UINT64) digit *0x068DB8BBull;
 1.1  mrg 	  digit_h = (UINT32) (PD >> 40);
 1.1  mrg 	  digit_low = digit - digit_h * 10000;
 1.1  mrg
 1.1  mrg 	  if (!digit_low)
 1.1  mrg 	    nzeros += 4;
 1.1  mrg 	  else
 1.1  mrg 	    digit_h = digit_low;
 1.1  mrg
 1.1  mrg 	  if (!(digit_h & 1))
 1.1  mrg 	    nzeros +=
 1.1  mrg 	      3 & (UINT32) (packed_10000_zeros[digit_h >> 3] >>
 1.1  mrg 			    (digit_h & 7));
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	if (nzeros) {
 1.1  mrg 	  // get P*(2^M[extra_digits])/10^extra_digits
 1.5  mrg 	  __mul_128x128_high (Qh, CQ, reciprocals10_128[nzeros]);
 1.1  mrg
 1.1  mrg 	  // now get P/10^extra_digits: shift Q_high right by M[extra_digits]-128
 1.1  mrg 	  amount = recip_scale[nzeros];
 1.1  mrg 	  __shr_128 (CQ, Qh, amount);
 1.1  mrg 	}
 1.1  mrg 	diff_expon += nzeros;
 1.1  mrg
 1.1  mrg       }
 1.1  mrg     }
 1.1  mrg 	if(diff_expon>=0){
 1.1  mrg     res =
 1.1  mrg       fast_get_BID64_check_OF (sign_x ^ sign_y, diff_expon, CQ.w[0],
 1.1  mrg 			       rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg 	}
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg   if (diff_expon >= 0) {
 1.1  mrg #ifdef IEEE_ROUND_NEAREST
 1.1  mrg   // rounding
 1.1  mrg   // 2*CA4 - CY
 1.1  mrg   CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg   CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg   __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg   CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg
 1.1  mrg   D = (CA4r.w[1] | CA4r.w[0]) ? 1 : 0;
 1.1  mrg   carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) & ((CQ.w[0]) | D);
 1.1  mrg
 1.1  mrg   CQ.w[0] += carry64;
 1.1  mrg #else
 1.1  mrg #ifdef IEEE_ROUND_NEAREST_TIES_AWAY
 1.1  mrg   // rounding
 1.1  mrg   // 2*CA4 - CY
 1.1  mrg   CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg   CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg   __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg   CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg
 1.1  mrg   D = (CA4r.w[1] | CA4r.w[0]) ? 0 : 1;
 1.1  mrg   carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) | D;
 1.1  mrg
 1.1  mrg   CQ.w[0] += carry64;
 1.1  mrg   if (CQ.w[0] < carry64)
 1.1  mrg     CQ.w[1]++;
 1.1  mrg #else
 1.1  mrg   rmode = rnd_mode;
 1.1  mrg   if (sign_x ^ sign_y && (unsigned) (rmode - 1) < 2)
 1.1  mrg     rmode = 3 - rmode;
 1.1  mrg   switch (rmode) {
 1.1  mrg   case ROUNDING_TO_NEAREST:	// round to nearest code
 1.1  mrg     // rounding
 1.1  mrg     // 2*CA4 - CY
 1.1  mrg     CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg     CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg     __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg     CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg     D = (CA4r.w[1] | CA4r.w[0]) ? 1 : 0;
 1.1  mrg     carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) & ((CQ.w[0]) | D);
 1.1  mrg     CQ.w[0] += carry64;
 1.1  mrg     if (CQ.w[0] < carry64)
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   case ROUNDING_TIES_AWAY:
 1.1  mrg     // rounding
 1.1  mrg     // 2*CA4 - CY
 1.1  mrg     CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg     CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg     __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg     CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg     D = (CA4r.w[1] | CA4r.w[0]) ? 0 : 1;
 1.1  mrg     carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) | D;
 1.1  mrg     CQ.w[0] += carry64;
 1.1  mrg     if (CQ.w[0] < carry64)
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   case ROUNDING_DOWN:
 1.1  mrg   case ROUNDING_TO_ZERO:
 1.1  mrg     break;
 1.1  mrg   default:	// rounding up
 1.1  mrg     CQ.w[0]++;
 1.1  mrg     if (!CQ.w[0])
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg     res =
 1.1  mrg       fast_get_BID64_check_OF (sign_x ^ sign_y, diff_expon, CQ.w[0], rnd_mode,
 1.1  mrg 			       pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   } else {
 1.1  mrg     // UF occurs
 1.1  mrg
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     if ((diff_expon + 16 < 0)) {
 1.1  mrg       // set status flags
 1.1  mrg       __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg     }
 1.1  mrg #endif
 1.1  mrg     rmode = rnd_mode;
 1.1  mrg     res =
 1.1  mrg       get_BID64_UF (sign_x ^ sign_y, diff_expon, CQ.w[0], CA4.w[1] | CA4.w[0], rmode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg
 1.1  mrg   }
 1.1  mrg
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg //#define LEAVE_TRAILING_ZEROS
 1.1  mrg
 1.1  mrg TYPE0_FUNCTION_ARG128_ARGTYPE2 (UINT64, bid64qd_div, x, UINT64, y)
 1.1  mrg
 1.1  mrg      UINT256 CA4 =
 1.1  mrg        { {0x0ull, 0x0ull, 0x0ull, 0x0ull} }, CA4r, P256, QB256;
 1.5  mrg UINT128 CX, CY, T128, CQ, CQ2, CR, CA, TP128, Qh, Tmp;
 1.1  mrg UINT64 sign_x, sign_y, T, carry64, D, Q_low, QX, PD, res, valid_y;
 1.1  mrg int_float fx, fy, f64;
 1.1  mrg UINT32 QX32, tdigit[3], digit, digit_h, digit_low;
 1.1  mrg int exponent_x, exponent_y, bin_index, bin_expon, diff_expon, ed2,
 1.1  mrg   digits_q, amount;
 1.1  mrg int nzeros, i, j, k, d5, done = 0;
 1.1  mrg unsigned rmode;
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg fexcept_t binaryflags = 0;
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg valid_y = unpack_BID64 (&sign_y, &exponent_y, &CY.w[0], (y));
 1.1  mrg
 1.1  mrg 	// unpack arguments, check for NaN or Infinity
 1.1  mrg if (!unpack_BID128_value (&sign_x, &exponent_x, &CX, x)) {
 1.1  mrg   // test if x is NaN
 1.1  mrg   if ((x.w[1] & 0x7c00000000000000ull) == 0x7c00000000000000ull) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     if ((x.w[1] & 0x7e00000000000000ull) == 0x7e00000000000000ull ||	// sNaN
 1.1  mrg 	(y & 0x7e00000000000000ull) == 0x7e00000000000000ull)
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg       Tmp.w[1] = (CX.w[1] & 0x00003fffffffffffull);
 1.1  mrg       Tmp.w[0] = CX.w[0];
 1.1  mrg       TP128 = reciprocals10_128[18];
 1.5  mrg       __mul_128x128_high (Qh, Tmp, TP128);
 1.1  mrg       amount = recip_scale[18];
 1.1  mrg       __shr_128 (Tmp, Qh, amount);
 1.1  mrg       res = (CX.w[1] & 0xfc00000000000000ull) | Tmp.w[0];
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // x is Infinity?
 1.1  mrg   if ((x.w[1] & 0x7800000000000000ull) == 0x7800000000000000ull) {
 1.1  mrg     // check if y is Inf.
 1.1  mrg     if (((y & 0x7c00000000000000ull) == 0x7800000000000000ull))
 1.1  mrg       // return NaN
 1.1  mrg     {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg       res = 0x7c00000000000000ull;
 1.1  mrg       BID_RETURN (res);
 1.1  mrg     }
 1.1  mrg 	if (((y & 0x7c00000000000000ull) != 0x7c00000000000000ull)) {
 1.1  mrg     // otherwise return +/-Inf
 1.1  mrg     res =
 1.1  mrg       ((x.w[1] ^ (y)) & 0x8000000000000000ull) | 0x7800000000000000ull;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg 	}
 1.1  mrg   }
 1.1  mrg   // x is 0
 1.1  mrg   if (((y & INFINITY_MASK64) != INFINITY_MASK64) &&
 1.1  mrg       !(CY.w[0])) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg     // x=y=0, return NaN
 1.1  mrg     res = 0x7c00000000000000ull;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // return 0
 1.1  mrg   if (((y & 0x7800000000000000ull) != 0x7800000000000000ull)) {
 1.1  mrg 	  if (!CY.w[0]) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg       res = 0x7c00000000000000ull;
 1.1  mrg       BID_RETURN (res);
 1.1  mrg 	  }
 1.1  mrg     exponent_x =
 1.1  mrg       exponent_x - exponent_y - DECIMAL_EXPONENT_BIAS_128 +
 1.1  mrg       (DECIMAL_EXPONENT_BIAS << 1);
 1.1  mrg     if (exponent_x > DECIMAL_MAX_EXPON_64)
 1.1  mrg       exponent_x = DECIMAL_MAX_EXPON_64;
 1.1  mrg     else if (exponent_x < 0)
 1.1  mrg       exponent_x = 0;
 1.1  mrg     res = (sign_x ^ sign_y) | (((UINT64) exponent_x) << 53);
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg }
 1.1  mrg CY.w[1] = 0;
 1.1  mrg if (!valid_y) {
 1.1  mrg   // y is Inf. or NaN
 1.1  mrg
 1.1  mrg   // test if y is NaN
 1.1  mrg   if ((y & NAN_MASK64) == NAN_MASK64) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     if ((y & SNAN_MASK64) == SNAN_MASK64)	// sNaN
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (CY.w[0] & QUIET_MASK64);
 1.1  mrg   }
 1.1  mrg   // y is Infinity?
 1.1  mrg   if (((y) & 0x7800000000000000ull) == 0x7800000000000000ull) {
 1.1  mrg     // return +/-0
 1.1  mrg     res = sign_x ^ sign_y;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // y is 0, return +/-Inf
 1.1  mrg   res =
 1.1  mrg     ((x.w[1] ^ (y)) & 0x8000000000000000ull) | 0x7800000000000000ull;
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   __set_status_flags (pfpsf, ZERO_DIVIDE_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg (void) fegetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg diff_expon =
 1.1  mrg   exponent_x - exponent_y - DECIMAL_EXPONENT_BIAS_128 +
 1.1  mrg   (DECIMAL_EXPONENT_BIAS << 1);
 1.1  mrg
 1.1  mrg if (__unsigned_compare_gt_128 (CY, CX)) {
 1.1  mrg   // CX < CY
 1.1  mrg
 1.1  mrg   // 2^64
 1.1  mrg   f64.i = 0x5f800000;
 1.1  mrg
 1.1  mrg   // fx ~ CX,   fy ~ CY
 1.1  mrg   fx.d = (float) CX.w[1] * f64.d + (float) CX.w[0];
 1.1  mrg   fy.d = (float) CY.w[1] * f64.d + (float) CY.w[0];
 1.1  mrg   // expon_cy - expon_cx
 1.1  mrg   bin_index = (fy.i - fx.i) >> 23;
 1.1  mrg
 1.1  mrg   if (CX.w[1]) {
 1.1  mrg     T = power10_index_binexp_128[bin_index].w[0];
 1.1  mrg     __mul_64x128_short (CA, T, CX);
 1.1  mrg   } else {
 1.1  mrg     T128 = power10_index_binexp_128[bin_index];
 1.1  mrg     __mul_64x128_short (CA, CX.w[0], T128);
 1.1  mrg   }
 1.1  mrg
 1.1  mrg   ed2 = 15;
 1.1  mrg   if (__unsigned_compare_gt_128 (CY, CA))
 1.1  mrg     ed2++;
 1.1  mrg
 1.1  mrg   T128 = power10_table_128[ed2];
 1.1  mrg   __mul_128x128_to_256 (CA4, CA, T128);
 1.1  mrg
 1.1  mrg   ed2 += estimate_decimal_digits[bin_index];
 1.1  mrg   CQ.w[0] = CQ.w[1] = 0;
 1.1  mrg   diff_expon = diff_expon - ed2;
 1.1  mrg
 1.1  mrg } else {
 1.1  mrg   // get CQ = CX/CY
 1.1  mrg   __div_128_by_128 (&CQ, &CR, CX, CY);
 1.1  mrg
 1.1  mrg   // get number of decimal digits in CQ
 1.1  mrg   // 2^64
 1.1  mrg   f64.i = 0x5f800000;
 1.1  mrg   fx.d = (float) CQ.w[1] * f64.d + (float) CQ.w[0];
 1.1  mrg   // binary expon. of CQ
 1.1  mrg   bin_expon = (fx.i - 0x3f800000) >> 23;
 1.1  mrg
 1.1  mrg   digits_q = estimate_decimal_digits[bin_expon];
 1.1  mrg   TP128.w[0] = power10_index_binexp_128[bin_expon].w[0];
 1.1  mrg   TP128.w[1] = power10_index_binexp_128[bin_expon].w[1];
 1.1  mrg   if (__unsigned_compare_ge_128 (CQ, TP128))
 1.1  mrg     digits_q++;
 1.1  mrg
 1.1  mrg   if (digits_q <= 16) {
 1.1  mrg     if (!CR.w[1] && !CR.w[0]) {
 1.1  mrg       res = get_BID64 (sign_x ^ sign_y, diff_expon,
 1.1  mrg 		       CQ.w[0], rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg       (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg       BID_RETURN (res);
 1.1  mrg     }
 1.1  mrg
 1.1  mrg     ed2 = 16 - digits_q;
 1.1  mrg     T128.w[0] = power10_table_128[ed2].w[0];
 1.1  mrg     __mul_64x128_to_192 (CA4, (T128.w[0]), CR);
 1.1  mrg     diff_expon = diff_expon - ed2;
 1.1  mrg     CQ.w[0] *= T128.w[0];
 1.1  mrg   } else {
 1.1  mrg     ed2 = digits_q - 16;
 1.1  mrg     diff_expon += ed2;
 1.1  mrg     T128 = reciprocals10_128[ed2];
 1.1  mrg     __mul_128x128_to_256 (P256, CQ, T128);
 1.1  mrg     amount = recip_scale[ed2];
 1.1  mrg     CQ.w[0] = (P256.w[2] >> amount) | (P256.w[3] << (64 - amount));
 1.1  mrg     CQ.w[1] = 0;
 1.1  mrg
 1.1  mrg     __mul_64x64_to_128 (CQ2, CQ.w[0], (power10_table_128[ed2].w[0]));
 1.1  mrg
 1.1  mrg     __mul_64x64_to_128 (QB256, CQ2.w[0], CY.w[0]);
 1.1  mrg     QB256.w[1] += CQ2.w[0] * CY.w[1] + CQ2.w[1] * CY.w[0];
 1.1  mrg
 1.1  mrg     CA4.w[1] = CX.w[1] - QB256.w[1];
 1.1  mrg     CA4.w[0] = CX.w[0] - QB256.w[0];
 1.1  mrg     if (CX.w[0] < QB256.w[0])
 1.1  mrg       CA4.w[1]--;
 1.1  mrg     if (CR.w[0] || CR.w[1])
 1.1  mrg       CA4.w[0] |= 1;
 1.1  mrg     done = 1;
 1.1  mrg 	if(CA4.w[1]|CA4.w[0]) {
 1.1  mrg     __mul_64x128_low(CY, (power10_table_128[ed2].w[0]),CY);
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg   }
 1.1  mrg
 1.1  mrg }
 1.1  mrg
 1.1  mrg if (!done) {
 1.1  mrg   __div_256_by_128 (&CQ, &CA4, CY);
 1.1  mrg }
 1.1  mrg
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   if (CA4.w[0] || CA4.w[1]) {
 1.1  mrg     // set status flags
 1.1  mrg     __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg   }
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   else
 1.1  mrg #endif
 1.1  mrg #else
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   if (!CA4.w[0] && !CA4.w[1])
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg     // check whether result is exact
 1.1  mrg   {
 1.1  mrg 	  if(!done) {
 1.1  mrg     // check whether CX, CY are short
 1.1  mrg     if (!CX.w[1] && !CY.w[1] && (CX.w[0] <= 1024) && (CY.w[0] <= 1024)) {
 1.1  mrg       i = (int) CY.w[0] - 1;
 1.1  mrg       j = (int) CX.w[0] - 1;
 1.1  mrg       // difference in powers of 2 factors for Y and X
 1.1  mrg       nzeros = ed2 - factors[i][0] + factors[j][0];
 1.1  mrg       // difference in powers of 5 factors
 1.1  mrg       d5 = ed2 - factors[i][1] + factors[j][1];
 1.1  mrg       if (d5 < nzeros)
 1.1  mrg 		nzeros = d5;
 1.1  mrg       // get P*(2^M[extra_digits])/10^extra_digits
 1.5  mrg       __mul_128x128_high (Qh, CQ, reciprocals10_128[nzeros]);
 1.1  mrg       //__mul_128x128_to_256(P256, CQ, reciprocals10_128[nzeros]);Qh.w[1]=P256.w[3];Qh.w[0]=P256.w[2];
 1.1  mrg
 1.1  mrg       // now get P/10^extra_digits: shift Q_high right by M[extra_digits]-128
 1.1  mrg       amount = recip_scale[nzeros];
 1.1  mrg       __shr_128_long (CQ, Qh, amount);
 1.1  mrg
 1.1  mrg       diff_expon += nzeros;
 1.1  mrg     } else {
 1.1  mrg       // decompose Q as Qh*10^17 + Ql
 1.1  mrg       //T128 = reciprocals10_128[17];
 1.1  mrg       Q_low = CQ.w[0];
 1.1  mrg
 1.1  mrg       {
 1.1  mrg 	tdigit[0] = Q_low & 0x3ffffff;
 1.1  mrg 	tdigit[1] = 0;
 1.1  mrg 	QX = Q_low >> 26;
 1.1  mrg 	QX32 = QX;
 1.1  mrg 	nzeros = 0;
 1.1  mrg
 1.1  mrg 	for (j = 0; QX32; j++, QX32 >>= 7) {
 1.1  mrg 	  k = (QX32 & 127);
 1.1  mrg 	  tdigit[0] += convert_table[j][k][0];
 1.1  mrg 	  tdigit[1] += convert_table[j][k][1];
 1.1  mrg 	  if (tdigit[0] >= 100000000) {
 1.1  mrg 	    tdigit[0] -= 100000000;
 1.1  mrg 	    tdigit[1]++;
 1.1  mrg 	  }
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	if (tdigit[1] >= 100000000) {
 1.1  mrg 	  tdigit[1] -= 100000000;
 1.1  mrg 	  if (tdigit[1] >= 100000000)
 1.1  mrg 	    tdigit[1] -= 100000000;
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	digit = tdigit[0];
 1.1  mrg 	if (!digit && !tdigit[1])
 1.1  mrg 	  nzeros += 16;
 1.1  mrg 	else {
 1.1  mrg 	  if (!digit) {
 1.1  mrg 	    nzeros += 8;
 1.1  mrg 	    digit = tdigit[1];
 1.1  mrg 	  }
 1.1  mrg 	  // decompose digit
 1.1  mrg 	  PD = (UINT64) digit *0x068DB8BBull;
 1.1  mrg 	  digit_h = (UINT32) (PD >> 40);
 1.1  mrg 	  digit_low = digit - digit_h * 10000;
 1.1  mrg
 1.1  mrg 	  if (!digit_low)
 1.1  mrg 	    nzeros += 4;
 1.1  mrg 	  else
 1.1  mrg 	    digit_h = digit_low;
 1.1  mrg
 1.1  mrg 	  if (!(digit_h & 1))
 1.1  mrg 	    nzeros +=
 1.1  mrg 	      3 & (UINT32) (packed_10000_zeros[digit_h >> 3] >>
 1.1  mrg 			    (digit_h & 7));
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	if (nzeros) {
 1.1  mrg 	  // get P*(2^M[extra_digits])/10^extra_digits
 1.5  mrg 	  __mul_128x128_high (Qh, CQ, reciprocals10_128[nzeros]);
 1.1  mrg
 1.1  mrg 	  // now get P/10^extra_digits: shift Q_high right by M[extra_digits]-128
 1.1  mrg 	  amount = recip_scale[nzeros];
 1.1  mrg 	  __shr_128 (CQ, Qh, amount);
 1.1  mrg 	}
 1.1  mrg 	diff_expon += nzeros;
 1.1  mrg
 1.1  mrg       }
 1.1  mrg     }
 1.1  mrg 	  }
 1.1  mrg 	if(diff_expon>=0){
 1.1  mrg     res =
 1.1  mrg       fast_get_BID64_check_OF (sign_x ^ sign_y, diff_expon, CQ.w[0],
 1.1  mrg 			       rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg 	}
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg   if (diff_expon >= 0) {
 1.1  mrg #ifdef IEEE_ROUND_NEAREST
 1.1  mrg   // rounding
 1.1  mrg   // 2*CA4 - CY
 1.1  mrg   CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg   CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg   __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg   CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg
 1.1  mrg   D = (CA4r.w[1] | CA4r.w[0]) ? 1 : 0;
 1.1  mrg   carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) & ((CQ.w[0]) | D);
 1.1  mrg
 1.1  mrg   CQ.w[0] += carry64;
 1.1  mrg   //if(CQ.w[0]<carry64)
 1.1  mrg   //CQ.w[1] ++;
 1.1  mrg #else
 1.1  mrg #ifdef IEEE_ROUND_NEAREST_TIES_AWAY
 1.1  mrg   // rounding
 1.1  mrg   // 2*CA4 - CY
 1.1  mrg   CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg   CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg   __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg   CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg
 1.1  mrg   D = (CA4r.w[1] | CA4r.w[0]) ? 0 : 1;
 1.1  mrg   carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) | D;
 1.1  mrg
 1.1  mrg   CQ.w[0] += carry64;
 1.1  mrg   if (CQ.w[0] < carry64)
 1.1  mrg     CQ.w[1]++;
 1.1  mrg #else
 1.1  mrg   rmode = rnd_mode;
 1.1  mrg   if (sign_x ^ sign_y && (unsigned) (rmode - 1) < 2)
 1.1  mrg     rmode = 3 - rmode;
 1.1  mrg   switch (rmode) {
 1.1  mrg   case ROUNDING_TO_NEAREST:	// round to nearest code
 1.1  mrg     // rounding
 1.1  mrg     // 2*CA4 - CY
 1.1  mrg     CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg     CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg     __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg     CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg     D = (CA4r.w[1] | CA4r.w[0]) ? 1 : 0;
 1.1  mrg     carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) & ((CQ.w[0]) | D);
 1.1  mrg     CQ.w[0] += carry64;
 1.1  mrg     if (CQ.w[0] < carry64)
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   case ROUNDING_TIES_AWAY:
 1.1  mrg     // rounding
 1.1  mrg     // 2*CA4 - CY
 1.1  mrg     CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg     CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg     __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg     CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg     D = (CA4r.w[1] | CA4r.w[0]) ? 0 : 1;
 1.1  mrg     carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) | D;
 1.1  mrg     CQ.w[0] += carry64;
 1.1  mrg     if (CQ.w[0] < carry64)
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   case ROUNDING_DOWN:
 1.1  mrg   case ROUNDING_TO_ZERO:
 1.1  mrg     break;
 1.1  mrg   default:	// rounding up
 1.1  mrg     CQ.w[0]++;
 1.1  mrg     if (!CQ.w[0])
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg
 1.1  mrg     res =
 1.1  mrg       fast_get_BID64_check_OF (sign_x ^ sign_y, diff_expon, CQ.w[0], rnd_mode,
 1.1  mrg 			       pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   } else {
 1.1  mrg     // UF occurs
 1.1  mrg
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     if ((diff_expon + 16 < 0)) {
 1.1  mrg       // set status flags
 1.1  mrg       __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg     }
 1.1  mrg #endif
 1.1  mrg     rmode = rnd_mode;
 1.1  mrg     res =
 1.1  mrg       get_BID64_UF (sign_x ^ sign_y, diff_expon, CQ.w[0], CA4.w[1] | CA4.w[0], rmode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg
 1.1  mrg   }
 1.1  mrg
 1.1  mrg }
 1.1  mrg
 1.1  mrg //#define LEAVE_TRAILING_ZEROS
 1.1  mrg
 1.1  mrg extern UINT32 convert_table[5][128][2];
 1.1  mrg extern SINT8 factors[][2];
 1.1  mrg extern UINT8 packed_10000_zeros[];
 1.1  mrg
 1.1  mrg
 1.1  mrg //UINT64* bid64_div128x128(UINT64 res, UINT128 *px, UINT128 *py, unsigned rnd_mode, unsigned *pfpsf)
 1.1  mrg
 1.1  mrg TYPE0_FUNCTION_ARG128_ARG128 (UINT64, bid64qq_div, x, y)
 1.1  mrg      UINT256 CA4 =
 1.1  mrg        { {0x0ull, 0x0ull, 0x0ull, 0x0ull} }, CA4r, P256, QB256;
 1.5  mrg UINT128 CX, CY, T128, CQ, CQ2, CR, CA, TP128, Qh, Tmp;
 1.1  mrg UINT64 sign_x, sign_y, T, carry64, D, Q_low, QX, valid_y, PD, res;
 1.1  mrg int_float fx, fy, f64;
 1.1  mrg UINT32 QX32, tdigit[3], digit, digit_h, digit_low;
 1.1  mrg int exponent_x, exponent_y, bin_index, bin_expon, diff_expon, ed2,
 1.1  mrg   digits_q, amount;
 1.1  mrg int nzeros, i, j, k, d5, done = 0;
 1.1  mrg unsigned rmode;
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg fexcept_t binaryflags = 0;
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg valid_y = unpack_BID128_value (&sign_y, &exponent_y, &CY, y);
 1.1  mrg
 1.1  mrg 	// unpack arguments, check for NaN or Infinity
 1.1  mrg if (!unpack_BID128_value (&sign_x, &exponent_x, &CX, x)) {
 1.1  mrg   // test if x is NaN
 1.1  mrg   if ((x.w[1] & 0x7c00000000000000ull) == 0x7c00000000000000ull) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     if ((x.w[1] & 0x7e00000000000000ull) == 0x7e00000000000000ull ||	// sNaN
 1.1  mrg 	(y.w[1] & 0x7e00000000000000ull) == 0x7e00000000000000ull)
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg       Tmp.w[1] = (CX.w[1] & 0x00003fffffffffffull);
 1.1  mrg       Tmp.w[0] = CX.w[0];
 1.1  mrg       TP128 = reciprocals10_128[18];
 1.5  mrg       __mul_128x128_high (Qh, Tmp, TP128);
 1.1  mrg       amount = recip_scale[18];
 1.1  mrg       __shr_128 (Tmp, Qh, amount);
 1.1  mrg       res = (CX.w[1] & 0xfc00000000000000ull) | Tmp.w[0];
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // x is Infinity?
 1.1  mrg   if ((x.w[1] & 0x7800000000000000ull) == 0x7800000000000000ull) {
 1.1  mrg     // check if y is Inf.
 1.1  mrg     if (((y.w[1] & 0x7c00000000000000ull) == 0x7800000000000000ull))
 1.1  mrg       // return NaN
 1.1  mrg     {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg       res = 0x7c00000000000000ull;
 1.1  mrg       BID_RETURN (res);
 1.1  mrg     }
 1.1  mrg 	if (((y.w[1] & 0x7c00000000000000ull) != 0x7c00000000000000ull)) {
 1.1  mrg     // otherwise return +/-Inf
 1.1  mrg     res =
 1.1  mrg       ((x.w[1] ^ y.
 1.1  mrg 	w[1]) & 0x8000000000000000ull) | 0x7800000000000000ull;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg 	}
 1.1  mrg   }
 1.1  mrg   // x is 0
 1.1  mrg   if (((y.w[1] & 0x7800000000000000ull) != 0x7800000000000000ull)) {
 1.1  mrg   if ((!CY.w[0]) && !(CY.w[1] & 0x0001ffffffffffffull)) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg     // x=y=0, return NaN
 1.1  mrg     res = 0x7c00000000000000ull;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // return 0
 1.1  mrg   res = (x.w[1] ^ y.w[1]) & 0x8000000000000000ull;
 1.1  mrg   exponent_x = exponent_x - exponent_y + DECIMAL_EXPONENT_BIAS;
 1.1  mrg   if (exponent_x > DECIMAL_MAX_EXPON_64)
 1.1  mrg     exponent_x = DECIMAL_MAX_EXPON_64;
 1.1  mrg   else if (exponent_x < 0)
 1.1  mrg     exponent_x = 0;
 1.1  mrg   res |= (((UINT64) exponent_x) << 53);
 1.1  mrg   BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg }
 1.1  mrg if (!valid_y) {
 1.1  mrg   // y is Inf. or NaN
 1.1  mrg
 1.1  mrg   // test if y is NaN
 1.1  mrg   if ((y.w[1] & 0x7c00000000000000ull) == 0x7c00000000000000ull) {
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     if ((y.w[1] & 0x7e00000000000000ull) == 0x7e00000000000000ull)	// sNaN
 1.1  mrg       __set_status_flags (pfpsf, INVALID_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg       Tmp.w[1] = (CY.w[1] & 0x00003fffffffffffull);
 1.1  mrg       Tmp.w[0] = CY.w[0];
 1.1  mrg       TP128 = reciprocals10_128[18];
 1.5  mrg       __mul_128x128_high (Qh, Tmp, TP128);
 1.1  mrg       amount = recip_scale[18];
 1.1  mrg       __shr_128 (Tmp, Qh, amount);
 1.1  mrg       res = (CY.w[1] & 0xfc00000000000000ull) | Tmp.w[0];
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // y is Infinity?
 1.1  mrg   if ((y.w[1] & 0x7800000000000000ull) == 0x7800000000000000ull) {
 1.1  mrg     // return +/-0
 1.1  mrg     res = sign_x ^ sign_y;
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   }
 1.1  mrg   // y is 0, return +/-Inf
 1.1  mrg   res =
 1.1  mrg     ((x.w[1] ^ y.w[1]) & 0x8000000000000000ull) | 0x7800000000000000ull;
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   __set_status_flags (pfpsf, ZERO_DIVIDE_EXCEPTION);
 1.1  mrg #endif
 1.1  mrg   BID_RETURN (res);
 1.1  mrg }
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg (void) fegetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg diff_expon = exponent_x - exponent_y + DECIMAL_EXPONENT_BIAS;
 1.1  mrg
 1.1  mrg if (__unsigned_compare_gt_128 (CY, CX)) {
 1.1  mrg   // CX < CY
 1.1  mrg
 1.1  mrg   // 2^64
 1.1  mrg   f64.i = 0x5f800000;
 1.1  mrg
 1.1  mrg   // fx ~ CX,   fy ~ CY
 1.1  mrg   fx.d = (float) CX.w[1] * f64.d + (float) CX.w[0];
 1.1  mrg   fy.d = (float) CY.w[1] * f64.d + (float) CY.w[0];
 1.1  mrg   // expon_cy - expon_cx
 1.1  mrg   bin_index = (fy.i - fx.i) >> 23;
 1.1  mrg
 1.1  mrg   if (CX.w[1]) {
 1.1  mrg     T = power10_index_binexp_128[bin_index].w[0];
 1.1  mrg     __mul_64x128_short (CA, T, CX);
 1.1  mrg   } else {
 1.1  mrg     T128 = power10_index_binexp_128[bin_index];
 1.1  mrg     __mul_64x128_short (CA, CX.w[0], T128);
 1.1  mrg   }
 1.1  mrg
 1.1  mrg   ed2 = 15;
 1.1  mrg   if (__unsigned_compare_gt_128 (CY, CA))
 1.1  mrg     ed2++;
 1.1  mrg
 1.1  mrg   T128 = power10_table_128[ed2];
 1.1  mrg   __mul_128x128_to_256 (CA4, CA, T128);
 1.1  mrg
 1.1  mrg   ed2 += estimate_decimal_digits[bin_index];
 1.1  mrg   CQ.w[0] = CQ.w[1] = 0;
 1.1  mrg   diff_expon = diff_expon - ed2;
 1.1  mrg
 1.1  mrg } else {
 1.1  mrg   // get CQ = CX/CY
 1.1  mrg   __div_128_by_128 (&CQ, &CR, CX, CY);
 1.1  mrg
 1.1  mrg   // get number of decimal digits in CQ
 1.1  mrg   // 2^64
 1.1  mrg   f64.i = 0x5f800000;
 1.1  mrg   fx.d = (float) CQ.w[1] * f64.d + (float) CQ.w[0];
 1.1  mrg   // binary expon. of CQ
 1.1  mrg   bin_expon = (fx.i - 0x3f800000) >> 23;
 1.1  mrg
 1.1  mrg   digits_q = estimate_decimal_digits[bin_expon];
 1.1  mrg   TP128.w[0] = power10_index_binexp_128[bin_expon].w[0];
 1.1  mrg   TP128.w[1] = power10_index_binexp_128[bin_expon].w[1];
 1.1  mrg   if (__unsigned_compare_ge_128 (CQ, TP128))
 1.1  mrg     digits_q++;
 1.1  mrg
 1.1  mrg   if (digits_q <= 16) {
 1.1  mrg     if (!CR.w[1] && !CR.w[0]) {
 1.1  mrg       res = get_BID64 (sign_x ^ sign_y, diff_expon,
 1.1  mrg 		       CQ.w[0], rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg       (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg       BID_RETURN (res);
 1.1  mrg     }
 1.1  mrg
 1.1  mrg     ed2 = 16 - digits_q;
 1.1  mrg     T128.w[0] = power10_table_128[ed2].w[0];
 1.1  mrg     __mul_64x128_to_192 (CA4, (T128.w[0]), CR);
 1.1  mrg     diff_expon = diff_expon - ed2;
 1.1  mrg     CQ.w[0] *= T128.w[0];
 1.1  mrg   } else {
 1.1  mrg     ed2 = digits_q - 16;
 1.1  mrg     diff_expon += ed2;
 1.1  mrg     T128 = reciprocals10_128[ed2];
 1.1  mrg     __mul_128x128_to_256 (P256, CQ, T128);
 1.1  mrg     amount = recip_scale[ed2];
 1.1  mrg     CQ.w[0] = (P256.w[2] >> amount) | (P256.w[3] << (64 - amount));
 1.1  mrg     CQ.w[1] = 0;
 1.1  mrg
 1.1  mrg     __mul_64x64_to_128 (CQ2, CQ.w[0], (power10_table_128[ed2].w[0]));
 1.1  mrg
 1.1  mrg     __mul_64x64_to_128 (QB256, CQ2.w[0], CY.w[0]);
 1.1  mrg     QB256.w[1] += CQ2.w[0] * CY.w[1] + CQ2.w[1] * CY.w[0];
 1.1  mrg
 1.1  mrg     CA4.w[1] = CX.w[1] - QB256.w[1];
 1.1  mrg     CA4.w[0] = CX.w[0] - QB256.w[0];
 1.1  mrg     if (CX.w[0] < QB256.w[0])
 1.1  mrg       CA4.w[1]--;
 1.1  mrg     if (CR.w[0] || CR.w[1])
 1.1  mrg       CA4.w[0] |= 1;
 1.1  mrg     done = 1;
 1.1  mrg 	if(CA4.w[1]|CA4.w[0]) {
 1.1  mrg     __mul_64x128_low(CY, (power10_table_128[ed2].w[0]),CY);
 1.1  mrg 	}
 1.1  mrg   }
 1.1  mrg
 1.1  mrg }
 1.1  mrg
 1.1  mrg if (!done) {
 1.1  mrg   __div_256_by_128 (&CQ, &CA4, CY);
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg   if (CA4.w[0] || CA4.w[1]) {
 1.1  mrg     // set status flags
 1.1  mrg     __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg   }
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   else
 1.1  mrg #endif
 1.1  mrg #else
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg   if (!CA4.w[0] && !CA4.w[1])
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg #ifndef LEAVE_TRAILING_ZEROS
 1.1  mrg     // check whether result is exact
 1.1  mrg   {
 1.1  mrg 	  if(!done) {
 1.1  mrg     // check whether CX, CY are short
 1.1  mrg     if (!CX.w[1] && !CY.w[1] && (CX.w[0] <= 1024) && (CY.w[0] <= 1024)) {
 1.1  mrg       i = (int) CY.w[0] - 1;
 1.1  mrg       j = (int) CX.w[0] - 1;
 1.1  mrg       // difference in powers of 2 factors for Y and X
 1.1  mrg       nzeros = ed2 - factors[i][0] + factors[j][0];
 1.1  mrg       // difference in powers of 5 factors
 1.1  mrg       d5 = ed2 - factors[i][1] + factors[j][1];
 1.1  mrg       if (d5 < nzeros)
 1.1  mrg 	nzeros = d5;
 1.1  mrg       // get P*(2^M[extra_digits])/10^extra_digits
 1.5  mrg       __mul_128x128_high (Qh, CQ, reciprocals10_128[nzeros]);
 1.1  mrg       //__mul_128x128_to_256(P256, CQ, reciprocals10_128[nzeros]);Qh.w[1]=P256.w[3];Qh.w[0]=P256.w[2];
 1.1  mrg
 1.1  mrg       // now get P/10^extra_digits: shift Q_high right by M[extra_digits]-128
 1.1  mrg       amount = recip_scale[nzeros];
 1.1  mrg       __shr_128_long (CQ, Qh, amount);
 1.1  mrg
 1.1  mrg       diff_expon += nzeros;
 1.1  mrg     } else {
 1.1  mrg       // decompose Q as Qh*10^17 + Ql
 1.1  mrg       //T128 = reciprocals10_128[17];
 1.1  mrg       Q_low = CQ.w[0];
 1.1  mrg
 1.1  mrg       {
 1.1  mrg 	tdigit[0] = Q_low & 0x3ffffff;
 1.1  mrg 	tdigit[1] = 0;
 1.1  mrg 	QX = Q_low >> 26;
 1.1  mrg 	QX32 = QX;
 1.1  mrg 	nzeros = 0;
 1.1  mrg
 1.1  mrg 	for (j = 0; QX32; j++, QX32 >>= 7) {
 1.1  mrg 	  k = (QX32 & 127);
 1.1  mrg 	  tdigit[0] += convert_table[j][k][0];
 1.1  mrg 	  tdigit[1] += convert_table[j][k][1];
 1.1  mrg 	  if (tdigit[0] >= 100000000) {
 1.1  mrg 	    tdigit[0] -= 100000000;
 1.1  mrg 	    tdigit[1]++;
 1.1  mrg 	  }
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	if (tdigit[1] >= 100000000) {
 1.1  mrg 	  tdigit[1] -= 100000000;
 1.1  mrg 	  if (tdigit[1] >= 100000000)
 1.1  mrg 	    tdigit[1] -= 100000000;
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	digit = tdigit[0];
 1.1  mrg 	if (!digit && !tdigit[1])
 1.1  mrg 	  nzeros += 16;
 1.1  mrg 	else {
 1.1  mrg 	  if (!digit) {
 1.1  mrg 	    nzeros += 8;
 1.1  mrg 	    digit = tdigit[1];
 1.1  mrg 	  }
 1.1  mrg 	  // decompose digit
 1.1  mrg 	  PD = (UINT64) digit *0x068DB8BBull;
 1.1  mrg 	  digit_h = (UINT32) (PD >> 40);
 1.1  mrg 	  digit_low = digit - digit_h * 10000;
 1.1  mrg
 1.1  mrg 	  if (!digit_low)
 1.1  mrg 	    nzeros += 4;
 1.1  mrg 	  else
 1.1  mrg 	    digit_h = digit_low;
 1.1  mrg
 1.1  mrg 	  if (!(digit_h & 1))
 1.1  mrg 	    nzeros +=
 1.1  mrg 	      3 & (UINT32) (packed_10000_zeros[digit_h >> 3] >>
 1.1  mrg 			    (digit_h & 7));
 1.1  mrg 	}
 1.1  mrg
 1.1  mrg 	if (nzeros) {
 1.1  mrg 	  // get P*(2^M[extra_digits])/10^extra_digits
 1.5  mrg 	  __mul_128x128_high (Qh, CQ, reciprocals10_128[nzeros]);
 1.1  mrg
 1.1  mrg 	  // now get P/10^extra_digits: shift Q_high right by M[extra_digits]-128
 1.1  mrg 	  amount = recip_scale[nzeros];
 1.1  mrg 	  __shr_128 (CQ, Qh, amount);
 1.1  mrg 	}
 1.1  mrg 	diff_expon += nzeros;
 1.1  mrg
 1.1  mrg       }
 1.1  mrg     }
 1.1  mrg 	  }
 1.1  mrg 	if(diff_expon>=0){
 1.1  mrg     res =
 1.1  mrg       fast_get_BID64_check_OF (sign_x ^ sign_y, diff_expon, CQ.w[0],
 1.1  mrg 			       rnd_mode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg 	}
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg   if(diff_expon>=0) {
 1.1  mrg
 1.1  mrg #ifdef IEEE_ROUND_NEAREST
 1.1  mrg   // rounding
 1.1  mrg   // 2*CA4 - CY
 1.1  mrg   CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg   CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg   __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg   CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg
 1.1  mrg   D = (CA4r.w[1] | CA4r.w[0]) ? 1 : 0;
 1.1  mrg   carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) & ((CQ.w[0]) | D);
 1.1  mrg
 1.1  mrg   CQ.w[0] += carry64;
 1.1  mrg   //if(CQ.w[0]<carry64)
 1.1  mrg   //CQ.w[1] ++;
 1.1  mrg #else
 1.1  mrg #ifdef IEEE_ROUND_NEAREST_TIES_AWAY
 1.1  mrg   // rounding
 1.1  mrg   // 2*CA4 - CY
 1.1  mrg   CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg   CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg   __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg   CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg
 1.1  mrg   D = (CA4r.w[1] | CA4r.w[0]) ? 0 : 1;
 1.1  mrg   carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) | D;
 1.1  mrg
 1.1  mrg   CQ.w[0] += carry64;
 1.1  mrg   if (CQ.w[0] < carry64)
 1.1  mrg     CQ.w[1]++;
 1.1  mrg #else
 1.1  mrg   rmode = rnd_mode;
 1.1  mrg   if (sign_x ^ sign_y && (unsigned) (rmode - 1) < 2)
 1.1  mrg     rmode = 3 - rmode;
 1.1  mrg   switch (rmode) {
 1.1  mrg   case ROUNDING_TO_NEAREST:	// round to nearest code
 1.1  mrg     // rounding
 1.1  mrg     // 2*CA4 - CY
 1.1  mrg     CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg     CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg     __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg     CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg     D = (CA4r.w[1] | CA4r.w[0]) ? 1 : 0;
 1.1  mrg     carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) & ((CQ.w[0]) | D);
 1.1  mrg     CQ.w[0] += carry64;
 1.1  mrg     if (CQ.w[0] < carry64)
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   case ROUNDING_TIES_AWAY:
 1.1  mrg     // rounding
 1.1  mrg     // 2*CA4 - CY
 1.1  mrg     CA4r.w[1] = (CA4.w[1] + CA4.w[1]) | (CA4.w[0] >> 63);
 1.1  mrg     CA4r.w[0] = CA4.w[0] + CA4.w[0];
 1.1  mrg     __sub_borrow_out (CA4r.w[0], carry64, CA4r.w[0], CY.w[0]);
 1.1  mrg     CA4r.w[1] = CA4r.w[1] - CY.w[1] - carry64;
 1.1  mrg     D = (CA4r.w[1] | CA4r.w[0]) ? 0 : 1;
 1.1  mrg     carry64 = (1 + (((SINT64) CA4r.w[1]) >> 63)) | D;
 1.1  mrg     CQ.w[0] += carry64;
 1.1  mrg     if (CQ.w[0] < carry64)
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   case ROUNDING_DOWN:
 1.1  mrg   case ROUNDING_TO_ZERO:
 1.1  mrg     break;
 1.1  mrg   default:	// rounding up
 1.1  mrg     CQ.w[0]++;
 1.1  mrg     if (!CQ.w[0])
 1.1  mrg       CQ.w[1]++;
 1.1  mrg     break;
 1.1  mrg   }
 1.1  mrg #endif
 1.1  mrg #endif
 1.1  mrg
 1.1  mrg
 1.1  mrg     res =
 1.1  mrg       fast_get_BID64_check_OF (sign_x ^ sign_y, diff_expon, CQ.w[0], rnd_mode,
 1.1  mrg 			       pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg   } else {
 1.1  mrg     // UF occurs
 1.1  mrg
 1.1  mrg #ifdef SET_STATUS_FLAGS
 1.1  mrg     if ((diff_expon + 16 < 0)) {
 1.1  mrg       // set status flags
 1.1  mrg       __set_status_flags (pfpsf, INEXACT_EXCEPTION);
 1.1  mrg     }
 1.1  mrg #endif
 1.1  mrg     rmode = rnd_mode;
 1.1  mrg     res =
 1.1  mrg       get_BID64_UF (sign_x ^ sign_y, diff_expon, CQ.w[0], CA4.w[1] | CA4.w[0], rmode, pfpsf);
 1.1  mrg #ifdef UNCHANGED_BINARY_STATUS_FLAGS
 1.1  mrg     (void) fesetexceptflag (&binaryflags, FE_ALL_FLAGS);
 1.1  mrg #endif
 1.1  mrg     BID_RETURN (res);
 1.1  mrg
 1.1  mrg   }
 1.1  mrg
 1.1  mrg }