mpn/generic/get_str.c

1.1  mrg /* mpn_get_str -- Convert {UP,USIZE} to a base BASE string in STR.
1.1  mrg
1.1  mrg    Contributed to the GNU project by Torbjorn Granlund.
1.1  mrg
1.1  mrg    THE FUNCTIONS IN THIS FILE, EXCEPT mpn_get_str, ARE INTERNAL WITH A MUTABLE
1.1  mrg    INTERFACE.  IT IS ONLY SAFE TO REACH THEM THROUGH DOCUMENTED INTERFACES.  IN
1.1  mrg    FACT, IT IS ALMOST GUARANTEED THAT THEY WILL CHANGE OR DISAPPEAR IN A FUTURE
1.1  mrg    GNU MP RELEASE.
1.1  mrg
1.1  mrg Copyright 1991, 1992, 1993, 1994, 1996, 2000, 2001, 2002, 2004, 2006, 2007,
1.1  mrg 2008 Free Software Foundation, Inc.
1.1  mrg
1.1  mrg This file is part of the GNU MP Library.
1.1  mrg
1.1  mrg The GNU MP Library is free software; you can redistribute it and/or modify
1.1  mrg it under the terms of the GNU Lesser General Public License as published by
1.1  mrg the Free Software Foundation; either version 3 of the License, or (at your
1.1  mrg option) any later version.
1.1  mrg
1.1  mrg The GNU MP Library is distributed in the hope that it will be useful, but
1.1  mrg WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
1.1  mrg or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
1.1  mrg License for more details.
1.1  mrg
1.1  mrg You should have received a copy of the GNU Lesser General Public License
1.1  mrg along with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.  */
1.1  mrg
1.1  mrg #include "gmp.h"
1.1  mrg #include "gmp-impl.h"
1.1  mrg #include "longlong.h"
1.1  mrg
1.1  mrg /* Conversion of U {up,un} to a string in base b.  Internally, we convert to
1.1  mrg    base B = b^m, the largest power of b that fits a limb.  Basic algorithms:
1.1  mrg
1.1  mrg   A) Divide U repeatedly by B, generating a quotient and remainder, until the
1.1  mrg      quotient becomes zero.  The remainders hold the converted digits.  Digits
1.1  mrg      come out from right to left.  (Used in mpn_sb_get_str.)
1.1  mrg
1.1  mrg   B) Divide U by b^g, for g such that 1/b <= U/b^g < 1, generating a fraction.
1.1  mrg      Then develop digits by multiplying the fraction repeatedly by b.  Digits
1.1  mrg      come out from left to right.  (Currently not used herein, except for in
1.1  mrg      code for converting single limbs to individual digits.)
1.1  mrg
1.1  mrg   C) Compute B^1, B^2, B^4, ..., B^s, for s such that B^s is just above
1.1  mrg      sqrt(U).  Then divide U by B^s, generating quotient and remainder.
1.1  mrg      Recursively convert the quotient, then the remainder, using the
1.1  mrg      precomputed powers.  Digits come out from left to right.  (Used in
1.1  mrg      mpn_dc_get_str.)
1.1  mrg
1.1  mrg   When using algorithm C, algorithm B might be suitable for basecase code,
1.1  mrg   since the required b^g power will be readily accessible.
1.1  mrg
1.1  mrg   Optimization ideas:
1.1  mrg   1. The recursive function of (C) could use less temporary memory.  The powtab
1.1  mrg      allocation could be trimmed with some computation, and the tmp area could
1.1  mrg      be reduced, or perhaps eliminated if up is reused for both quotient and
1.1  mrg      remainder (it is currently used just for remainder).
1.1  mrg   2. Store the powers of (C) in normalized form, with the normalization count.
1.1  mrg      Quotients will usually need to be left-shifted before each divide, and
1.1  mrg      remainders will either need to be left-shifted of right-shifted.
1.1  mrg   3. In the code for developing digits from a single limb, we could avoid using
1.1  mrg      a full umul_ppmm except for the first (or first few) digits, provided base
1.1  mrg      is even.  Subsequent digits can be developed using plain multiplication.
1.1  mrg      (This saves on register-starved machines (read x86) and on all machines
1.1  mrg      that generate the upper product half using a separate instruction (alpha,
1.1  mrg      powerpc, IA-64) or lacks such support altogether (sparc64, hppa64).
1.1  mrg   4. Separate mpn_dc_get_str basecase code from code for small conversions. The
1.1  mrg      former code will have the exact right power readily available in the
1.1  mrg      powtab parameter for dividing the current number into a fraction.  Convert
1.1  mrg      that using algorithm B.
1.1  mrg   5. Completely avoid division.  Compute the inverses of the powers now in
1.1  mrg      powtab instead of the actual powers.
1.1  mrg   6. Decrease powtab allocation for even bases.  E.g. for base 10 we could save
1.1  mrg      about 30% (1-log(5)/log(10)).
1.1  mrg
1.1  mrg   Basic structure of (C):
1.1  mrg     mpn_get_str:
1.1  mrg       if POW2_P (n)
1.1  mrg 	...
1.1  mrg       else
1.1  mrg 	if (un < GET_STR_PRECOMPUTE_THRESHOLD)
1.1  mrg 	  mpn_sb_get_str (str, base, up, un);
1.1  mrg 	else
1.1  mrg 	  precompute_power_tables
1.1  mrg 	  mpn_dc_get_str
1.1  mrg
1.1  mrg     mpn_dc_get_str:
1.1  mrg 	mpn_tdiv_qr
1.1  mrg 	if (qn < GET_STR_DC_THRESHOLD)
1.1  mrg 	  mpn_sb_get_str
1.1  mrg 	else
1.1  mrg 	  mpn_dc_get_str
1.1  mrg 	if (rn < GET_STR_DC_THRESHOLD)
1.1  mrg 	  mpn_sb_get_str
1.1  mrg 	else
1.1  mrg 	  mpn_dc_get_str
1.1  mrg
1.1  mrg
1.1  mrg   The reason for the two threshold values is the cost of
1.1  mrg   precompute_power_tables.  GET_STR_PRECOMPUTE_THRESHOLD will be considerably
1.1  mrg   larger than GET_STR_PRECOMPUTE_THRESHOLD.  */
1.1  mrg
1.1  mrg
1.1  mrg /* The x86s and m68020 have a quotient and remainder "div" instruction and
1.1  mrg    gcc recognises an adjacent "/" and "%" can be combined using that.
1.1  mrg    Elsewhere "/" and "%" are either separate instructions, or separate
1.1  mrg    libgcc calls (which unfortunately gcc as of version 3.0 doesn't combine).
1.1  mrg    A multiply and subtract should be faster than a "%" in those cases.  */
1.1  mrg #if HAVE_HOST_CPU_FAMILY_x86            \
1.1  mrg   || HAVE_HOST_CPU_m68020               \
1.1  mrg   || HAVE_HOST_CPU_m68030               \
1.1  mrg   || HAVE_HOST_CPU_m68040               \
1.1  mrg   || HAVE_HOST_CPU_m68060               \
1.1  mrg   || HAVE_HOST_CPU_m68360 /* CPU32 */
1.1  mrg #define udiv_qrnd_unnorm(q,r,n,d)       \
1.1  mrg   do {                                  \
1.1  mrg     mp_limb_t  __q = (n) / (d);         \
1.1  mrg     mp_limb_t  __r = (n) % (d);         \
1.1  mrg     (q) = __q;                          \
1.1  mrg     (r) = __r;                          \
1.1  mrg   } while (0)
1.1  mrg #else
1.1  mrg #define udiv_qrnd_unnorm(q,r,n,d)       \
1.1  mrg   do {                                  \
1.1  mrg     mp_limb_t  __q = (n) / (d);         \
1.1  mrg     mp_limb_t  __r = (n) - __q*(d);     \
1.1  mrg     (q) = __q;                          \
1.1  mrg     (r) = __r;                          \
1.1  mrg   } while (0)
1.1  mrg #endif
1.1  mrg
1.1  mrg
1.1  mrg /* Convert {up,un} to a string in base base, and put the result in str.
1.1  mrg    Generate len characters, possibly padding with zeros to the left.  If len is
1.1  mrg    zero, generate as many characters as required.  Return a pointer immediately
1.1  mrg    after the last digit of the result string.  Complexity is O(un^2); intended
1.1  mrg    for small conversions.  */
1.1  mrg static unsigned char *
1.1  mrg mpn_sb_get_str (unsigned char *str, size_t len,
1.1  mrg 		mp_ptr up, mp_size_t un, int base)
1.1  mrg {
1.1  mrg   mp_limb_t rl, ul;
1.1  mrg   unsigned char *s;
1.1  mrg   size_t l;
1.1  mrg   /* Allocate memory for largest possible string, given that we only get here
1.1  mrg      for operands with un < GET_STR_PRECOMPUTE_THRESHOLD and that the smallest
1.1  mrg      base is 3.  7/11 is an approximation to 1/log2(3).  */
1.1  mrg #if TUNE_PROGRAM_BUILD
1.1  mrg #define BUF_ALLOC (GET_STR_THRESHOLD_LIMIT * GMP_LIMB_BITS * 7 / 11)
1.1  mrg #else
1.1  mrg #define BUF_ALLOC (GET_STR_PRECOMPUTE_THRESHOLD * GMP_LIMB_BITS * 7 / 11)
1.1  mrg #endif
1.1  mrg   unsigned char buf[BUF_ALLOC];
1.1  mrg #if TUNE_PROGRAM_BUILD
1.1  mrg   mp_limb_t rp[GET_STR_THRESHOLD_LIMIT];
1.1  mrg #else
1.1  mrg   mp_limb_t rp[GET_STR_PRECOMPUTE_THRESHOLD];
1.1  mrg #endif
1.1  mrg
1.1  mrg   if (base == 10)
1.1  mrg     {
1.1  mrg       /* Special case code for base==10 so that the compiler has a chance to
1.1  mrg 	 optimize things.  */
1.1  mrg
1.1  mrg       MPN_COPY (rp + 1, up, un);
1.1  mrg
1.1  mrg       s = buf + BUF_ALLOC;
1.1  mrg       while (un > 1)
1.1  mrg 	{
1.1  mrg 	  int i;
1.1  mrg 	  mp_limb_t frac, digit;
1.1  mrg 	  MPN_DIVREM_OR_PREINV_DIVREM_1 (rp, (mp_size_t) 1, rp + 1, un,
1.1  mrg 					 MP_BASES_BIG_BASE_10,
1.1  mrg 					 MP_BASES_BIG_BASE_INVERTED_10,
1.1  mrg 					 MP_BASES_NORMALIZATION_STEPS_10);
1.1  mrg 	  un -= rp[un] == 0;
1.1  mrg 	  frac = (rp[0] + 1) << GMP_NAIL_BITS;
1.1  mrg 	  s -= MP_BASES_CHARS_PER_LIMB_10;
1.1  mrg #if HAVE_HOST_CPU_FAMILY_x86
1.1  mrg 	  /* The code below turns out to be a bit slower for x86 using gcc.
1.1  mrg 	     Use plain code.  */
1.1  mrg 	  i = MP_BASES_CHARS_PER_LIMB_10;
1.1  mrg 	  do
1.1  mrg 	    {
1.1  mrg 	      umul_ppmm (digit, frac, frac, 10);
1.1  mrg 	      *s++ = digit;
1.1  mrg 	    }
1.1  mrg 	  while (--i);
1.1  mrg #else
1.1  mrg 	  /* Use the fact that 10 in binary is 1010, with the lowest bit 0.
1.1  mrg 	     After a few umul_ppmm, we will have accumulated enough low zeros
1.1  mrg 	     to use a plain multiply.  */
1.1  mrg 	  if (MP_BASES_NORMALIZATION_STEPS_10 == 0)
1.1  mrg 	    {
1.1  mrg 	      umul_ppmm (digit, frac, frac, 10);
1.1  mrg 	      *s++ = digit;
1.1  mrg 	    }
1.1  mrg 	  if (MP_BASES_NORMALIZATION_STEPS_10 <= 1)
1.1  mrg 	    {
1.1  mrg 	      umul_ppmm (digit, frac, frac, 10);
1.1  mrg 	      *s++ = digit;
1.1  mrg 	    }
1.1  mrg 	  if (MP_BASES_NORMALIZATION_STEPS_10 <= 2)
1.1  mrg 	    {
1.1  mrg 	      umul_ppmm (digit, frac, frac, 10);
1.1  mrg 	      *s++ = digit;
1.1  mrg 	    }
1.1  mrg 	  if (MP_BASES_NORMALIZATION_STEPS_10 <= 3)
1.1  mrg 	    {
1.1  mrg 	      umul_ppmm (digit, frac, frac, 10);
1.1  mrg 	      *s++ = digit;
1.1  mrg 	    }
1.1  mrg 	  i = (MP_BASES_CHARS_PER_LIMB_10 - ((MP_BASES_NORMALIZATION_STEPS_10 < 4)
1.1  mrg 					     ? (4-MP_BASES_NORMALIZATION_STEPS_10)
1.1  mrg 					     : 0));
1.1  mrg 	  frac = (frac + 0xf) >> 4;
1.1  mrg 	  do
1.1  mrg 	    {
1.1  mrg 	      frac *= 10;
1.1  mrg 	      digit = frac >> (GMP_LIMB_BITS - 4);
1.1  mrg 	      *s++ = digit;
1.1  mrg 	      frac &= (~(mp_limb_t) 0) >> 4;
1.1  mrg 	    }
1.1  mrg 	  while (--i);
1.1  mrg #endif
1.1  mrg 	  s -= MP_BASES_CHARS_PER_LIMB_10;
1.1  mrg 	}
1.1  mrg
1.1  mrg       ul = rp[1];
1.1  mrg       while (ul != 0)
1.1  mrg 	{
1.1  mrg 	  udiv_qrnd_unnorm (ul, rl, ul, 10);
1.1  mrg 	  *--s = rl;
1.1  mrg 	}
1.1  mrg     }
1.1  mrg   else /* not base 10 */
1.1  mrg     {
1.1  mrg       unsigned chars_per_limb;
1.1  mrg       mp_limb_t big_base, big_base_inverted;
1.1  mrg       unsigned normalization_steps;
1.1  mrg
1.1  mrg       chars_per_limb = mp_bases[base].chars_per_limb;
1.1  mrg       big_base = mp_bases[base].big_base;
1.1  mrg       big_base_inverted = mp_bases[base].big_base_inverted;
1.1  mrg       count_leading_zeros (normalization_steps, big_base);
1.1  mrg
1.1  mrg       MPN_COPY (rp + 1, up, un);
1.1  mrg
1.1  mrg       s = buf + BUF_ALLOC;
1.1  mrg       while (un > 1)
1.1  mrg 	{
1.1  mrg 	  int i;
1.1  mrg 	  mp_limb_t frac;
1.1  mrg 	  MPN_DIVREM_OR_PREINV_DIVREM_1 (rp, (mp_size_t) 1, rp + 1, un,
1.1  mrg 					 big_base, big_base_inverted,
1.1  mrg 					 normalization_steps);
1.1  mrg 	  un -= rp[un] == 0;
1.1  mrg 	  frac = (rp[0] + 1) << GMP_NAIL_BITS;
1.1  mrg 	  s -= chars_per_limb;
1.1  mrg 	  i = chars_per_limb;
1.1  mrg 	  do
1.1  mrg 	    {
1.1  mrg 	      mp_limb_t digit;
1.1  mrg 	      umul_ppmm (digit, frac, frac, base);
1.1  mrg 	      *s++ = digit;
1.1  mrg 	    }
1.1  mrg 	  while (--i);
1.1  mrg 	  s -= chars_per_limb;
1.1  mrg 	}
1.1  mrg
1.1  mrg       ul = rp[1];
1.1  mrg       while (ul != 0)
1.1  mrg 	{
1.1  mrg 	  udiv_qrnd_unnorm (ul, rl, ul, base);
1.1  mrg 	  *--s = rl;
1.1  mrg 	}
1.1  mrg     }
1.1  mrg
1.1  mrg   l = buf + BUF_ALLOC - s;
1.1  mrg   while (l < len)
1.1  mrg     {
1.1  mrg       *str++ = 0;
1.1  mrg       len--;
1.1  mrg     }
1.1  mrg   while (l != 0)
1.1  mrg     {
1.1  mrg       *str++ = *s++;
1.1  mrg       l--;
1.1  mrg     }
1.1  mrg   return str;
1.1  mrg }
1.1  mrg
1.1  mrg
1.1  mrg /* Convert {UP,UN} to a string with a base as represented in POWTAB, and put
1.1  mrg    the string in STR.  Generate LEN characters, possibly padding with zeros to
1.1  mrg    the left.  If LEN is zero, generate as many characters as required.
1.1  mrg    Return a pointer immediately after the last digit of the result string.
1.1  mrg    This uses divide-and-conquer and is intended for large conversions.  */
1.1  mrg static unsigned char *
1.1  mrg mpn_dc_get_str (unsigned char *str, size_t len,
1.1  mrg 		mp_ptr up, mp_size_t un,
1.1  mrg 		const powers_t *powtab, mp_ptr tmp)
1.1  mrg {
1.1  mrg   if (BELOW_THRESHOLD (un, GET_STR_DC_THRESHOLD))
1.1  mrg     {
1.1  mrg       if (un != 0)
1.1  mrg 	str = mpn_sb_get_str (str, len, up, un, powtab->base);
1.1  mrg       else
1.1  mrg 	{
1.1  mrg 	  while (len != 0)
1.1  mrg 	    {
1.1  mrg 	      *str++ = 0;
1.1  mrg 	      len--;
1.1  mrg 	    }
1.1  mrg 	}
1.1  mrg     }
1.1  mrg   else
1.1  mrg     {
1.1  mrg       mp_ptr pwp, qp, rp;
1.1  mrg       mp_size_t pwn, qn;
1.1  mrg       mp_size_t sn;
1.1  mrg
1.1  mrg       pwp = powtab->p;
1.1  mrg       pwn = powtab->n;
1.1  mrg       sn = powtab->shift;
1.1  mrg
1.1  mrg       if (un < pwn + sn || (un == pwn + sn && mpn_cmp (up + sn, pwp, un - sn) < 0))
1.1  mrg 	{
1.1  mrg 	  str = mpn_dc_get_str (str, len, up, un, powtab - 1, tmp);
1.1  mrg 	}
1.1  mrg       else
1.1  mrg 	{
1.1  mrg 	  qp = tmp;		/* (un - pwn + 1) limbs for qp */
1.1  mrg 	  rp = up;		/* pwn limbs for rp; overwrite up area */
1.1  mrg
1.1  mrg 	  mpn_tdiv_qr (qp, rp + sn, 0L, up + sn, un - sn, pwp, pwn);
1.1  mrg 	  qn = un - sn - pwn; qn += qp[qn] != 0;		/* quotient size */
1.1  mrg
1.1  mrg 	  ASSERT (qn < pwn + sn || (qn == pwn + sn && mpn_cmp (qp + sn, pwp, pwn) < 0));
1.1  mrg
1.1  mrg 	  if (len != 0)
1.1  mrg 	    len = len - powtab->digits_in_base;
1.1  mrg
1.1  mrg 	  str = mpn_dc_get_str (str, len, qp, qn, powtab - 1, tmp + qn);
1.1  mrg 	  str = mpn_dc_get_str (str, powtab->digits_in_base, rp, pwn + sn, powtab - 1, tmp);
1.1  mrg 	}
1.1  mrg     }
1.1  mrg   return str;
1.1  mrg }
1.1  mrg
1.1  mrg
1.1  mrg /* There are no leading zeros on the digits generated at str, but that's not
1.1  mrg    currently a documented feature.  */
1.1  mrg
1.1  mrg size_t
1.1  mrg mpn_get_str (unsigned char *str, int base, mp_ptr up, mp_size_t un)
1.1  mrg {
1.1  mrg   mp_ptr powtab_mem, powtab_mem_ptr;
1.1  mrg   mp_limb_t big_base;
1.1  mrg   size_t digits_in_base;
1.1  mrg   powers_t powtab[GMP_LIMB_BITS];
1.1  mrg   int pi;
1.1  mrg   mp_size_t n;
1.1  mrg   mp_ptr p, t;
1.1  mrg   size_t out_len;
1.1  mrg   mp_ptr tmp;
1.1  mrg   TMP_DECL;
1.1  mrg
1.1  mrg   /* Special case zero, as the code below doesn't handle it.  */
1.1  mrg   if (un == 0)
1.1  mrg     {
1.1  mrg       str[0] = 0;
1.1  mrg       return 1;
1.1  mrg     }
1.1  mrg
1.1  mrg   if (POW2_P (base))
1.1  mrg     {
1.1  mrg       /* The base is a power of 2.  Convert from most significant end.  */
1.1  mrg       mp_limb_t n1, n0;
1.1  mrg       int bits_per_digit = mp_bases[base].big_base;
1.1  mrg       int cnt;
1.1  mrg       int bit_pos;
1.1  mrg       mp_size_t i;
1.1  mrg       unsigned char *s = str;
1.1  mrg       mp_bitcnt_t bits;
1.1  mrg
1.1  mrg       n1 = up[un - 1];
1.1  mrg       count_leading_zeros (cnt, n1);
1.1  mrg
1.1  mrg       /* BIT_POS should be R when input ends in least significant nibble,
1.1  mrg 	 R + bits_per_digit * n when input ends in nth least significant
1.1  mrg 	 nibble. */
1.1  mrg
1.1  mrg       bits = (mp_bitcnt_t) GMP_NUMB_BITS * un - cnt + GMP_NAIL_BITS;
1.1  mrg       cnt = bits % bits_per_digit;
1.1  mrg       if (cnt != 0)
1.1  mrg 	bits += bits_per_digit - cnt;
1.1  mrg       bit_pos = bits - (mp_bitcnt_t) (un - 1) * GMP_NUMB_BITS;
1.1  mrg
1.1  mrg       /* Fast loop for bit output.  */
1.1  mrg       i = un - 1;
1.1  mrg       for (;;)
1.1  mrg 	{
1.1  mrg 	  bit_pos -= bits_per_digit;
1.1  mrg 	  while (bit_pos >= 0)
1.1  mrg 	    {
1.1  mrg 	      *s++ = (n1 >> bit_pos) & ((1 << bits_per_digit) - 1);
1.1  mrg 	      bit_pos -= bits_per_digit;
1.1  mrg 	    }
1.1  mrg 	  i--;
1.1  mrg 	  if (i < 0)
1.1  mrg 	    break;
1.1  mrg 	  n0 = (n1 << -bit_pos) & ((1 << bits_per_digit) - 1);
1.1  mrg 	  n1 = up[i];
1.1  mrg 	  bit_pos += GMP_NUMB_BITS;
1.1  mrg 	  *s++ = n0 | (n1 >> bit_pos);
1.1  mrg 	}
1.1  mrg
1.1  mrg       return s - str;
1.1  mrg     }
1.1  mrg
1.1  mrg   /* General case.  The base is not a power of 2.  */
1.1  mrg
1.1  mrg   if (BELOW_THRESHOLD (un, GET_STR_PRECOMPUTE_THRESHOLD))
1.1  mrg     return mpn_sb_get_str (str, (size_t) 0, up, un, base) - str;
1.1  mrg
1.1  mrg   TMP_MARK;
1.1  mrg
1.1  mrg   /* Allocate one large block for the powers of big_base.  */
1.1  mrg   powtab_mem = TMP_BALLOC_LIMBS (mpn_dc_get_str_powtab_alloc (un));
1.1  mrg   powtab_mem_ptr = powtab_mem;
1.1  mrg
1.1  mrg   /* Compute a table of powers, were the largest power is >= sqrt(U).  */
1.1  mrg
1.1  mrg   big_base = mp_bases[base].big_base;
1.1  mrg   digits_in_base = mp_bases[base].chars_per_limb;
1.1  mrg
1.1  mrg   {
1.1  mrg     mp_size_t n_pows, xn, pn, exptab[GMP_LIMB_BITS], bexp;
1.1  mrg     mp_limb_t cy;
1.1  mrg     mp_size_t shift;
1.1  mrg
1.1  mrg     n_pows = 0;
1.1  mrg     xn = 1 + un*(mp_bases[base].chars_per_bit_exactly*GMP_NUMB_BITS)/mp_bases[base].chars_per_limb;
1.1  mrg     for (pn = xn; pn != 1; pn = (pn + 1) >> 1)
1.1  mrg       {
1.1  mrg 	exptab[n_pows] = pn;
1.1  mrg 	n_pows++;
1.1  mrg       }
1.1  mrg     exptab[n_pows] = 1;
1.1  mrg
1.1  mrg     powtab[0].p = &big_base;
1.1  mrg     powtab[0].n = 1;
1.1  mrg     powtab[0].digits_in_base = digits_in_base;
1.1  mrg     powtab[0].base = base;
1.1  mrg     powtab[0].shift = 0;
1.1  mrg
1.1  mrg     powtab[1].p = powtab_mem_ptr;  powtab_mem_ptr += 2;
1.1  mrg     powtab[1].p[0] = big_base;
1.1  mrg     powtab[1].n = 1;
1.1  mrg     powtab[1].digits_in_base = digits_in_base;
1.1  mrg     powtab[1].base = base;
1.1  mrg     powtab[1].shift = 0;
1.1  mrg
1.1  mrg     n = 1;
1.1  mrg     p = &big_base;
1.1  mrg     bexp = 1;
1.1  mrg     shift = 0;
1.1  mrg     for (pi = 2; pi < n_pows; pi++)
1.1  mrg       {
1.1  mrg 	t = powtab_mem_ptr;
1.1  mrg 	powtab_mem_ptr += 2 * n + 2;
1.1  mrg
1.1  mrg 	ASSERT_ALWAYS (powtab_mem_ptr < powtab_mem + mpn_dc_get_str_powtab_alloc (un));
1.1  mrg
1.1  mrg 	mpn_sqr (t, p, n);
1.1  mrg
1.1  mrg 	digits_in_base *= 2;
1.1  mrg 	n *= 2;  n -= t[n - 1] == 0;
1.1  mrg 	bexp *= 2;
1.1  mrg
1.1  mrg 	if (bexp + 1 < exptab[n_pows - pi])
1.1  mrg 	  {
1.1  mrg 	    digits_in_base += mp_bases[base].chars_per_limb;
1.1  mrg 	    cy = mpn_mul_1 (t, t, n, big_base);
1.1  mrg 	    t[n] = cy;
1.1  mrg 	    n += cy != 0;
1.1  mrg 	    bexp += 1;
1.1  mrg 	  }
1.1  mrg 	shift *= 2;
1.1  mrg 	/* Strip low zero limbs.  */
1.1  mrg 	while (t[0] == 0)
1.1  mrg 	  {
1.1  mrg 	    t++;
1.1  mrg 	    n--;
1.1  mrg 	    shift++;
1.1  mrg 	  }
1.1  mrg 	p = t;
1.1  mrg 	powtab[pi].p = p;
1.1  mrg 	powtab[pi].n = n;
1.1  mrg 	powtab[pi].digits_in_base = digits_in_base;
1.1  mrg 	powtab[pi].base = base;
1.1  mrg 	powtab[pi].shift = shift;
1.1  mrg       }
1.1  mrg
1.1  mrg     for (pi = 1; pi < n_pows; pi++)
1.1  mrg       {
1.1  mrg 	t = powtab[pi].p;
1.1  mrg 	n = powtab[pi].n;
1.1  mrg 	cy = mpn_mul_1 (t, t, n, big_base);
1.1  mrg 	t[n] = cy;
1.1  mrg 	n += cy != 0;
1.1  mrg 	if (t[0] == 0)
1.1  mrg 	  {
1.1  mrg 	    powtab[pi].p = t + 1;
1.1  mrg 	    n--;
1.1  mrg 	    powtab[pi].shift++;
1.1  mrg 	  }
1.1  mrg 	powtab[pi].n = n;
1.1  mrg 	powtab[pi].digits_in_base += mp_bases[base].chars_per_limb;
1.1  mrg       }
1.1  mrg
1.1  mrg #if 0
1.1  mrg     { int i;
1.1  mrg       printf ("Computed table values for base=%d, un=%d, xn=%d:\n", base, un, xn);
1.1  mrg       for (i = 0; i < n_pows; i++)
1.1  mrg 	printf ("%2d: %10ld %10ld %11ld %ld\n", i, exptab[n_pows-i], powtab[i].n, powtab[i].digits_in_base, powtab[i].shift);
1.1  mrg     }
1.1  mrg #endif
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Using our precomputed powers, now in powtab[], convert our number.  */
1.1  mrg   tmp = TMP_BALLOC_LIMBS (mpn_dc_get_str_itch (un));
1.1  mrg   out_len = mpn_dc_get_str (str, 0, up, un, powtab - 1 + pi, tmp) - str;
1.1  mrg   TMP_FREE;

           return out_len;
         }