mpn/generic/perfpow.c

1.1  mrg /* mpn_perfect_power_p -- mpn perfect power detection.
1.1  mrg
1.1  mrg    Contributed to the GNU project by Martin Boij.
1.1  mrg
1.1  mrg Copyright 2009, 2010 Free Software Foundation, Inc.
1.1  mrg
1.1  mrg This file is part of the GNU MP Library.
1.1  mrg
1.1  mrg The GNU MP Library is free software; you can redistribute it and/or modify
1.1  mrg it under the terms of the GNU Lesser General Public License as published by
1.1  mrg the Free Software Foundation; either version 3 of the License, or (at your
1.1  mrg option) any later version.
1.1  mrg
1.1  mrg The GNU MP Library is distributed in the hope that it will be useful, but
1.1  mrg WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
1.1  mrg or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
1.1  mrg License for more details.
1.1  mrg
1.1  mrg You should have received a copy of the GNU Lesser General Public License
1.1  mrg along with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.  */
1.1  mrg
1.1  mrg #include "gmp.h"
1.1  mrg #include "gmp-impl.h"
1.1  mrg #include "longlong.h"
1.1  mrg
1.1  mrg #define SMALL 20
1.1  mrg #define MEDIUM 100
1.1  mrg
1.1  mrg /*
1.1  mrg    Returns non-zero if {np,nn} == {xp,xn} ^ k.
1.1  mrg    Algorithm:
1.1  mrg        For s = 1, 2, 4, ..., s_max, compute the s least significant
1.1  mrg        limbs of {xp,xn}^k. Stop if they don't match the s least
1.1  mrg        significant limbs of {np,nn}.
1.1  mrg */
1.1  mrg static int
1.1  mrg pow_equals (mp_srcptr np, mp_size_t nn,
1.1  mrg 	    mp_srcptr xp,mp_size_t xn,
1.1  mrg 	    mp_limb_t k, mp_bitcnt_t f,
1.1  mrg 	    mp_ptr tp)
1.1  mrg {
1.1  mrg   mp_limb_t *tp2;
1.1  mrg   mp_bitcnt_t y, z, count;
1.1  mrg   mp_size_t i, bn;
1.1  mrg   int ans;
1.1  mrg   mp_limb_t h, l;
1.1  mrg   TMP_DECL;
1.1  mrg
1.1  mrg   ASSERT (nn > 1 || (nn == 1 && np[0] > 1));
1.1  mrg   ASSERT (np[nn - 1] > 0);
1.1  mrg   ASSERT (xn > 0);
1.1  mrg
1.1  mrg   if (xn == 1 && xp[0] == 1)
1.1  mrg     return 0;
1.1  mrg
1.1  mrg   z = 1 + (nn >> 1);
1.1  mrg   for (bn = 1; bn < z; bn <<= 1)
1.1  mrg     {
1.1  mrg       mpn_powlo (tp, xp, &k, 1, bn, tp + bn);
1.1  mrg       if (mpn_cmp (tp, np, bn) != 0)
1.1  mrg 	return 0;
1.1  mrg     }
1.1  mrg
1.1  mrg   TMP_MARK;
1.1  mrg
1.1  mrg   /* Final check. Estimate the size of {xp,xn}^k before computing
1.1  mrg      the power with full precision.
1.1  mrg      Optimization: It might pay off to make a more accurate estimation of
1.1  mrg      the logarithm of {xp,xn}, rather than using the index of the MSB.
1.1  mrg   */
1.1  mrg
1.1  mrg   count_leading_zeros (count, xp[xn - 1]);
1.1  mrg   y = xn * GMP_LIMB_BITS - count - 1;  /* msb_index (xp, xn) */
1.1  mrg
1.1  mrg   umul_ppmm (h, l, k, y);
1.1  mrg   h -= l == 0;  l--;	/* two-limb decrement */
1.1  mrg
1.1  mrg   z = f - 1; /* msb_index (np, nn) */
1.1  mrg   if (h == 0 && l <= z)
1.1  mrg     {
1.1  mrg       mp_limb_t size;
1.1  mrg       size = l + k;
1.1  mrg       ASSERT_ALWAYS (size >= k);
1.1  mrg
1.1  mrg       y = 2 + size / GMP_LIMB_BITS;
1.1  mrg       tp2 = TMP_ALLOC_LIMBS (y);
1.1  mrg
1.1  mrg       i = mpn_pow_1 (tp, xp, xn, k, tp2);
1.1  mrg       if (i == nn && mpn_cmp (tp, np, nn) == 0)
1.1  mrg 	ans = 1;
1.1  mrg       else
1.1  mrg 	ans = 0;
1.1  mrg     }
1.1  mrg   else
1.1  mrg     {
1.1  mrg       ans = 0;
1.1  mrg     }
1.1  mrg
1.1  mrg   TMP_FREE;
1.1  mrg   return ans;
1.1  mrg }
1.1  mrg
1.1  mrg /*
1.1  mrg    Computes rp such that rp^k * yp = 1 (mod 2^b).
1.1  mrg    Algorithm:
1.1  mrg        Apply Hensel lifting repeatedly, each time
1.1  mrg        doubling (approx.) the number of known bits in rp.
1.1  mrg */
1.1  mrg static void
1.1  mrg binv_root (mp_ptr rp, mp_srcptr yp,
1.1  mrg 	   mp_limb_t k, mp_size_t bn,
1.1  mrg 	   mp_bitcnt_t b, mp_ptr tp)
1.1  mrg {
1.1  mrg   mp_limb_t *tp2 = tp + bn, *tp3 = tp + 2 * bn, di, k2 = k + 1;
1.1  mrg   mp_bitcnt_t order[GMP_LIMB_BITS * 2];
1.1  mrg   int i, d = 0;
1.1  mrg
1.1  mrg   ASSERT (bn > 0);
1.1  mrg   ASSERT (b > 0);
1.1  mrg   ASSERT ((k & 1) != 0);
1.1  mrg
1.1  mrg   binvert_limb (di, k);
1.1  mrg
1.1  mrg   rp[0] = 1;
1.1  mrg   for (; b != 1; b = (b + 1) >> 1)
1.1  mrg     order[d++] = b;
1.1  mrg
1.1  mrg   for (i = d - 1; i >= 0; i--)
1.1  mrg     {
1.1  mrg       b = order[i];
1.1  mrg       bn = 1 + (b - 1) / GMP_LIMB_BITS;
1.1  mrg
1.1  mrg       mpn_mul_1 (tp, rp, bn, k2);
1.1  mrg
1.1  mrg       mpn_powlo (tp2, rp, &k2, 1, bn, tp3);
1.1  mrg       mpn_mullo_n (rp, yp, tp2, bn);
1.1  mrg
1.1  mrg       mpn_sub_n (tp2, tp, rp, bn);
1.1  mrg       mpn_pi1_bdiv_q_1 (rp, tp2, bn, k, di, 0);
1.1  mrg       if ((b % GMP_LIMB_BITS) != 0)
1.1  mrg 	rp[(b - 1) / GMP_LIMB_BITS] &= (((mp_limb_t) 1) << (b % GMP_LIMB_BITS)) - 1;
1.1  mrg     }
1.1  mrg   return;
1.1  mrg }
1.1  mrg
1.1  mrg /*
1.1  mrg    Computes rp such that rp^2 * yp = 1 (mod 2^{b+1}).
1.1  mrg    Returns non-zero if such an integer rp exists.
1.1  mrg */
1.1  mrg static int
1.1  mrg binv_sqroot (mp_ptr rp, mp_srcptr yp,
1.1  mrg 	     mp_size_t bn, mp_bitcnt_t b,
1.1  mrg 	     mp_ptr tp)
1.1  mrg {
1.1  mrg   mp_limb_t k = 3, *tp2 = tp + bn, *tp3 = tp + (bn << 1);
1.1  mrg   mp_bitcnt_t order[GMP_LIMB_BITS * 2];
1.1  mrg   int i, d = 0;
1.1  mrg
1.1  mrg   ASSERT (bn > 0);
1.1  mrg   ASSERT (b > 0);
1.1  mrg
1.1  mrg   rp[0] = 1;
1.1  mrg   if (b == 1)
1.1  mrg     {
1.1  mrg       if ((yp[0] & 3) != 1)
1.1  mrg 	return 0;
1.1  mrg     }
1.1  mrg   else
1.1  mrg     {
1.1  mrg       if ((yp[0] & 7) != 1)
1.1  mrg 	return 0;
1.1  mrg
1.1  mrg       for (; b != 2; b = (b + 2) >> 1)
1.1  mrg 	order[d++] = b;
1.1  mrg
1.1  mrg       for (i = d - 1; i >= 0; i--)
1.1  mrg 	{
1.1  mrg 	  b = order[i];
1.1  mrg 	  bn = 1 + b / GMP_LIMB_BITS;
1.1  mrg
1.1  mrg 	  mpn_mul_1 (tp, rp, bn, k);
1.1  mrg
1.1  mrg 	  mpn_powlo (tp2, rp, &k, 1, bn, tp3);
1.1  mrg 	  mpn_mullo_n (rp, yp, tp2, bn);
1.1  mrg
1.1  mrg #if HAVE_NATIVE_mpn_rsh1sub_n
1.1  mrg 	  mpn_rsh1sub_n (rp, tp, rp, bn);
1.1  mrg #else
1.1  mrg 	  mpn_sub_n (tp2, tp, rp, bn);
1.1  mrg 	  mpn_rshift (rp, tp2, bn, 1);
1.1  mrg #endif
1.1  mrg 	  rp[b / GMP_LIMB_BITS] &= (((mp_limb_t) 1) << (b % GMP_LIMB_BITS)) - 1;
1.1  mrg 	}
1.1  mrg     }
1.1  mrg   return 1;
1.1  mrg }
1.1  mrg
1.1  mrg /*
1.1  mrg    Returns non-zero if {np,nn} is a kth power.
1.1  mrg */
1.1  mrg static int
1.1  mrg is_kth_power (mp_ptr rp, mp_srcptr np,
1.1  mrg 	      mp_limb_t k, mp_srcptr yp,
1.1  mrg 	      mp_size_t nn, mp_bitcnt_t f,
1.1  mrg 	      mp_ptr tp)
1.1  mrg {
1.1  mrg   mp_limb_t x, c;
1.1  mrg   mp_bitcnt_t b;
1.1  mrg   mp_size_t i, rn, xn;
1.1  mrg
1.1  mrg   ASSERT (nn > 0);
1.1  mrg   ASSERT (((k & 1) != 0) || (k == 2));
1.1  mrg   ASSERT ((np[0] & 1) != 0);
1.1  mrg
1.1  mrg   if (k == 2)
1.1  mrg     {
1.1  mrg       b = (f + 1) >> 1;
1.1  mrg       rn = 1 + b / GMP_LIMB_BITS;
1.1  mrg       if (binv_sqroot (rp, yp, rn, b, tp) != 0)
1.1  mrg 	{
1.1  mrg 	  xn = rn;
1.1  mrg 	  MPN_NORMALIZE (rp, xn);
1.1  mrg 	  if (pow_equals (np, nn, rp, xn, k, f, tp) != 0)
1.1  mrg 	    return 1;
1.1  mrg
1.1  mrg 	  /* Check if (2^b - rp)^2 == np */
1.1  mrg 	  c = 0;
1.1  mrg 	  for (i = 0; i < rn; i++)
1.1  mrg 	    {
1.1  mrg 	      x = rp[i];
1.1  mrg 	      rp[i] = -x - c;
1.1  mrg 	      c |= (x != 0);
1.1  mrg 	    }
1.1  mrg 	  rp[rn - 1] &= (((mp_limb_t) 1) << (b % GMP_LIMB_BITS)) - 1;
1.1  mrg 	  MPN_NORMALIZE (rp, rn);
1.1  mrg 	  if (pow_equals (np, nn, rp, rn, k, f, tp) != 0)
1.1  mrg 	    return 1;
1.1  mrg 	}
1.1  mrg     }
1.1  mrg   else
1.1  mrg     {
1.1  mrg       b = 1 + (f - 1) / k;
1.1  mrg       rn = 1 + (b - 1) / GMP_LIMB_BITS;
1.1  mrg       binv_root (rp, yp, k, rn, b, tp);
1.1  mrg       MPN_NORMALIZE (rp, rn);
1.1  mrg       if (pow_equals (np, nn, rp, rn, k, f, tp) != 0)
1.1  mrg 	return 1;
1.1  mrg     }
1.1  mrg   MPN_ZERO (rp, rn); /* Untrash rp */
1.1  mrg   return 0;
1.1  mrg }
1.1  mrg
1.1  mrg static int
1.1  mrg perfpow (mp_srcptr np, mp_size_t nn,
1.1  mrg 	 mp_limb_t ub, mp_limb_t g,
1.1  mrg 	 mp_bitcnt_t f, int neg)
1.1  mrg {
1.1  mrg   mp_limb_t *yp, *tp, k = 0, *rp1;
1.1  mrg   int ans = 0;
1.1  mrg   mp_bitcnt_t b;
1.1  mrg   gmp_primesieve_t ps;
1.1  mrg   TMP_DECL;
1.1  mrg
1.1  mrg   ASSERT (nn > 0);
1.1  mrg   ASSERT ((np[0] & 1) != 0);
1.1  mrg   ASSERT (ub > 0);
1.1  mrg
1.1  mrg   TMP_MARK;
1.1  mrg   gmp_init_primesieve (&ps);
1.1  mrg   b = (f + 3) >> 1;
1.1  mrg
1.1  mrg   yp = TMP_ALLOC_LIMBS (nn);
1.1  mrg   rp1 = TMP_ALLOC_LIMBS (nn);
1.1  mrg   tp = TMP_ALLOC_LIMBS (5 * nn);	/* FIXME */
1.1  mrg   MPN_ZERO (rp1, nn);
1.1  mrg
1.1  mrg   mpn_binvert (yp, np, 1 + (b - 1) / GMP_LIMB_BITS, tp);
1.1  mrg   if (b % GMP_LIMB_BITS)
1.1  mrg     yp[(b - 1) / GMP_LIMB_BITS] &= (((mp_limb_t) 1) << (b % GMP_LIMB_BITS)) - 1;
1.1  mrg
1.1  mrg   if (neg)
1.1  mrg     gmp_nextprime (&ps);
1.1  mrg
1.1  mrg   if (g > 0)
1.1  mrg     {
1.1  mrg       ub = MIN (ub, g + 1);
1.1  mrg       while ((k = gmp_nextprime (&ps)) < ub)
1.1  mrg 	{
1.1  mrg 	  if ((g % k) == 0)
1.1  mrg 	    {
1.1  mrg 	      if (is_kth_power (rp1, np, k, yp, nn, f, tp) != 0)
1.1  mrg 		{
1.1  mrg 		  ans = 1;
1.1  mrg 		  goto ret;
1.1  mrg 		}
1.1  mrg 	    }
1.1  mrg 	}
1.1  mrg     }
1.1  mrg   else
1.1  mrg     {
1.1  mrg       while ((k = gmp_nextprime (&ps)) < ub)
1.1  mrg 	{
1.1  mrg 	  if (is_kth_power (rp1, np, k, yp, nn, f, tp) != 0)
1.1  mrg 	    {
1.1  mrg 	      ans = 1;
1.1  mrg 	      goto ret;
1.1  mrg 	    }
1.1  mrg 	}
1.1  mrg     }
1.1  mrg  ret:
1.1  mrg   TMP_FREE;
1.1  mrg   return ans;
1.1  mrg }
1.1  mrg
1.1  mrg static const unsigned short nrtrial[] = { 100, 500, 1000 };
1.1  mrg
1.1  mrg /* Table of (log_{p_i} 2) values, where p_i is
1.1  mrg    the (nrtrial[i] + 1)'th prime number.
1.1  mrg */
1.1  mrg static const double logs[] = { 0.1099457228193620, 0.0847016403115322, 0.0772048195144415 };
1.1  mrg
1.1  mrg int
1.1  mrg mpn_perfect_power_p (mp_srcptr np, mp_size_t nn)
1.1  mrg {
1.1  mrg   mp_size_t ncn, s, pn, xn;
1.1  mrg   mp_limb_t *nc, factor, g = 0;
1.1  mrg   mp_limb_t exp, *prev, *next, d, l, r, c, *tp, cry;
1.1  mrg   mp_bitcnt_t twos = 0, count;
1.1  mrg   int ans, where = 0, neg = 0, trial;
1.1  mrg   TMP_DECL;
1.1  mrg
1.1  mrg   nc = (mp_ptr) np;
1.1  mrg
1.1  mrg   if (nn < 0)
1.1  mrg     {
1.1  mrg       neg = 1;
1.1  mrg       nn = -nn;
1.1  mrg     }
1.1  mrg
1.1  mrg   if (nn == 0 || (nn == 1 && np[0] == 1))
1.1  mrg     return 1;
1.1  mrg
1.1  mrg   TMP_MARK;
1.1  mrg
1.1  mrg   ncn = nn;
1.1  mrg   twos = mpn_scan1 (np, 0);
1.1  mrg   if (twos > 0)
1.1  mrg     {
1.1  mrg       if (twos == 1)
1.1  mrg 	{
1.1  mrg 	  ans = 0;
1.1  mrg 	  goto ret;
1.1  mrg 	}
1.1  mrg       s = twos / GMP_LIMB_BITS;
1.1  mrg       if (s + 1 == nn && POW2_P (np[s]))
1.1  mrg 	{
1.1  mrg 	  ans = ! (neg && POW2_P (twos));
1.1  mrg 	  goto ret;
1.1  mrg 	}
1.1  mrg       count = twos % GMP_LIMB_BITS;
1.1  mrg       ncn = nn - s;
1.1  mrg       nc = TMP_ALLOC_LIMBS (ncn);
1.1  mrg       if (count > 0)
1.1  mrg 	{
1.1  mrg 	  mpn_rshift (nc, np + s, ncn, count);
1.1  mrg 	  ncn -= (nc[ncn - 1] == 0);
1.1  mrg 	}
1.1  mrg       else
1.1  mrg 	{
1.1  mrg 	  MPN_COPY (nc, np + s, ncn);
1.1  mrg 	}
1.1  mrg       g = twos;
1.1  mrg     }
1.1  mrg
1.1  mrg   if (ncn <= SMALL)
1.1  mrg     trial = 0;
1.1  mrg   else if (ncn <= MEDIUM)
1.1  mrg     trial = 1;
1.1  mrg   else
1.1  mrg     trial = 2;
1.1  mrg
1.1  mrg   factor = mpn_trialdiv (nc, ncn, nrtrial[trial], &where);
1.1  mrg
1.1  mrg   if (factor != 0)
1.1  mrg     {
1.1  mrg       if (twos == 0)
1.1  mrg 	{
1.1  mrg 	  nc = TMP_ALLOC_LIMBS (ncn);
1.1  mrg 	  MPN_COPY (nc, np, ncn);
1.1  mrg 	}
1.1  mrg
1.1  mrg       /* Remove factors found by trialdiv.
1.1  mrg 	 Optimization: Perhaps better to use
1.1  mrg 	 the strategy in mpz_remove ().
1.1  mrg       */
1.1  mrg       prev = TMP_ALLOC_LIMBS (ncn + 2);
1.1  mrg       next = TMP_ALLOC_LIMBS (ncn + 2);
1.1  mrg       tp = TMP_ALLOC_LIMBS (4 * ncn);
1.1  mrg
1.1  mrg       do
1.1  mrg 	{
1.1  mrg 	  binvert_limb (d, factor);
1.1  mrg 	  prev[0] = d;
1.1  mrg 	  pn = 1;
1.1  mrg 	  exp = 1;
1.1  mrg 	  while (2 * pn - 1 <= ncn)
1.1  mrg 	    {
1.1  mrg 	      mpn_sqr (next, prev, pn);
1.1  mrg 	      xn = 2 * pn;
1.1  mrg 	      xn -= (next[xn - 1] == 0);
1.1  mrg
1.1  mrg 	      if (mpn_divisible_p (nc, ncn, next, xn) == 0)
1.1  mrg 		break;
1.1  mrg
1.1  mrg 	      exp <<= 1;
1.1  mrg 	      pn = xn;
1.1  mrg 	      MP_PTR_SWAP (next, prev);
1.1  mrg 	    }
1.1  mrg
1.1  mrg 	  /* Binary search for the exponent */
1.1  mrg 	  l = exp + 1;
1.1  mrg 	  r = 2 * exp - 1;
1.1  mrg 	  while (l <= r)
1.1  mrg 	    {
1.1  mrg 	      c = (l + r) >> 1;
1.1  mrg 	      if (c - exp > 1)
1.1  mrg 		{
1.1  mrg 		  xn = mpn_pow_1 (tp, &d, 1, c - exp, next);
1.1  mrg 		  if (pn + xn - 1 > ncn)
1.1  mrg 		    {
1.1  mrg 		      r = c - 1;
1.1  mrg 		      continue;
1.1  mrg 		    }
1.1  mrg 		  mpn_mul (next, prev, pn, tp, xn);
1.1  mrg 		  xn += pn;
1.1  mrg 		  xn -= (next[xn - 1] == 0);
1.1  mrg 		}
1.1  mrg 	      else
1.1  mrg 		{
1.1  mrg 		  cry = mpn_mul_1 (next, prev, pn, d);
1.1  mrg 		  next[pn] = cry;
1.1  mrg 		  xn = pn + (cry != 0);
1.1  mrg 		}
1.1  mrg
1.1  mrg 	      if (mpn_divisible_p (nc, ncn, next, xn) == 0)
1.1  mrg 		{
1.1  mrg 		  r = c - 1;
1.1  mrg 		}
1.1  mrg 	      else
1.1  mrg 		{
1.1  mrg 		  exp = c;
1.1  mrg 		  l = c + 1;
1.1  mrg 		  MP_PTR_SWAP (next, prev);
1.1  mrg 		  pn = xn;
1.1  mrg 		}
1.1  mrg 	    }
1.1  mrg
1.1  mrg 	  if (g == 0)
1.1  mrg 	    g = exp;
1.1  mrg 	  else
1.1  mrg 	    g = mpn_gcd_1 (&g, 1, exp);
1.1  mrg
1.1  mrg 	  if (g == 1)
1.1  mrg 	    {
1.1  mrg 	      ans = 0;
1.1  mrg 	      goto ret;
1.1  mrg 	    }
1.1  mrg
1.1  mrg 	  mpn_divexact (next, nc, ncn, prev, pn);
1.1  mrg 	  ncn = ncn - pn;
1.1  mrg 	  ncn += next[ncn] != 0;
1.1  mrg 	  MPN_COPY (nc, next, ncn);
1.1  mrg
1.1  mrg 	  if (ncn == 1 && nc[0] == 1)
1.1  mrg 	    {
1.1  mrg 	      ans = ! (neg && POW2_P (g));
1.1  mrg 	      goto ret;
1.1  mrg 	    }
1.1  mrg
1.1  mrg 	  factor = mpn_trialdiv (nc, ncn, nrtrial[trial], &where);
1.1  mrg 	}
1.1  mrg       while (factor != 0);
1.1  mrg     }
1.1  mrg
1.1  mrg   count_leading_zeros (count, nc[ncn-1]);
1.1  mrg   count = GMP_LIMB_BITS * ncn - count;   /* log (nc) + 1 */
1.1  mrg   d = (mp_limb_t) (count * logs[trial] + 1e-9) + 1;
1.1  mrg   ans = perfpow (nc, ncn, d, g, count, neg);
1.1  mrg
1.1  mrg  ret:
1.1  mrg   TMP_FREE;
1.1  mrg   return ans;
1.1  mrg }