mpn/generic/perfpow.c

    1.1  mrg /* mpn_perfect_power_p -- mpn perfect power detection.
    1.1  mrg
    1.1  mrg    Contributed to the GNU project by Martin Boij.
    1.1  mrg
1.1.1.3  mrg Copyright 2009, 2010, 2012, 2014 Free Software Foundation, Inc.
    1.1  mrg
    1.1  mrg This file is part of the GNU MP Library.
    1.1  mrg
    1.1  mrg The GNU MP Library is free software; you can redistribute it and/or modify
1.1.1.3  mrg it under the terms of either:
1.1.1.3  mrg
1.1.1.3  mrg   * the GNU Lesser General Public License as published by the Free
1.1.1.3  mrg     Software Foundation; either version 3 of the License, or (at your
1.1.1.3  mrg     option) any later version.
1.1.1.3  mrg
1.1.1.3  mrg or
1.1.1.3  mrg
1.1.1.3  mrg   * the GNU General Public License as published by the Free Software
1.1.1.3  mrg     Foundation; either version 2 of the License, or (at your option) any
1.1.1.3  mrg     later version.
1.1.1.3  mrg
1.1.1.3  mrg or both in parallel, as here.
    1.1  mrg
    1.1  mrg The GNU MP Library is distributed in the hope that it will be useful, but
    1.1  mrg WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
1.1.1.3  mrg or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
1.1.1.3  mrg for more details.
    1.1  mrg
1.1.1.3  mrg You should have received copies of the GNU General Public License and the
1.1.1.3  mrg GNU Lesser General Public License along with the GNU MP Library.  If not,
1.1.1.3  mrg see https://www.gnu.org/licenses/.  */
    1.1  mrg
    1.1  mrg #include "gmp-impl.h"
    1.1  mrg #include "longlong.h"
    1.1  mrg
    1.1  mrg #define SMALL 20
    1.1  mrg #define MEDIUM 100
    1.1  mrg
1.1.1.2  mrg /* Return non-zero if {np,nn} == {xp,xn} ^ k.
    1.1  mrg    Algorithm:
1.1.1.2  mrg        For s = 1, 2, 4, ..., s_max, compute the s least significant limbs of
1.1.1.2  mrg        {xp,xn}^k. Stop if they don't match the s least significant limbs of
1.1.1.2  mrg        {np,nn}.
1.1.1.2  mrg
1.1.1.2  mrg    FIXME: Low xn limbs can be expected to always match, if computed as a mod
1.1.1.2  mrg    B^{xn} root. So instead of using mpn_powlo, compute an approximation of the
1.1.1.2  mrg    most significant (normalized) limb of {xp,xn} ^ k (and an error bound), and
1.1.1.2  mrg    compare to {np, nn}. Or use an even cruder approximation based on fix-point
1.1.1.2  mrg    base 2 logarithm.  */
    1.1  mrg static int
1.1.1.2  mrg pow_equals (mp_srcptr np, mp_size_t n,
    1.1  mrg 	    mp_srcptr xp,mp_size_t xn,
    1.1  mrg 	    mp_limb_t k, mp_bitcnt_t f,
    1.1  mrg 	    mp_ptr tp)
    1.1  mrg {
1.1.1.2  mrg   mp_bitcnt_t y, z;
1.1.1.3  mrg   mp_size_t bn;
    1.1  mrg   mp_limb_t h, l;
    1.1  mrg
1.1.1.2  mrg   ASSERT (n > 1 || (n == 1 && np[0] > 1));
1.1.1.2  mrg   ASSERT (np[n - 1] > 0);
    1.1  mrg   ASSERT (xn > 0);
    1.1  mrg
    1.1  mrg   if (xn == 1 && xp[0] == 1)
    1.1  mrg     return 0;
    1.1  mrg
1.1.1.2  mrg   z = 1 + (n >> 1);
    1.1  mrg   for (bn = 1; bn < z; bn <<= 1)
    1.1  mrg     {
    1.1  mrg       mpn_powlo (tp, xp, &k, 1, bn, tp + bn);
    1.1  mrg       if (mpn_cmp (tp, np, bn) != 0)
    1.1  mrg 	return 0;
    1.1  mrg     }
    1.1  mrg
1.1.1.2  mrg   /* Final check. Estimate the size of {xp,xn}^k before computing the power
1.1.1.2  mrg      with full precision.  Optimization: It might pay off to make a more
1.1.1.2  mrg      accurate estimation of the logarithm of {xp,xn}, rather than using the
1.1.1.2  mrg      index of the MSB.  */
    1.1  mrg
1.1.1.2  mrg   MPN_SIZEINBASE_2EXP(y, xp, xn, 1);
1.1.1.2  mrg   y -= 1;  /* msb_index (xp, xn) */
    1.1  mrg
    1.1  mrg   umul_ppmm (h, l, k, y);
1.1.1.3  mrg   h -= l == 0;  --l;	/* two-limb decrement */
    1.1  mrg
1.1.1.2  mrg   z = f - 1; /* msb_index (np, n) */
    1.1  mrg   if (h == 0 && l <= z)
    1.1  mrg     {
1.1.1.3  mrg       mp_limb_t *tp2;
1.1.1.3  mrg       mp_size_t i;
1.1.1.3  mrg       int ans;
    1.1  mrg       mp_limb_t size;
1.1.1.3  mrg       TMP_DECL;
1.1.1.3  mrg
    1.1  mrg       size = l + k;
    1.1  mrg       ASSERT_ALWAYS (size >= k);
    1.1  mrg
1.1.1.3  mrg       TMP_MARK;
    1.1  mrg       y = 2 + size / GMP_LIMB_BITS;
    1.1  mrg       tp2 = TMP_ALLOC_LIMBS (y);
    1.1  mrg
    1.1  mrg       i = mpn_pow_1 (tp, xp, xn, k, tp2);
1.1.1.2  mrg       if (i == n && mpn_cmp (tp, np, n) == 0)
    1.1  mrg 	ans = 1;
    1.1  mrg       else
    1.1  mrg 	ans = 0;
1.1.1.3  mrg       TMP_FREE;
1.1.1.3  mrg       return ans;
    1.1  mrg     }
    1.1  mrg
1.1.1.3  mrg   return 0;
    1.1  mrg }
    1.1  mrg
    1.1  mrg
1.1.1.2  mrg /* Return non-zero if N = {np,n} is a kth power.
1.1.1.2  mrg    I = {ip,n} = N^(-1) mod B^n.  */
    1.1  mrg static int
    1.1  mrg is_kth_power (mp_ptr rp, mp_srcptr np,
1.1.1.2  mrg 	      mp_limb_t k, mp_srcptr ip,
1.1.1.2  mrg 	      mp_size_t n, mp_bitcnt_t f,
    1.1  mrg 	      mp_ptr tp)
    1.1  mrg {
    1.1  mrg   mp_bitcnt_t b;
1.1.1.2  mrg   mp_size_t rn, xn;
    1.1  mrg
1.1.1.2  mrg   ASSERT (n > 0);
1.1.1.2  mrg   ASSERT ((k & 1) != 0 || k == 2);
    1.1  mrg   ASSERT ((np[0] & 1) != 0);
    1.1  mrg
    1.1  mrg   if (k == 2)
    1.1  mrg     {
    1.1  mrg       b = (f + 1) >> 1;
    1.1  mrg       rn = 1 + b / GMP_LIMB_BITS;
1.1.1.2  mrg       if (mpn_bsqrtinv (rp, ip, b, tp) != 0)
    1.1  mrg 	{
1.1.1.2  mrg 	  rp[rn - 1] &= (CNST_LIMB(1) << (b % GMP_LIMB_BITS)) - 1;
    1.1  mrg 	  xn = rn;
    1.1  mrg 	  MPN_NORMALIZE (rp, xn);
1.1.1.2  mrg 	  if (pow_equals (np, n, rp, xn, k, f, tp) != 0)
    1.1  mrg 	    return 1;
    1.1  mrg
1.1.1.2  mrg 	  /* Check if (2^b - r)^2 == n */
1.1.1.2  mrg 	  mpn_neg (rp, rp, rn);
1.1.1.2  mrg 	  rp[rn - 1] &= (CNST_LIMB(1) << (b % GMP_LIMB_BITS)) - 1;
    1.1  mrg 	  MPN_NORMALIZE (rp, rn);
1.1.1.2  mrg 	  if (pow_equals (np, n, rp, rn, k, f, tp) != 0)
    1.1  mrg 	    return 1;
    1.1  mrg 	}
    1.1  mrg     }
    1.1  mrg   else
    1.1  mrg     {
    1.1  mrg       b = 1 + (f - 1) / k;
    1.1  mrg       rn = 1 + (b - 1) / GMP_LIMB_BITS;
1.1.1.2  mrg       mpn_brootinv (rp, ip, rn, k, tp);
1.1.1.2  mrg       if ((b % GMP_LIMB_BITS) != 0)
1.1.1.2  mrg 	rp[rn - 1] &= (CNST_LIMB(1) << (b % GMP_LIMB_BITS)) - 1;
    1.1  mrg       MPN_NORMALIZE (rp, rn);
1.1.1.2  mrg       if (pow_equals (np, n, rp, rn, k, f, tp) != 0)
    1.1  mrg 	return 1;
    1.1  mrg     }
    1.1  mrg   MPN_ZERO (rp, rn); /* Untrash rp */
    1.1  mrg   return 0;
    1.1  mrg }
    1.1  mrg
    1.1  mrg static int
1.1.1.2  mrg perfpow (mp_srcptr np, mp_size_t n,
    1.1  mrg 	 mp_limb_t ub, mp_limb_t g,
    1.1  mrg 	 mp_bitcnt_t f, int neg)
    1.1  mrg {
1.1.1.2  mrg   mp_ptr ip, tp, rp;
1.1.1.2  mrg   mp_limb_t k;
1.1.1.2  mrg   int ans;
    1.1  mrg   mp_bitcnt_t b;
    1.1  mrg   gmp_primesieve_t ps;
    1.1  mrg   TMP_DECL;
    1.1  mrg
1.1.1.2  mrg   ASSERT (n > 0);
    1.1  mrg   ASSERT ((np[0] & 1) != 0);
    1.1  mrg   ASSERT (ub > 0);
    1.1  mrg
    1.1  mrg   TMP_MARK;
    1.1  mrg   gmp_init_primesieve (&ps);
    1.1  mrg   b = (f + 3) >> 1;
    1.1  mrg
1.1.1.3  mrg   TMP_ALLOC_LIMBS_3 (ip, n, rp, n, tp, 5 * n);
1.1.1.3  mrg
1.1.1.2  mrg   MPN_ZERO (rp, n);
1.1.1.2  mrg
1.1.1.2  mrg   /* FIXME: It seems the inverse in ninv is needed only to get non-inverted
1.1.1.2  mrg      roots. I.e., is_kth_power computes n^{1/2} as (n^{-1})^{-1/2} and
1.1.1.2  mrg      similarly for nth roots. It should be more efficient to compute n^{1/2} as
1.1.1.2  mrg      n * n^{-1/2}, with a mullo instead of a binvert. And we can do something
1.1.1.2  mrg      similar for kth roots if we switch to an iteration converging to n^{1/k -
1.1.1.2  mrg      1}, and we can then eliminate this binvert call. */
1.1.1.2  mrg   mpn_binvert (ip, np, 1 + (b - 1) / GMP_LIMB_BITS, tp);
    1.1  mrg   if (b % GMP_LIMB_BITS)
1.1.1.2  mrg     ip[(b - 1) / GMP_LIMB_BITS] &= (CNST_LIMB(1) << (b % GMP_LIMB_BITS)) - 1;
    1.1  mrg
    1.1  mrg   if (neg)
    1.1  mrg     gmp_nextprime (&ps);
    1.1  mrg
1.1.1.2  mrg   ans = 0;
    1.1  mrg   if (g > 0)
    1.1  mrg     {
    1.1  mrg       ub = MIN (ub, g + 1);
    1.1  mrg       while ((k = gmp_nextprime (&ps)) < ub)
    1.1  mrg 	{
    1.1  mrg 	  if ((g % k) == 0)
    1.1  mrg 	    {
1.1.1.2  mrg 	      if (is_kth_power (rp, np, k, ip, n, f, tp) != 0)
    1.1  mrg 		{
    1.1  mrg 		  ans = 1;
    1.1  mrg 		  goto ret;
    1.1  mrg 		}
    1.1  mrg 	    }
    1.1  mrg 	}
    1.1  mrg     }
    1.1  mrg   else
    1.1  mrg     {
    1.1  mrg       while ((k = gmp_nextprime (&ps)) < ub)
    1.1  mrg 	{
1.1.1.2  mrg 	  if (is_kth_power (rp, np, k, ip, n, f, tp) != 0)
    1.1  mrg 	    {
    1.1  mrg 	      ans = 1;
    1.1  mrg 	      goto ret;
    1.1  mrg 	    }
    1.1  mrg 	}
    1.1  mrg     }
    1.1  mrg  ret:
    1.1  mrg   TMP_FREE;
    1.1  mrg   return ans;
    1.1  mrg }
    1.1  mrg
    1.1  mrg static const unsigned short nrtrial[] = { 100, 500, 1000 };
    1.1  mrg
1.1.1.2  mrg /* Table of (log_{p_i} 2) values, where p_i is the (nrtrial[i] + 1)'th prime
1.1.1.2  mrg    number.  */
1.1.1.2  mrg static const double logs[] =
1.1.1.2  mrg   { 0.1099457228193620, 0.0847016403115322, 0.0772048195144415 };
    1.1  mrg
    1.1  mrg int
1.1.1.2  mrg mpn_perfect_power_p (mp_srcptr np, mp_size_t n)
    1.1  mrg {
1.1.1.2  mrg   mp_limb_t *nc, factor, g;
1.1.1.3  mrg   mp_limb_t exp, d;
1.1.1.2  mrg   mp_bitcnt_t twos, count;
1.1.1.2  mrg   int ans, where, neg, trial;
    1.1  mrg   TMP_DECL;
    1.1  mrg
1.1.1.3  mrg   neg = n < 0;
1.1.1.3  mrg   if (neg)
    1.1  mrg     {
1.1.1.2  mrg       n = -n;
    1.1  mrg     }
    1.1  mrg
1.1.1.3  mrg   if (n == 0 || (n == 1 && np[0] == 1)) /* Valgrind doesn't like
1.1.1.3  mrg 					   (n <= (np[0] == 1)) */
    1.1  mrg     return 1;
    1.1  mrg
    1.1  mrg   TMP_MARK;
    1.1  mrg
1.1.1.3  mrg   count = 0;
1.1.1.2  mrg
    1.1  mrg   twos = mpn_scan1 (np, 0);
1.1.1.3  mrg   if (twos != 0)
    1.1  mrg     {
1.1.1.3  mrg       mp_size_t s;
    1.1  mrg       if (twos == 1)
    1.1  mrg 	{
1.1.1.3  mrg 	  return 0;
    1.1  mrg 	}
    1.1  mrg       s = twos / GMP_LIMB_BITS;
1.1.1.2  mrg       if (s + 1 == n && POW2_P (np[s]))
    1.1  mrg 	{
1.1.1.3  mrg 	  return ! (neg && POW2_P (twos));
    1.1  mrg 	}
    1.1  mrg       count = twos % GMP_LIMB_BITS;
1.1.1.3  mrg       n -= s;
1.1.1.3  mrg       np += s;
    1.1  mrg       if (count > 0)
    1.1  mrg 	{
1.1.1.3  mrg 	  nc = TMP_ALLOC_LIMBS (n);
1.1.1.3  mrg 	  mpn_rshift (nc, np, n, count);
1.1.1.3  mrg 	  n -= (nc[n - 1] == 0);
1.1.1.3  mrg 	  np = nc;
    1.1  mrg 	}
    1.1  mrg     }
1.1.1.3  mrg   g = twos;
    1.1  mrg
1.1.1.3  mrg   trial = (n > SMALL) + (n > MEDIUM);
    1.1  mrg
1.1.1.2  mrg   where = 0;
1.1.1.3  mrg   factor = mpn_trialdiv (np, n, nrtrial[trial], &where);
    1.1  mrg
    1.1  mrg   if (factor != 0)
    1.1  mrg     {
1.1.1.3  mrg       if (count == 0) /* We did not allocate nc yet. */
    1.1  mrg 	{
1.1.1.3  mrg 	  nc = TMP_ALLOC_LIMBS (n);
    1.1  mrg 	}
    1.1  mrg
1.1.1.3  mrg       /* Remove factors found by trialdiv.  Optimization: If remove
1.1.1.3  mrg 	 define _itch, we can allocate its scratch just once */
    1.1  mrg
    1.1  mrg       do
    1.1  mrg 	{
    1.1  mrg 	  binvert_limb (d, factor);
    1.1  mrg
1.1.1.3  mrg 	  /* After the first round we always have nc == np */
1.1.1.3  mrg 	  exp = mpn_remove (nc, &n, np, n, &d, 1, ~(mp_bitcnt_t)0);
    1.1  mrg
    1.1  mrg 	  if (g == 0)
    1.1  mrg 	    g = exp;
    1.1  mrg 	  else
    1.1  mrg 	    g = mpn_gcd_1 (&g, 1, exp);
    1.1  mrg
    1.1  mrg 	  if (g == 1)
    1.1  mrg 	    {
    1.1  mrg 	      ans = 0;
    1.1  mrg 	      goto ret;
    1.1  mrg 	    }
    1.1  mrg
1.1.1.3  mrg 	  if ((n == 1) & (nc[0] == 1))
    1.1  mrg 	    {
    1.1  mrg 	      ans = ! (neg && POW2_P (g));
    1.1  mrg 	      goto ret;
    1.1  mrg 	    }
    1.1  mrg
1.1.1.3  mrg 	  np = nc;
1.1.1.3  mrg 	  factor = mpn_trialdiv (np, n, nrtrial[trial], &where);
    1.1  mrg 	}
    1.1  mrg       while (factor != 0);
    1.1  mrg     }
    1.1  mrg
1.1.1.3  mrg   MPN_SIZEINBASE_2EXP(count, np, n, 1);   /* log (np) + 1 */
    1.1  mrg   d = (mp_limb_t) (count * logs[trial] + 1e-9) + 1;
1.1.1.3  mrg   ans = perfpow (np, n, d, g, count, neg);
    1.1  mrg
    1.1  mrg  ret:
    1.1  mrg   TMP_FREE;
    1.1  mrg   return ans;
    1.1  mrg }