mpn/generic/broot.c

    1.1  mrg /* mpn_broot -- Compute hensel sqrt
    1.1  mrg
1.1.1.2  mrg    Contributed to the GNU project by Niels Mller
    1.1  mrg
    1.1  mrg    THE FUNCTIONS IN THIS FILE ARE INTERNAL WITH MUTABLE INTERFACES.  IT IS ONLY
    1.1  mrg    SAFE TO REACH THEM THROUGH DOCUMENTED INTERFACES.  IN FACT, IT IS ALMOST
    1.1  mrg    GUARANTEED THAT THEY WILL CHANGE OR DISAPPEAR IN A FUTURE GMP RELEASE.
    1.1  mrg
    1.1  mrg Copyright 2012 Free Software Foundation, Inc.
    1.1  mrg
    1.1  mrg This file is part of the GNU MP Library.
    1.1  mrg
    1.1  mrg The GNU MP Library is free software; you can redistribute it and/or modify
1.1.1.2  mrg it under the terms of either:
1.1.1.2  mrg
1.1.1.2  mrg   * the GNU Lesser General Public License as published by the Free
1.1.1.2  mrg     Software Foundation; either version 3 of the License, or (at your
1.1.1.2  mrg     option) any later version.
1.1.1.2  mrg
1.1.1.2  mrg or
1.1.1.2  mrg
1.1.1.2  mrg   * the GNU General Public License as published by the Free Software
1.1.1.2  mrg     Foundation; either version 2 of the License, or (at your option) any
1.1.1.2  mrg     later version.
1.1.1.2  mrg
1.1.1.2  mrg or both in parallel, as here.
    1.1  mrg
    1.1  mrg The GNU MP Library is distributed in the hope that it will be useful, but
    1.1  mrg WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
1.1.1.2  mrg or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
1.1.1.2  mrg for more details.
    1.1  mrg
1.1.1.2  mrg You should have received copies of the GNU General Public License and the
1.1.1.2  mrg GNU Lesser General Public License along with the GNU MP Library.  If not,
1.1.1.2  mrg see https://www.gnu.org/licenses/.  */
    1.1  mrg
    1.1  mrg #include "gmp-impl.h"
    1.1  mrg
    1.1  mrg /* Computes a^e (mod B). Uses right-to-left binary algorithm, since
    1.1  mrg    typical use will have e small. */
    1.1  mrg static mp_limb_t
    1.1  mrg powlimb (mp_limb_t a, mp_limb_t e)
    1.1  mrg {
    1.1  mrg   mp_limb_t r = 1;
    1.1  mrg   mp_limb_t s = a;
    1.1  mrg
    1.1  mrg   for (r = 1, s = a; e > 0; e >>= 1, s *= s)
    1.1  mrg     if (e & 1)
    1.1  mrg       r *= s;
    1.1  mrg
    1.1  mrg   return r;
    1.1  mrg }
    1.1  mrg
    1.1  mrg /* Computes a^{1/k - 1} (mod B^n). Both a and k must be odd.
    1.1  mrg
    1.1  mrg    Iterates
    1.1  mrg
    1.1  mrg      r' <-- r - r * (a^{k-1} r^k - 1) / n
    1.1  mrg
    1.1  mrg    If
    1.1  mrg
    1.1  mrg      a^{k-1} r^k = 1 (mod 2^m),
    1.1  mrg
    1.1  mrg    then
    1.1  mrg
    1.1  mrg      a^{k-1} r'^k = 1 (mod 2^{2m}),
    1.1  mrg
    1.1  mrg    Compute the update term as
    1.1  mrg
    1.1  mrg      r' = r - (a^{k-1} r^{k+1} - r) / k
    1.1  mrg
1.1.1.2  mrg    where we still have cancellation of low limbs.
    1.1  mrg
    1.1  mrg  */
    1.1  mrg void
    1.1  mrg mpn_broot_invm1 (mp_ptr rp, mp_srcptr ap, mp_size_t n, mp_limb_t k)
    1.1  mrg {
    1.1  mrg   mp_size_t sizes[GMP_LIMB_BITS * 2];
1.1.1.2  mrg   mp_ptr akm1, tp, rnp, ep;
    1.1  mrg   mp_limb_t a0, r0, km1, kp1h, kinv;
    1.1  mrg   mp_size_t rn;
    1.1  mrg   unsigned i;
    1.1  mrg
    1.1  mrg   TMP_DECL;
    1.1  mrg
    1.1  mrg   ASSERT (n > 0);
    1.1  mrg   ASSERT (ap[0] & 1);
    1.1  mrg   ASSERT (k & 1);
    1.1  mrg   ASSERT (k >= 3);
    1.1  mrg
    1.1  mrg   TMP_MARK;
    1.1  mrg
    1.1  mrg   akm1 = TMP_ALLOC_LIMBS (4*n);
    1.1  mrg   tp = akm1 + n;
    1.1  mrg
    1.1  mrg   km1 = k-1;
    1.1  mrg   /* FIXME: Could arrange the iteration so we don't need to compute
    1.1  mrg      this up front, computing a^{k-1} * r^k as (a r)^{k-1} * r. Note
    1.1  mrg      that we can use wraparound also for a*r, since the low half is
    1.1  mrg      unchanged from the previous iteration. Or possibly mulmid. Also,
    1.1  mrg      a r = a^{1/k}, so we get that value too, for free? */
    1.1  mrg   mpn_powlo (akm1, ap, &km1, 1, n, tp); /* 3 n scratch space */
    1.1  mrg
    1.1  mrg   a0 = ap[0];
    1.1  mrg   binvert_limb (kinv, k);
    1.1  mrg
    1.1  mrg   /* 4 bits: a^{1/k - 1} (mod 16):
    1.1  mrg
    1.1  mrg 	a % 8
    1.1  mrg 	1 3 5 7
    1.1  mrg    k%4 +-------
    1.1  mrg      1 |1 1 1 1
    1.1  mrg      3 |1 9 9 1
    1.1  mrg   */
    1.1  mrg   r0 = 1 + (((k << 2) & ((a0 << 1) ^ (a0 << 2))) & 8);
    1.1  mrg   r0 = kinv * r0 * (k+1 - akm1[0] * powlimb (r0, k & 0x7f)); /* 8 bits */
    1.1  mrg   r0 = kinv * r0 * (k+1 - akm1[0] * powlimb (r0, k & 0x7fff)); /* 16 bits */
    1.1  mrg   r0 = kinv * r0 * (k+1 - akm1[0] * powlimb (r0, k)); /* 32 bits */
    1.1  mrg #if GMP_NUMB_BITS > 32
    1.1  mrg   {
    1.1  mrg     unsigned prec = 32;
    1.1  mrg     do
    1.1  mrg       {
    1.1  mrg 	r0 = kinv * r0 * (k+1 - akm1[0] * powlimb (r0, k));
    1.1  mrg 	prec *= 2;
    1.1  mrg       }
    1.1  mrg     while (prec < GMP_NUMB_BITS);
    1.1  mrg   }
    1.1  mrg #endif
    1.1  mrg
    1.1  mrg   rp[0] = r0;
    1.1  mrg   if (n == 1)
    1.1  mrg     {
    1.1  mrg       TMP_FREE;
    1.1  mrg       return;
    1.1  mrg     }
    1.1  mrg
    1.1  mrg   /* For odd k, (k+1)/2 = k/2+1, and the latter avoids overflow. */
    1.1  mrg   kp1h = k/2 + 1;
    1.1  mrg
    1.1  mrg   /* FIXME: Special case for two limb iteration. */
    1.1  mrg   rnp = TMP_ALLOC_LIMBS (2*n + 1);
    1.1  mrg   ep = rnp + n;
    1.1  mrg
    1.1  mrg   /* FIXME: Possible to this on the fly with some bit fiddling. */
    1.1  mrg   for (i = 0; n > 1; n = (n + 1)/2)
    1.1  mrg     sizes[i++] = n;
    1.1  mrg
    1.1  mrg   rn = 1;
    1.1  mrg
    1.1  mrg   while (i-- > 0)
    1.1  mrg     {
    1.1  mrg       /* Compute x^{k+1}. */
    1.1  mrg       mpn_sqr (ep, rp, rn); /* For odd n, writes n+1 limbs in the
1.1.1.2  mrg 			       final iteration. */
    1.1  mrg       mpn_powlo (rnp, ep, &kp1h, 1, sizes[i], tp);
    1.1  mrg
1.1.1.2  mrg       /* Multiply by a^{k-1}. Can use wraparound; low part equals r. */
    1.1  mrg
    1.1  mrg       mpn_mullo_n (ep, rnp, akm1, sizes[i]);
    1.1  mrg       ASSERT (mpn_cmp (ep, rp, rn) == 0);
    1.1  mrg
    1.1  mrg       ASSERT (sizes[i] <= 2*rn);
    1.1  mrg       mpn_pi1_bdiv_q_1 (rp + rn, ep + rn, sizes[i] - rn, k, kinv, 0);
    1.1  mrg       mpn_neg (rp + rn, rp + rn, sizes[i] - rn);
    1.1  mrg       rn = sizes[i];
    1.1  mrg     }
    1.1  mrg   TMP_FREE;
    1.1  mrg }
    1.1  mrg
    1.1  mrg /* Computes a^{1/k} (mod B^n). Both a and k must be odd. */
    1.1  mrg void
    1.1  mrg mpn_broot (mp_ptr rp, mp_srcptr ap, mp_size_t n, mp_limb_t k)
    1.1  mrg {
    1.1  mrg   mp_ptr tp;
    1.1  mrg   TMP_DECL;
    1.1  mrg
    1.1  mrg   ASSERT (n > 0);
    1.1  mrg   ASSERT (ap[0] & 1);
    1.1  mrg   ASSERT (k & 1);
    1.1  mrg
    1.1  mrg   if (k == 1)
    1.1  mrg     {
    1.1  mrg       MPN_COPY (rp, ap, n);
    1.1  mrg       return;
    1.1  mrg     }
    1.1  mrg
    1.1  mrg   TMP_MARK;
    1.1  mrg   tp = TMP_ALLOC_LIMBS (n);
    1.1  mrg
    1.1  mrg   mpn_broot_invm1 (tp, ap, n, k);
    1.1  mrg   mpn_mullo_n (rp, tp, ap, n);
    1.1  mrg
    1.1  mrg   TMP_FREE;
    1.1  mrg }