mpn/generic/gcdext_lehmer.c

        1.1   mrg /* mpn_gcdext -- Extended Greatest Common Divisor.
        1.1   mrg
1.1.1.1.2.1  yamt Copyright 1996, 1998, 2000, 2001, 2002, 2003, 2004, 2005, 2008, 2009, 2012 Free
1.1.1.1.2.1  yamt Software Foundation, Inc.
        1.1   mrg
        1.1   mrg This file is part of the GNU MP Library.
        1.1   mrg
        1.1   mrg The GNU MP Library is free software; you can redistribute it and/or modify
        1.1   mrg it under the terms of the GNU Lesser General Public License as published by
        1.1   mrg the Free Software Foundation; either version 3 of the License, or (at your
        1.1   mrg option) any later version.
        1.1   mrg
        1.1   mrg The GNU MP Library is distributed in the hope that it will be useful, but
        1.1   mrg WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
        1.1   mrg or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
        1.1   mrg License for more details.
        1.1   mrg
        1.1   mrg You should have received a copy of the GNU Lesser General Public License
        1.1   mrg along with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.  */
        1.1   mrg
        1.1   mrg #include "gmp.h"
        1.1   mrg #include "gmp-impl.h"
        1.1   mrg #include "longlong.h"
        1.1   mrg
1.1.1.1.2.1  yamt /* Here, d is the index of the cofactor to update. FIXME: Could use qn
1.1.1.1.2.1  yamt    = 0 for the common case q = 1. */
1.1.1.1.2.1  yamt void
1.1.1.1.2.1  yamt mpn_gcdext_hook (void *p, mp_srcptr gp, mp_size_t gn,
1.1.1.1.2.1  yamt 		 mp_srcptr qp, mp_size_t qn, int d)
1.1.1.1.2.1  yamt {
1.1.1.1.2.1  yamt   struct gcdext_ctx *ctx = (struct gcdext_ctx *) p;
1.1.1.1.2.1  yamt   mp_size_t un = ctx->un;
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt   if (gp)
1.1.1.1.2.1  yamt     {
1.1.1.1.2.1  yamt       mp_srcptr up;
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt       ASSERT (gn > 0);
1.1.1.1.2.1  yamt       ASSERT (gp[gn-1] > 0);
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt       MPN_COPY (ctx->gp, gp, gn);
1.1.1.1.2.1  yamt       ctx->gn = gn;
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt       if (d < 0)
1.1.1.1.2.1  yamt 	{
1.1.1.1.2.1  yamt 	  int c;
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt 	  /* Must return the smallest cofactor, +u1 or -u0 */
1.1.1.1.2.1  yamt 	  MPN_CMP (c, ctx->u0, ctx->u1, un);
1.1.1.1.2.1  yamt 	  ASSERT (c != 0 || (un == 1 && ctx->u0[0] == 1 && ctx->u1[0] == 1));
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt 	  d = c < 0;
1.1.1.1.2.1  yamt 	}
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt       up = d ? ctx->u0 : ctx->u1;
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt       MPN_NORMALIZE (up, un);
1.1.1.1.2.1  yamt       MPN_COPY (ctx->up, up, un);
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt       *ctx->usize = d ? -un : un;
1.1.1.1.2.1  yamt     }
1.1.1.1.2.1  yamt   else
1.1.1.1.2.1  yamt     {
1.1.1.1.2.1  yamt       mp_limb_t cy;
1.1.1.1.2.1  yamt       mp_ptr u0 = ctx->u0;
1.1.1.1.2.1  yamt       mp_ptr u1 = ctx->u1;
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt       ASSERT (d >= 0);
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt       if (d)
1.1.1.1.2.1  yamt 	MP_PTR_SWAP (u0, u1);
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt       qn -= (qp[qn-1] == 0);
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt       /* Update u0 += q  * u1 */
1.1.1.1.2.1  yamt       if (qn == 1)
1.1.1.1.2.1  yamt 	{
1.1.1.1.2.1  yamt 	  mp_limb_t q = qp[0];
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt 	  if (q == 1)
1.1.1.1.2.1  yamt 	    /* A common case. */
1.1.1.1.2.1  yamt 	    cy = mpn_add_n (u0, u0, u1, un);
1.1.1.1.2.1  yamt 	  else
1.1.1.1.2.1  yamt 	    cy = mpn_addmul_1 (u0, u1, un, q);
1.1.1.1.2.1  yamt 	}
1.1.1.1.2.1  yamt       else
1.1.1.1.2.1  yamt 	{
1.1.1.1.2.1  yamt 	  mp_size_t u1n;
1.1.1.1.2.1  yamt 	  mp_ptr tp;
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt 	  u1n = un;
1.1.1.1.2.1  yamt 	  MPN_NORMALIZE (u1, u1n);
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt 	  if (u1n == 0)
1.1.1.1.2.1  yamt 	    return;
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt 	  /* Should always have u1n == un here, and u1 >= u0. The
1.1.1.1.2.1  yamt 	     reason is that we alternate adding u0 to u1 and u1 to u0
1.1.1.1.2.1  yamt 	     (corresponding to subtractions a - b and b - a), and we
1.1.1.1.2.1  yamt 	     can get a large quotient only just after a switch, which
1.1.1.1.2.1  yamt 	     means that we'll add (a multiple of) the larger u to the
1.1.1.1.2.1  yamt 	     smaller. */
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt 	  tp = ctx->tp;
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt 	  if (qn > u1n)
1.1.1.1.2.1  yamt 	    mpn_mul (tp, qp, qn, u1, u1n);
1.1.1.1.2.1  yamt 	  else
1.1.1.1.2.1  yamt 	    mpn_mul (tp, u1, u1n, qp, qn);
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt 	  u1n += qn;
1.1.1.1.2.1  yamt 	  u1n -= tp[u1n-1] == 0;
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt 	  if (u1n >= un)
1.1.1.1.2.1  yamt 	    {
1.1.1.1.2.1  yamt 	      cy = mpn_add (u0, tp, u1n, u0, un);
1.1.1.1.2.1  yamt 	      un = u1n;
1.1.1.1.2.1  yamt 	    }
1.1.1.1.2.1  yamt 	  else
1.1.1.1.2.1  yamt 	    /* Note: Unlikely case, maybe never happens? */
1.1.1.1.2.1  yamt 	    cy = mpn_add (u0, u0, un, tp, u1n);
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt 	}
1.1.1.1.2.1  yamt       u0[un] = cy;
1.1.1.1.2.1  yamt       ctx->un = un + (cy > 0);
1.1.1.1.2.1  yamt     }
1.1.1.1.2.1  yamt }
1.1.1.1.2.1  yamt
1.1.1.1.2.1  yamt /* Temporary storage: 3*(n+1) for u. If hgcd2 succeeds, we need n for
1.1.1.1.2.1  yamt    the matrix-vector multiplication adjusting a, b. If hgcd fails, we
1.1.1.1.2.1  yamt    need at most n for the quotient and n+1 for the u update (reusing
1.1.1.1.2.1  yamt    the extra u). In all, 4n + 3. */
        1.1   mrg
        1.1   mrg mp_size_t
        1.1   mrg mpn_gcdext_lehmer_n (mp_ptr gp, mp_ptr up, mp_size_t *usize,
        1.1   mrg 		     mp_ptr ap, mp_ptr bp, mp_size_t n,
        1.1   mrg 		     mp_ptr tp)
        1.1   mrg {
        1.1   mrg   mp_size_t ualloc = n + 1;
        1.1   mrg
        1.1   mrg   /* Keeps track of the second row of the reduction matrix
        1.1   mrg    *
        1.1   mrg    *   M = (v0, v1 ; u0, u1)
        1.1   mrg    *
        1.1   mrg    * which correspond to the first column of the inverse
        1.1   mrg    *
        1.1   mrg    *   M^{-1} = (u1, -v1; -u0, v0)
1.1.1.1.2.1  yamt    *
1.1.1.1.2.1  yamt    * This implies that
1.1.1.1.2.1  yamt    *
1.1.1.1.2.1  yamt    *   a =  u1 A (mod B)
1.1.1.1.2.1  yamt    *   b = -u0 A (mod B)
1.1.1.1.2.1  yamt    *
1.1.1.1.2.1  yamt    * where A, B denotes the input values.
        1.1   mrg    */
        1.1   mrg
1.1.1.1.2.1  yamt   struct gcdext_ctx ctx;
        1.1   mrg   mp_size_t un;
        1.1   mrg   mp_ptr u0;
        1.1   mrg   mp_ptr u1;
        1.1   mrg   mp_ptr u2;
        1.1   mrg
        1.1   mrg   MPN_ZERO (tp, 3*ualloc);
        1.1   mrg   u0 = tp; tp += ualloc;
        1.1   mrg   u1 = tp; tp += ualloc;
        1.1   mrg   u2 = tp; tp += ualloc;
        1.1   mrg
        1.1   mrg   u1[0] = 1; un = 1;
        1.1   mrg
1.1.1.1.2.1  yamt   ctx.gp = gp;
1.1.1.1.2.1  yamt   ctx.up = up;
1.1.1.1.2.1  yamt   ctx.usize = usize;
1.1.1.1.2.1  yamt
        1.1   mrg   /* FIXME: Handle n == 2 differently, after the loop? */
        1.1   mrg   while (n >= 2)
        1.1   mrg     {
        1.1   mrg       struct hgcd_matrix1 M;
        1.1   mrg       mp_limb_t ah, al, bh, bl;
        1.1   mrg       mp_limb_t mask;
        1.1   mrg
        1.1   mrg       mask = ap[n-1] | bp[n-1];
        1.1   mrg       ASSERT (mask > 0);
        1.1   mrg
        1.1   mrg       if (mask & GMP_NUMB_HIGHBIT)
        1.1   mrg 	{
        1.1   mrg 	  ah = ap[n-1]; al = ap[n-2];
        1.1   mrg 	  bh = bp[n-1]; bl = bp[n-2];
        1.1   mrg 	}
        1.1   mrg       else if (n == 2)
        1.1   mrg 	{
        1.1   mrg 	  /* We use the full inputs without truncation, so we can
        1.1   mrg 	     safely shift left. */
        1.1   mrg 	  int shift;
        1.1   mrg
        1.1   mrg 	  count_leading_zeros (shift, mask);
        1.1   mrg 	  ah = MPN_EXTRACT_NUMB (shift, ap[1], ap[0]);
        1.1   mrg 	  al = ap[0] << shift;
        1.1   mrg 	  bh = MPN_EXTRACT_NUMB (shift, bp[1], bp[0]);
        1.1   mrg 	  bl = bp[0] << shift;
        1.1   mrg 	}
        1.1   mrg       else
        1.1   mrg 	{
        1.1   mrg 	  int shift;
        1.1   mrg
        1.1   mrg 	  count_leading_zeros (shift, mask);
        1.1   mrg 	  ah = MPN_EXTRACT_NUMB (shift, ap[n-1], ap[n-2]);
        1.1   mrg 	  al = MPN_EXTRACT_NUMB (shift, ap[n-2], ap[n-3]);
        1.1   mrg 	  bh = MPN_EXTRACT_NUMB (shift, bp[n-1], bp[n-2]);
        1.1   mrg 	  bl = MPN_EXTRACT_NUMB (shift, bp[n-2], bp[n-3]);
        1.1   mrg 	}
        1.1   mrg
        1.1   mrg       /* Try an mpn_nhgcd2 step */
        1.1   mrg       if (mpn_hgcd2 (ah, al, bh, bl, &M))
        1.1   mrg 	{
1.1.1.1.2.1  yamt 	  n = mpn_matrix22_mul1_inverse_vector (&M, tp, ap, bp, n);
        1.1   mrg 	  MP_PTR_SWAP (ap, tp);
        1.1   mrg 	  un = mpn_hgcd_mul_matrix1_vector(&M, u2, u0, u1, un);
        1.1   mrg 	  MP_PTR_SWAP (u0, u2);
        1.1   mrg 	}
        1.1   mrg       else
        1.1   mrg 	{
        1.1   mrg 	  /* mpn_hgcd2 has failed. Then either one of a or b is very
        1.1   mrg 	     small, or the difference is very small. Perform one
        1.1   mrg 	     subtraction followed by one division. */
1.1.1.1.2.1  yamt 	  ctx.u0 = u0;
1.1.1.1.2.1  yamt 	  ctx.u1 = u1;
1.1.1.1.2.1  yamt 	  ctx.tp = u2;
1.1.1.1.2.1  yamt 	  ctx.un = un;
        1.1   mrg
        1.1   mrg 	  /* Temporary storage n for the quotient and ualloc for the
        1.1   mrg 	     new cofactor. */
1.1.1.1.2.1  yamt 	  n = mpn_gcd_subdiv_step (ap, bp, n, 0, mpn_gcdext_hook, &ctx, tp);
        1.1   mrg 	  if (n == 0)
1.1.1.1.2.1  yamt 	    return ctx.gn;
        1.1   mrg
1.1.1.1.2.1  yamt 	  un = ctx.un;
        1.1   mrg 	}
        1.1   mrg     }
        1.1   mrg   ASSERT_ALWAYS (ap[0] > 0);
        1.1   mrg   ASSERT_ALWAYS (bp[0] > 0);
        1.1   mrg
        1.1   mrg   if (ap[0] == bp[0])
        1.1   mrg     {
        1.1   mrg       int c;
        1.1   mrg
        1.1   mrg       /* Which cofactor to return now? Candidates are +u1 and -u0,
        1.1   mrg 	 depending on which of a and b was most recently reduced,
        1.1   mrg 	 which we don't keep track of. So compare and get the smallest
        1.1   mrg 	 one. */
        1.1   mrg
        1.1   mrg       gp[0] = ap[0];
        1.1   mrg
        1.1   mrg       MPN_CMP (c, u0, u1, un);
        1.1   mrg       ASSERT (c != 0 || (un == 1 && u0[0] == 1 && u1[0] == 1));
        1.1   mrg       if (c < 0)
        1.1   mrg 	{
        1.1   mrg 	  MPN_NORMALIZE (u0, un);
        1.1   mrg 	  MPN_COPY (up, u0, un);
        1.1   mrg 	  *usize = -un;
        1.1   mrg 	}
        1.1   mrg       else
        1.1   mrg 	{
        1.1   mrg 	  MPN_NORMALIZE_NOT_ZERO (u1, un);
        1.1   mrg 	  MPN_COPY (up, u1, un);
        1.1   mrg 	  *usize = un;
        1.1   mrg 	}
        1.1   mrg       return 1;
        1.1   mrg     }
        1.1   mrg   else
        1.1   mrg     {
        1.1   mrg       mp_limb_t uh, vh;
        1.1   mrg       mp_limb_signed_t u;
        1.1   mrg       mp_limb_signed_t v;
        1.1   mrg       int negate;
        1.1   mrg
        1.1   mrg       gp[0] = mpn_gcdext_1 (&u, &v, ap[0], bp[0]);
        1.1   mrg
        1.1   mrg       /* Set up = u u1 - v u0. Keep track of size, un grows by one or
        1.1   mrg 	 two limbs. */
        1.1   mrg
        1.1   mrg       if (u == 0)
        1.1   mrg 	{
        1.1   mrg 	  ASSERT (v == 1);
        1.1   mrg 	  MPN_NORMALIZE (u0, un);
        1.1   mrg 	  MPN_COPY (up, u0, un);
        1.1   mrg 	  *usize = -un;
        1.1   mrg 	  return 1;
        1.1   mrg 	}
        1.1   mrg       else if (v == 0)
        1.1   mrg 	{
        1.1   mrg 	  ASSERT (u == 1);
        1.1   mrg 	  MPN_NORMALIZE (u1, un);
        1.1   mrg 	  MPN_COPY (up, u1, un);
        1.1   mrg 	  *usize = un;
        1.1   mrg 	  return 1;
        1.1   mrg 	}
        1.1   mrg       else if (u > 0)
        1.1   mrg 	{
        1.1   mrg 	  negate = 0;
        1.1   mrg 	  ASSERT (v < 0);
        1.1   mrg 	  v = -v;
        1.1   mrg 	}
        1.1   mrg       else
        1.1   mrg 	{
        1.1   mrg 	  negate = 1;
        1.1   mrg 	  ASSERT (v > 0);
        1.1   mrg 	  u = -u;
        1.1   mrg 	}
        1.1   mrg
        1.1   mrg       uh = mpn_mul_1 (up, u1, un, u);
        1.1   mrg       vh = mpn_addmul_1 (up, u0, un, v);
        1.1   mrg
        1.1   mrg       if ( (uh | vh) > 0)
        1.1   mrg 	{
        1.1   mrg 	  uh += vh;
        1.1   mrg 	  up[un++] = uh;
        1.1   mrg 	  if (uh < vh)
        1.1   mrg 	    up[un++] = 1;
        1.1   mrg 	}
        1.1   mrg
        1.1   mrg       MPN_NORMALIZE_NOT_ZERO (up, un);
        1.1   mrg
        1.1   mrg       *usize = negate ? -un : un;
        1.1   mrg       return 1;
        1.1   mrg     }
        1.1   mrg }