mpn/generic/hgcd_reduce.c

1.1.1.1.8.2  tls /* hgcd_reduce.c.
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls    THE FUNCTIONS IN THIS FILE ARE INTERNAL WITH MUTABLE INTERFACES.  IT IS ONLY
1.1.1.1.8.2  tls    SAFE TO REACH THEM THROUGH DOCUMENTED INTERFACES.  IN FACT, IT IS ALMOST
1.1.1.1.8.2  tls    GUARANTEED THAT THEY'LL CHANGE OR DISAPPEAR IN A FUTURE GNU MP RELEASE.
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls Copyright 2011, 2012 Free Software Foundation, Inc.
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls This file is part of the GNU MP Library.
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls The GNU MP Library is free software; you can redistribute it and/or modify
1.1.1.1.8.2  tls it under the terms of the GNU Lesser General Public License as published by
1.1.1.1.8.2  tls the Free Software Foundation; either version 3 of the License, or (at your
1.1.1.1.8.2  tls option) any later version.
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls The GNU MP Library is distributed in the hope that it will be useful, but
1.1.1.1.8.2  tls WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
1.1.1.1.8.2  tls or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
1.1.1.1.8.2  tls License for more details.
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls You should have received a copy of the GNU Lesser General Public License
1.1.1.1.8.2  tls along with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.  */
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls #include "gmp.h"
1.1.1.1.8.2  tls #include "gmp-impl.h"
1.1.1.1.8.2  tls #include "longlong.h"
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls /* Computes R -= A * B. Result must be non-negative. Normalized down
1.1.1.1.8.2  tls    to size an, and resulting size is returned. */
1.1.1.1.8.2  tls static mp_size_t
1.1.1.1.8.2  tls submul (mp_ptr rp, mp_size_t rn,
1.1.1.1.8.2  tls 	mp_srcptr ap, mp_size_t an, mp_srcptr bp, mp_size_t bn)
1.1.1.1.8.2  tls {
1.1.1.1.8.2  tls   mp_ptr tp;
1.1.1.1.8.2  tls   TMP_DECL;
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls   ASSERT (bn > 0);
1.1.1.1.8.2  tls   ASSERT (an >= bn);
1.1.1.1.8.2  tls   ASSERT (rn >= an);
1.1.1.1.8.2  tls   ASSERT (an + bn <= rn + 1);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls   TMP_MARK;
1.1.1.1.8.2  tls   tp = TMP_ALLOC_LIMBS (an + bn);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls   mpn_mul (tp, ap, an, bp, bn);
1.1.1.1.8.2  tls   if (an + bn > rn)
1.1.1.1.8.2  tls     {
1.1.1.1.8.2  tls       ASSERT (tp[rn] == 0);
1.1.1.1.8.2  tls       bn--;
1.1.1.1.8.2  tls     }
1.1.1.1.8.2  tls   ASSERT_NOCARRY (mpn_sub (rp, rp, rn, tp, an + bn));
1.1.1.1.8.2  tls   TMP_FREE;
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls   while (rn > an && (rp[rn-1] == 0))
1.1.1.1.8.2  tls     rn--;
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls   return rn;
1.1.1.1.8.2  tls }
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls /* Computes (a, b)  <--  M^{-1} (a; b) */
1.1.1.1.8.2  tls /* FIXME:
1.1.1.1.8.2  tls     x Take scratch parameter, and figure out scratch need.
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls     x Use some fallback for small M->n?
1.1.1.1.8.2  tls */
1.1.1.1.8.2  tls static mp_size_t
1.1.1.1.8.2  tls hgcd_matrix_apply (const struct hgcd_matrix *M,
1.1.1.1.8.2  tls 		   mp_ptr ap, mp_ptr bp,
1.1.1.1.8.2  tls 		   mp_size_t n)
1.1.1.1.8.2  tls {
1.1.1.1.8.2  tls   mp_size_t an, bn, un, vn, nn;
1.1.1.1.8.2  tls   mp_size_t mn[2][2];
1.1.1.1.8.2  tls   mp_size_t modn;
1.1.1.1.8.2  tls   mp_ptr tp, sp, scratch;
1.1.1.1.8.2  tls   mp_limb_t cy;
1.1.1.1.8.2  tls   unsigned i, j;
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls   TMP_DECL;
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls   ASSERT ( (ap[n-1] | bp[n-1]) > 0);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls   an = n;
1.1.1.1.8.2  tls   MPN_NORMALIZE (ap, an);
1.1.1.1.8.2  tls   bn = n;
1.1.1.1.8.2  tls   MPN_NORMALIZE (bp, bn);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls   for (i = 0; i < 2; i++)
1.1.1.1.8.2  tls     for (j = 0; j < 2; j++)
1.1.1.1.8.2  tls       {
1.1.1.1.8.2  tls 	mp_size_t k;
1.1.1.1.8.2  tls 	k = M->n;
1.1.1.1.8.2  tls 	MPN_NORMALIZE (M->p[i][j], k);
1.1.1.1.8.2  tls 	mn[i][j] = k;
1.1.1.1.8.2  tls       }
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls   ASSERT (mn[0][0] > 0);
1.1.1.1.8.2  tls   ASSERT (mn[1][1] > 0);
1.1.1.1.8.2  tls   ASSERT ( (mn[0][1] | mn[1][0]) > 0);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls   TMP_MARK;
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls   if (mn[0][1] == 0)
1.1.1.1.8.2  tls     {
1.1.1.1.8.2  tls       /* A unchanged, M = (1, 0; q, 1) */
1.1.1.1.8.2  tls       ASSERT (mn[0][0] == 1);
1.1.1.1.8.2  tls       ASSERT (M->p[0][0][0] == 1);
1.1.1.1.8.2  tls       ASSERT (mn[1][1] == 1);
1.1.1.1.8.2  tls       ASSERT (M->p[1][1][0] == 1);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       /* Put B <-- B - q A */
1.1.1.1.8.2  tls       nn = submul (bp, bn, ap, an, M->p[1][0], mn[1][0]);
1.1.1.1.8.2  tls     }
1.1.1.1.8.2  tls   else if (mn[1][0] == 0)
1.1.1.1.8.2  tls     {
1.1.1.1.8.2  tls       /* B unchanged, M = (1, q; 0, 1) */
1.1.1.1.8.2  tls       ASSERT (mn[0][0] == 1);
1.1.1.1.8.2  tls       ASSERT (M->p[0][0][0] == 1);
1.1.1.1.8.2  tls       ASSERT (mn[1][1] == 1);
1.1.1.1.8.2  tls       ASSERT (M->p[1][1][0] == 1);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       /* Put A  <-- A - q * B */
1.1.1.1.8.2  tls       nn = submul (ap, an, bp, bn, M->p[0][1], mn[0][1]);
1.1.1.1.8.2  tls     }
1.1.1.1.8.2  tls   else
1.1.1.1.8.2  tls     {
1.1.1.1.8.2  tls       /* A = m00 a + m01 b  ==> a <= A / m00, b <= A / m01.
1.1.1.1.8.2  tls 	 B = m10 a + m11 b  ==> a <= B / m10, b <= B / m11. */
1.1.1.1.8.2  tls       un = MIN (an - mn[0][0], bn - mn[1][0]) + 1;
1.1.1.1.8.2  tls       vn = MIN (an - mn[0][1], bn - mn[1][1]) + 1;
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       nn = MAX (un, vn);
1.1.1.1.8.2  tls       /* In the range of interest, mulmod_bnm1 should always beat mullo. */
1.1.1.1.8.2  tls       modn = mpn_mulmod_bnm1_next_size (nn + 1);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       scratch = TMP_ALLOC_LIMBS (mpn_mulmod_bnm1_itch (modn, modn, M->n));
1.1.1.1.8.2  tls       tp = TMP_ALLOC_LIMBS (modn);
1.1.1.1.8.2  tls       sp = TMP_ALLOC_LIMBS (modn);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       ASSERT (n <= 2*modn);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       if (n > modn)
1.1.1.1.8.2  tls 	{
1.1.1.1.8.2  tls 	  cy = mpn_add (ap, ap, modn, ap + modn, n - modn);
1.1.1.1.8.2  tls 	  MPN_INCR_U (ap, modn, cy);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls 	  cy = mpn_add (bp, bp, modn, bp + modn, n - modn);
1.1.1.1.8.2  tls 	  MPN_INCR_U (bp, modn, cy);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls 	  n = modn;
1.1.1.1.8.2  tls 	}
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       mpn_mulmod_bnm1 (tp, modn, ap, n, M->p[1][1], mn[1][1], scratch);
1.1.1.1.8.2  tls       mpn_mulmod_bnm1 (sp, modn, bp, n, M->p[0][1], mn[0][1], scratch);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       /* FIXME: Handle the small n case in some better way. */
1.1.1.1.8.2  tls       if (n + mn[1][1] < modn)
1.1.1.1.8.2  tls 	MPN_ZERO (tp + n + mn[1][1], modn - n - mn[1][1]);
1.1.1.1.8.2  tls       if (n + mn[0][1] < modn)
1.1.1.1.8.2  tls 	MPN_ZERO (sp + n + mn[0][1], modn - n - mn[0][1]);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       cy = mpn_sub_n (tp, tp, sp, modn);
1.1.1.1.8.2  tls       MPN_DECR_U (tp, modn, cy);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       ASSERT (mpn_zero_p (tp + nn, modn - nn));
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       mpn_mulmod_bnm1 (sp, modn, ap, n, M->p[1][0], mn[1][0], scratch);
1.1.1.1.8.2  tls       MPN_COPY (ap, tp, nn);
1.1.1.1.8.2  tls       mpn_mulmod_bnm1 (tp, modn, bp, n, M->p[0][0], mn[0][0], scratch);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       if (n + mn[1][0] < modn)
1.1.1.1.8.2  tls 	MPN_ZERO (sp + n + mn[1][0], modn - n - mn[1][0]);
1.1.1.1.8.2  tls       if (n + mn[0][0] < modn)
1.1.1.1.8.2  tls 	MPN_ZERO (tp + n + mn[0][0], modn - n - mn[0][0]);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       cy = mpn_sub_n (tp, tp, sp, modn);
1.1.1.1.8.2  tls       MPN_DECR_U (tp, modn, cy);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       ASSERT (mpn_zero_p (tp + nn, modn - nn));
1.1.1.1.8.2  tls       MPN_COPY (bp, tp, nn);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       while ( (ap[nn-1] | bp[nn-1]) == 0)
1.1.1.1.8.2  tls 	{
1.1.1.1.8.2  tls 	  nn--;
1.1.1.1.8.2  tls 	  ASSERT (nn > 0);
1.1.1.1.8.2  tls 	}
1.1.1.1.8.2  tls     }
1.1.1.1.8.2  tls   TMP_FREE;
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls   return nn;
1.1.1.1.8.2  tls }
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls mp_size_t
1.1.1.1.8.2  tls mpn_hgcd_reduce_itch (mp_size_t n, mp_size_t p)
1.1.1.1.8.2  tls {
1.1.1.1.8.2  tls   mp_size_t itch;
1.1.1.1.8.2  tls   if (BELOW_THRESHOLD (n, HGCD_REDUCE_THRESHOLD))
1.1.1.1.8.2  tls     {
1.1.1.1.8.2  tls       itch = mpn_hgcd_itch (n-p);
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls       /* For arbitrary p, the storage for _adjust is 2*(p + M->n) = 2 *
1.1.1.1.8.2  tls 	 (p + ceil((n-p)/2) - 1 <= n + p - 1 */
1.1.1.1.8.2  tls       if (itch < n + p - 1)
1.1.1.1.8.2  tls 	itch = n + p - 1;
1.1.1.1.8.2  tls     }
1.1.1.1.8.2  tls   else
1.1.1.1.8.2  tls     {
1.1.1.1.8.2  tls       itch = 2*(n-p) + mpn_hgcd_itch (n-p);
1.1.1.1.8.2  tls       /* Currently, hgcd_matrix_apply allocates its own storage. */
1.1.1.1.8.2  tls     }
1.1.1.1.8.2  tls   return itch;
1.1.1.1.8.2  tls }
1.1.1.1.8.2  tls
1.1.1.1.8.2  tls /* FIXME: Document storage need. */
1.1.1.1.8.2  tls mp_size_t
1.1.1.1.8.2  tls mpn_hgcd_reduce (struct hgcd_matrix *M,
1.1.1.1.8.2  tls 		 mp_ptr ap, mp_ptr bp, mp_size_t n, mp_size_t p,
1.1.1.1.8.2  tls 		 mp_ptr tp)
1.1.1.1.8.2  tls {
1.1.1.1.8.2  tls   mp_size_t nn;
1.1.1.1.8.2  tls   if (BELOW_THRESHOLD (n, HGCD_REDUCE_THRESHOLD))
1.1.1.1.8.2  tls     {
1.1.1.1.8.2  tls       nn = mpn_hgcd (ap + p, bp + p, n - p, M, tp);
1.1.1.1.8.2  tls       if (nn > 0)
1.1.1.1.8.2  tls 	/* Needs 2*(p + M->n) <= 2*(floor(n/2) + ceil(n/2) - 1)
1.1.1.1.8.2  tls 	   = 2 (n - 1) */
1.1.1.1.8.2  tls 	return mpn_hgcd_matrix_adjust (M, p + nn, ap, bp, p, tp);
1.1.1.1.8.2  tls     }
1.1.1.1.8.2  tls   else
1.1.1.1.8.2  tls     {
1.1.1.1.8.2  tls       MPN_COPY (tp, ap + p, n - p);
1.1.1.1.8.2  tls       MPN_COPY (tp + n - p, bp + p, n - p);
1.1.1.1.8.2  tls       if (mpn_hgcd_appr (tp, tp + n - p, n - p, M, tp + 2*(n-p)))
1.1.1.1.8.2  tls 	return hgcd_matrix_apply (M, ap, bp, n);
1.1.1.1.8.2  tls     }
1.1.1.1.8.2  tls   return 0;
1.1.1.1.8.2  tls }