mpn/generic/hgcd_reduce.c

    1.1  mrg /* hgcd_reduce.c.
    1.1  mrg
    1.1  mrg    THE FUNCTIONS IN THIS FILE ARE INTERNAL WITH MUTABLE INTERFACES.  IT IS ONLY
    1.1  mrg    SAFE TO REACH THEM THROUGH DOCUMENTED INTERFACES.  IN FACT, IT IS ALMOST
    1.1  mrg    GUARANTEED THAT THEY'LL CHANGE OR DISAPPEAR IN A FUTURE GNU MP RELEASE.
    1.1  mrg
    1.1  mrg Copyright 2011, 2012 Free Software Foundation, Inc.
    1.1  mrg
    1.1  mrg This file is part of the GNU MP Library.
    1.1  mrg
    1.1  mrg The GNU MP Library is free software; you can redistribute it and/or modify
1.1.1.2  mrg it under the terms of either:
1.1.1.2  mrg
1.1.1.2  mrg   * the GNU Lesser General Public License as published by the Free
1.1.1.2  mrg     Software Foundation; either version 3 of the License, or (at your
1.1.1.2  mrg     option) any later version.
1.1.1.2  mrg
1.1.1.2  mrg or
1.1.1.2  mrg
1.1.1.2  mrg   * the GNU General Public License as published by the Free Software
1.1.1.2  mrg     Foundation; either version 2 of the License, or (at your option) any
1.1.1.2  mrg     later version.
1.1.1.2  mrg
1.1.1.2  mrg or both in parallel, as here.
    1.1  mrg
    1.1  mrg The GNU MP Library is distributed in the hope that it will be useful, but
    1.1  mrg WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
1.1.1.2  mrg or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
1.1.1.2  mrg for more details.
    1.1  mrg
1.1.1.2  mrg You should have received copies of the GNU General Public License and the
1.1.1.2  mrg GNU Lesser General Public License along with the GNU MP Library.  If not,
1.1.1.2  mrg see https://www.gnu.org/licenses/.  */
    1.1  mrg
    1.1  mrg #include "gmp.h"
    1.1  mrg #include "gmp-impl.h"
    1.1  mrg #include "longlong.h"
    1.1  mrg
    1.1  mrg /* Computes R -= A * B. Result must be non-negative. Normalized down
    1.1  mrg    to size an, and resulting size is returned. */
    1.1  mrg static mp_size_t
    1.1  mrg submul (mp_ptr rp, mp_size_t rn,
    1.1  mrg 	mp_srcptr ap, mp_size_t an, mp_srcptr bp, mp_size_t bn)
    1.1  mrg {
    1.1  mrg   mp_ptr tp;
    1.1  mrg   TMP_DECL;
    1.1  mrg
    1.1  mrg   ASSERT (bn > 0);
    1.1  mrg   ASSERT (an >= bn);
    1.1  mrg   ASSERT (rn >= an);
    1.1  mrg   ASSERT (an + bn <= rn + 1);
    1.1  mrg
    1.1  mrg   TMP_MARK;
    1.1  mrg   tp = TMP_ALLOC_LIMBS (an + bn);
    1.1  mrg
    1.1  mrg   mpn_mul (tp, ap, an, bp, bn);
1.1.1.2  mrg   ASSERT ((an + bn <= rn) || (tp[rn] == 0));
1.1.1.2  mrg   ASSERT_NOCARRY (mpn_sub (rp, rp, rn, tp, an + bn - (an + bn > rn)));
    1.1  mrg   TMP_FREE;
    1.1  mrg
    1.1  mrg   while (rn > an && (rp[rn-1] == 0))
    1.1  mrg     rn--;
    1.1  mrg
    1.1  mrg   return rn;
    1.1  mrg }
    1.1  mrg
    1.1  mrg /* Computes (a, b)  <--  M^{-1} (a; b) */
    1.1  mrg /* FIXME:
    1.1  mrg     x Take scratch parameter, and figure out scratch need.
    1.1  mrg
    1.1  mrg     x Use some fallback for small M->n?
    1.1  mrg */
    1.1  mrg static mp_size_t
    1.1  mrg hgcd_matrix_apply (const struct hgcd_matrix *M,
    1.1  mrg 		   mp_ptr ap, mp_ptr bp,
    1.1  mrg 		   mp_size_t n)
    1.1  mrg {
    1.1  mrg   mp_size_t an, bn, un, vn, nn;
    1.1  mrg   mp_size_t mn[2][2];
    1.1  mrg   mp_size_t modn;
    1.1  mrg   mp_ptr tp, sp, scratch;
    1.1  mrg   mp_limb_t cy;
    1.1  mrg   unsigned i, j;
    1.1  mrg
    1.1  mrg   TMP_DECL;
    1.1  mrg
    1.1  mrg   ASSERT ( (ap[n-1] | bp[n-1]) > 0);
    1.1  mrg
    1.1  mrg   an = n;
    1.1  mrg   MPN_NORMALIZE (ap, an);
    1.1  mrg   bn = n;
    1.1  mrg   MPN_NORMALIZE (bp, bn);
    1.1  mrg
    1.1  mrg   for (i = 0; i < 2; i++)
    1.1  mrg     for (j = 0; j < 2; j++)
    1.1  mrg       {
    1.1  mrg 	mp_size_t k;
    1.1  mrg 	k = M->n;
    1.1  mrg 	MPN_NORMALIZE (M->p[i][j], k);
    1.1  mrg 	mn[i][j] = k;
    1.1  mrg       }
    1.1  mrg
    1.1  mrg   ASSERT (mn[0][0] > 0);
    1.1  mrg   ASSERT (mn[1][1] > 0);
    1.1  mrg   ASSERT ( (mn[0][1] | mn[1][0]) > 0);
    1.1  mrg
    1.1  mrg   TMP_MARK;
    1.1  mrg
    1.1  mrg   if (mn[0][1] == 0)
    1.1  mrg     {
    1.1  mrg       /* A unchanged, M = (1, 0; q, 1) */
    1.1  mrg       ASSERT (mn[0][0] == 1);
    1.1  mrg       ASSERT (M->p[0][0][0] == 1);
    1.1  mrg       ASSERT (mn[1][1] == 1);
    1.1  mrg       ASSERT (M->p[1][1][0] == 1);
    1.1  mrg
    1.1  mrg       /* Put B <-- B - q A */
    1.1  mrg       nn = submul (bp, bn, ap, an, M->p[1][0], mn[1][0]);
    1.1  mrg     }
    1.1  mrg   else if (mn[1][0] == 0)
    1.1  mrg     {
    1.1  mrg       /* B unchanged, M = (1, q; 0, 1) */
    1.1  mrg       ASSERT (mn[0][0] == 1);
    1.1  mrg       ASSERT (M->p[0][0][0] == 1);
    1.1  mrg       ASSERT (mn[1][1] == 1);
    1.1  mrg       ASSERT (M->p[1][1][0] == 1);
    1.1  mrg
    1.1  mrg       /* Put A  <-- A - q * B */
    1.1  mrg       nn = submul (ap, an, bp, bn, M->p[0][1], mn[0][1]);
    1.1  mrg     }
    1.1  mrg   else
    1.1  mrg     {
    1.1  mrg       /* A = m00 a + m01 b  ==> a <= A / m00, b <= A / m01.
    1.1  mrg 	 B = m10 a + m11 b  ==> a <= B / m10, b <= B / m11. */
    1.1  mrg       un = MIN (an - mn[0][0], bn - mn[1][0]) + 1;
    1.1  mrg       vn = MIN (an - mn[0][1], bn - mn[1][1]) + 1;
    1.1  mrg
    1.1  mrg       nn = MAX (un, vn);
    1.1  mrg       /* In the range of interest, mulmod_bnm1 should always beat mullo. */
    1.1  mrg       modn = mpn_mulmod_bnm1_next_size (nn + 1);
    1.1  mrg
1.1.1.2  mrg       TMP_ALLOC_LIMBS_3 (tp, modn,
1.1.1.2  mrg 			 sp, modn,
1.1.1.2  mrg 			 scratch, mpn_mulmod_bnm1_itch (modn, modn, M->n));
    1.1  mrg
    1.1  mrg       ASSERT (n <= 2*modn);
    1.1  mrg
    1.1  mrg       if (n > modn)
    1.1  mrg 	{
    1.1  mrg 	  cy = mpn_add (ap, ap, modn, ap + modn, n - modn);
    1.1  mrg 	  MPN_INCR_U (ap, modn, cy);
    1.1  mrg
    1.1  mrg 	  cy = mpn_add (bp, bp, modn, bp + modn, n - modn);
    1.1  mrg 	  MPN_INCR_U (bp, modn, cy);
    1.1  mrg
    1.1  mrg 	  n = modn;
    1.1  mrg 	}
    1.1  mrg
    1.1  mrg       mpn_mulmod_bnm1 (tp, modn, ap, n, M->p[1][1], mn[1][1], scratch);
    1.1  mrg       mpn_mulmod_bnm1 (sp, modn, bp, n, M->p[0][1], mn[0][1], scratch);
    1.1  mrg
    1.1  mrg       /* FIXME: Handle the small n case in some better way. */
    1.1  mrg       if (n + mn[1][1] < modn)
    1.1  mrg 	MPN_ZERO (tp + n + mn[1][1], modn - n - mn[1][1]);
    1.1  mrg       if (n + mn[0][1] < modn)
    1.1  mrg 	MPN_ZERO (sp + n + mn[0][1], modn - n - mn[0][1]);
    1.1  mrg
    1.1  mrg       cy = mpn_sub_n (tp, tp, sp, modn);
    1.1  mrg       MPN_DECR_U (tp, modn, cy);
    1.1  mrg
    1.1  mrg       ASSERT (mpn_zero_p (tp + nn, modn - nn));
    1.1  mrg
    1.1  mrg       mpn_mulmod_bnm1 (sp, modn, ap, n, M->p[1][0], mn[1][0], scratch);
    1.1  mrg       MPN_COPY (ap, tp, nn);
    1.1  mrg       mpn_mulmod_bnm1 (tp, modn, bp, n, M->p[0][0], mn[0][0], scratch);
    1.1  mrg
    1.1  mrg       if (n + mn[1][0] < modn)
    1.1  mrg 	MPN_ZERO (sp + n + mn[1][0], modn - n - mn[1][0]);
    1.1  mrg       if (n + mn[0][0] < modn)
    1.1  mrg 	MPN_ZERO (tp + n + mn[0][0], modn - n - mn[0][0]);
    1.1  mrg
    1.1  mrg       cy = mpn_sub_n (tp, tp, sp, modn);
    1.1  mrg       MPN_DECR_U (tp, modn, cy);
    1.1  mrg
    1.1  mrg       ASSERT (mpn_zero_p (tp + nn, modn - nn));
    1.1  mrg       MPN_COPY (bp, tp, nn);
    1.1  mrg
    1.1  mrg       while ( (ap[nn-1] | bp[nn-1]) == 0)
    1.1  mrg 	{
    1.1  mrg 	  nn--;
    1.1  mrg 	  ASSERT (nn > 0);
    1.1  mrg 	}
    1.1  mrg     }
    1.1  mrg   TMP_FREE;
    1.1  mrg
    1.1  mrg   return nn;
    1.1  mrg }
    1.1  mrg
    1.1  mrg mp_size_t
    1.1  mrg mpn_hgcd_reduce_itch (mp_size_t n, mp_size_t p)
    1.1  mrg {
    1.1  mrg   mp_size_t itch;
    1.1  mrg   if (BELOW_THRESHOLD (n, HGCD_REDUCE_THRESHOLD))
    1.1  mrg     {
    1.1  mrg       itch = mpn_hgcd_itch (n-p);
    1.1  mrg
    1.1  mrg       /* For arbitrary p, the storage for _adjust is 2*(p + M->n) = 2 *
    1.1  mrg 	 (p + ceil((n-p)/2) - 1 <= n + p - 1 */
    1.1  mrg       if (itch < n + p - 1)
    1.1  mrg 	itch = n + p - 1;
    1.1  mrg     }
    1.1  mrg   else
    1.1  mrg     {
    1.1  mrg       itch = 2*(n-p) + mpn_hgcd_itch (n-p);
    1.1  mrg       /* Currently, hgcd_matrix_apply allocates its own storage. */
    1.1  mrg     }
    1.1  mrg   return itch;
    1.1  mrg }
    1.1  mrg
    1.1  mrg /* FIXME: Document storage need. */
    1.1  mrg mp_size_t
    1.1  mrg mpn_hgcd_reduce (struct hgcd_matrix *M,
    1.1  mrg 		 mp_ptr ap, mp_ptr bp, mp_size_t n, mp_size_t p,
    1.1  mrg 		 mp_ptr tp)
    1.1  mrg {
    1.1  mrg   mp_size_t nn;
    1.1  mrg   if (BELOW_THRESHOLD (n, HGCD_REDUCE_THRESHOLD))
    1.1  mrg     {
    1.1  mrg       nn = mpn_hgcd (ap + p, bp + p, n - p, M, tp);
    1.1  mrg       if (nn > 0)
    1.1  mrg 	/* Needs 2*(p + M->n) <= 2*(floor(n/2) + ceil(n/2) - 1)
    1.1  mrg 	   = 2 (n - 1) */
    1.1  mrg 	return mpn_hgcd_matrix_adjust (M, p + nn, ap, bp, p, tp);
    1.1  mrg     }
    1.1  mrg   else
    1.1  mrg     {
    1.1  mrg       MPN_COPY (tp, ap + p, n - p);
    1.1  mrg       MPN_COPY (tp + n - p, bp + p, n - p);
    1.1  mrg       if (mpn_hgcd_appr (tp, tp + n - p, n - p, M, tp + 2*(n-p)))
    1.1  mrg 	return hgcd_matrix_apply (M, ap, bp, n);
    1.1  mrg     }
    1.1  mrg   return 0;
    1.1  mrg }