dist/imath/imath.c

1.1  mrg /*
1.1  mrg   Name:     imath.c
1.1  mrg   Purpose:  Arbitrary precision integer arithmetic routines.
1.1  mrg   Author:   M. J. Fromberger
1.1  mrg
1.1  mrg   Copyright (C) 2002-2007 Michael J. Fromberger, All Rights Reserved.
1.1  mrg
1.1  mrg   Permission is hereby granted, free of charge, to any person obtaining a copy
1.1  mrg   of this software and associated documentation files (the "Software"), to deal
1.1  mrg   in the Software without restriction, including without limitation the rights
1.1  mrg   to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
1.1  mrg   copies of the Software, and to permit persons to whom the Software is
1.1  mrg   furnished to do so, subject to the following conditions:
1.1  mrg
1.1  mrg   The above copyright notice and this permission notice shall be included in
1.1  mrg   all copies or substantial portions of the Software.
1.1  mrg
1.1  mrg   THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
1.1  mrg   IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
1.1  mrg   FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL THE
1.1  mrg   AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
1.1  mrg   LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
1.1  mrg   OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
1.1  mrg   SOFTWARE.
1.1  mrg  */
1.1  mrg
1.1  mrg #include "imath.h"
1.1  mrg
1.1  mrg #include <assert.h>
1.1  mrg #include <ctype.h>
1.1  mrg #include <stdlib.h>
1.1  mrg #include <string.h>
1.1  mrg
1.1  mrg const mp_result MP_OK = 0;      /* no error, all is well  */
1.1  mrg const mp_result MP_FALSE = 0;   /* boolean false          */
1.1  mrg const mp_result MP_TRUE = -1;   /* boolean true           */
1.1  mrg const mp_result MP_MEMORY = -2; /* out of memory          */
1.1  mrg const mp_result MP_RANGE = -3;  /* argument out of range  */
1.1  mrg const mp_result MP_UNDEF = -4;  /* result undefined       */
1.1  mrg const mp_result MP_TRUNC = -5;  /* output truncated       */
1.1  mrg const mp_result MP_BADARG = -6; /* invalid null argument  */
1.1  mrg const mp_result MP_MINERR = -6;
1.1  mrg
1.1  mrg const mp_sign MP_NEG = 1;  /* value is strictly negative */
1.1  mrg const mp_sign MP_ZPOS = 0; /* value is non-negative      */
1.1  mrg
1.1  mrg static const char *s_unknown_err = "unknown result code";
1.1  mrg static const char *s_error_msg[] = {"error code 0",     "boolean true",
1.1  mrg                                     "out of memory",    "argument out of range",
1.1  mrg                                     "result undefined", "output truncated",
1.1  mrg                                     "invalid argument", NULL};
1.1  mrg
1.1  mrg /* The ith entry of this table gives the value of log_i(2).
1.1  mrg
1.1  mrg    An integer value n requires ceil(log_i(n)) digits to be represented
1.1  mrg    in base i.  Since it is easy to compute lg(n), by counting bits, we
1.1  mrg    can compute log_i(n) = lg(n) * log_i(2).
1.1  mrg
1.1  mrg    The use of this table eliminates a dependency upon linkage against
1.1  mrg    the standard math libraries.
1.1  mrg
1.1  mrg    If MP_MAX_RADIX is increased, this table should be expanded too.
1.1  mrg  */
1.1  mrg static const double s_log2[] = {
1.1  mrg     0.000000000, 0.000000000, 1.000000000, 0.630929754, /* (D)(D) 2  3 */
1.1  mrg     0.500000000, 0.430676558, 0.386852807, 0.356207187, /*  4  5  6  7 */
1.1  mrg     0.333333333, 0.315464877, 0.301029996, 0.289064826, /*  8  9 10 11 */
1.1  mrg     0.278942946, 0.270238154, 0.262649535, 0.255958025, /* 12 13 14 15 */
1.1  mrg     0.250000000, 0.244650542, 0.239812467, 0.235408913, /* 16 17 18 19 */
1.1  mrg     0.231378213, 0.227670249, 0.224243824, 0.221064729, /* 20 21 22 23 */
1.1  mrg     0.218104292, 0.215338279, 0.212746054, 0.210309918, /* 24 25 26 27 */
1.1  mrg     0.208014598, 0.205846832, 0.203795047, 0.201849087, /* 28 29 30 31 */
1.1  mrg     0.200000000, 0.198239863, 0.196561632, 0.194959022, /* 32 33 34 35 */
1.1  mrg     0.193426404,                                        /* 36          */
1.1  mrg };
1.1  mrg
1.1  mrg /* Return the number of digits needed to represent a static value */
1.1  mrg #define MP_VALUE_DIGITS(V) \
1.1  mrg   ((sizeof(V) + (sizeof(mp_digit) - 1)) / sizeof(mp_digit))
1.1  mrg
1.1  mrg /* Round precision P to nearest word boundary */
1.1  mrg static inline mp_size s_round_prec(mp_size P) { return 2 * ((P + 1) / 2); }
1.1  mrg
1.1  mrg /* Set array P of S digits to zero */
1.1  mrg static inline void ZERO(mp_digit *P, mp_size S) {
1.1  mrg   mp_size i__ = S * sizeof(mp_digit);
1.1  mrg   mp_digit *p__ = P;
1.1  mrg   memset(p__, 0, i__);
1.1  mrg }
1.1  mrg
1.1  mrg /* Copy S digits from array P to array Q */
1.1  mrg static inline void COPY(mp_digit *P, mp_digit *Q, mp_size S) {
1.1  mrg   mp_size i__ = S * sizeof(mp_digit);
1.1  mrg   mp_digit *p__ = P;
1.1  mrg   mp_digit *q__ = Q;
1.1  mrg   memcpy(q__, p__, i__);
1.1  mrg }
1.1  mrg
1.1  mrg /* Reverse N elements of unsigned char in A. */
1.1  mrg static inline void REV(unsigned char *A, int N) {
1.1  mrg   unsigned char *u_ = A;
1.1  mrg   unsigned char *v_ = u_ + N - 1;
1.1  mrg   while (u_ < v_) {
1.1  mrg     unsigned char xch = *u_;
1.1  mrg     *u_++ = *v_;
1.1  mrg     *v_-- = xch;
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg /* Strip leading zeroes from z_ in-place. */
1.1  mrg static inline void CLAMP(mp_int z_) {
1.1  mrg   mp_size uz_ = MP_USED(z_);
1.1  mrg   mp_digit *dz_ = MP_DIGITS(z_) + uz_ - 1;
1.1  mrg   while (uz_ > 1 && (*dz_-- == 0)) --uz_;
1.1  mrg   z_->used = uz_;
1.1  mrg }
1.1  mrg
1.1  mrg /* Select min/max. */
1.1  mrg static inline int MIN(int A, int B) { return (B < A ? B : A); }
1.1  mrg static inline mp_size MAX(mp_size A, mp_size B) { return (B > A ? B : A); }
1.1  mrg
1.1  mrg /* Exchange lvalues A and B of type T, e.g.
1.1  mrg    SWAP(int, x, y) where x and y are variables of type int. */
1.1  mrg #define SWAP(T, A, B) \
1.1  mrg   do {                \
1.1  mrg     T t_ = (A);       \
1.1  mrg     A = (B);          \
1.1  mrg     B = t_;           \
1.1  mrg   } while (0)
1.1  mrg
1.1  mrg /* Declare a block of N temporary mpz_t values.
1.1  mrg    These values are initialized to zero.
1.1  mrg    You must add CLEANUP_TEMP() at the end of the function.
1.1  mrg    Use TEMP(i) to access a pointer to the ith value.
1.1  mrg  */
1.1  mrg #define DECLARE_TEMP(N)                   \
1.1  mrg   struct {                                \
1.1  mrg     mpz_t value[(N)];                     \
1.1  mrg     int len;                              \
1.1  mrg     mp_result err;                        \
1.1  mrg   } temp_ = {                             \
1.1  mrg       .len = (N),                         \
1.1  mrg       .err = MP_OK,                       \
1.1  mrg   };                                      \
1.1  mrg   do {                                    \
1.1  mrg     for (int i = 0; i < temp_.len; i++) { \
1.1  mrg       mp_int_init(TEMP(i));               \
1.1  mrg     }                                     \
1.1  mrg   } while (0)
1.1  mrg
1.1  mrg /* Clear all allocated temp values. */
1.1  mrg #define CLEANUP_TEMP()                    \
1.1  mrg   CLEANUP:                                \
1.1  mrg   do {                                    \
1.1  mrg     for (int i = 0; i < temp_.len; i++) { \
1.1  mrg       mp_int_clear(TEMP(i));              \
1.1  mrg     }                                     \
1.1  mrg     if (temp_.err != MP_OK) {             \
1.1  mrg       return temp_.err;                   \
1.1  mrg     }                                     \
1.1  mrg   } while (0)
1.1  mrg
1.1  mrg /* A pointer to the kth temp value. */
1.1  mrg #define TEMP(K) (temp_.value + (K))
1.1  mrg
1.1  mrg /* Evaluate E, an expression of type mp_result expected to return MP_OK.  If
1.1  mrg    the value is not MP_OK, the error is cached and control resumes at the
1.1  mrg    cleanup handler, which returns it.
1.1  mrg */
1.1  mrg #define REQUIRE(E)                        \
1.1  mrg   do {                                    \
1.1  mrg     temp_.err = (E);                      \
1.1  mrg     if (temp_.err != MP_OK) goto CLEANUP; \
1.1  mrg   } while (0)
1.1  mrg
1.1  mrg /* Compare value to zero. */
1.1  mrg static inline int CMPZ(mp_int Z) {
1.1  mrg   if (Z->used == 1 && Z->digits[0] == 0) return 0;
1.1  mrg   return (Z->sign == MP_NEG) ? -1 : 1;
1.1  mrg }
1.1  mrg
1.1  mrg static inline mp_word UPPER_HALF(mp_word W) { return (W >> MP_DIGIT_BIT); }
1.1  mrg static inline mp_digit LOWER_HALF(mp_word W) { return (mp_digit)(W); }
1.1  mrg
1.1  mrg /* Report whether the highest-order bit of W is 1. */
1.1  mrg static inline bool HIGH_BIT_SET(mp_word W) {
1.1  mrg   return (W >> (MP_WORD_BIT - 1)) != 0;
1.1  mrg }
1.1  mrg
1.1  mrg /* Report whether adding W + V will carry out. */
1.1  mrg static inline bool ADD_WILL_OVERFLOW(mp_word W, mp_word V) {
1.1  mrg   return ((MP_WORD_MAX - V) < W);
1.1  mrg }
1.1  mrg
1.1  mrg /* Default number of digits allocated to a new mp_int */
1.1  mrg static mp_size default_precision = 8;
1.1  mrg
1.1  mrg void mp_int_default_precision(mp_size size) {
1.1  mrg   assert(size > 0);
1.1  mrg   default_precision = size;
1.1  mrg }
1.1  mrg
1.1  mrg /* Minimum number of digits to invoke recursive multiply */
1.1  mrg static mp_size multiply_threshold = 32;
1.1  mrg
1.1  mrg void mp_int_multiply_threshold(mp_size thresh) {
1.1  mrg   assert(thresh >= sizeof(mp_word));
1.1  mrg   multiply_threshold = thresh;
1.1  mrg }
1.1  mrg
1.1  mrg /* Allocate a buffer of (at least) num digits, or return
1.1  mrg    NULL if that couldn't be done.  */
1.1  mrg static mp_digit *s_alloc(mp_size num);
1.1  mrg
1.1  mrg /* Release a buffer of digits allocated by s_alloc(). */
1.1  mrg static void s_free(void *ptr);
1.1  mrg
1.1  mrg /* Insure that z has at least min digits allocated, resizing if
1.1  mrg    necessary.  Returns true if successful, false if out of memory. */
1.1  mrg static bool s_pad(mp_int z, mp_size min);
1.1  mrg
1.1  mrg /* Ensure Z has at least N digits allocated. */
1.1  mrg static inline mp_result GROW(mp_int Z, mp_size N) {
1.1  mrg   return s_pad(Z, N) ? MP_OK : MP_MEMORY;
1.1  mrg }
1.1  mrg
1.1  mrg /* Fill in a "fake" mp_int on the stack with a given value */
1.1  mrg static void s_fake(mp_int z, mp_small value, mp_digit vbuf[]);
1.1  mrg static void s_ufake(mp_int z, mp_usmall value, mp_digit vbuf[]);
1.1  mrg
1.1  mrg /* Compare two runs of digits of given length, returns <0, 0, >0 */
1.1  mrg static int s_cdig(mp_digit *da, mp_digit *db, mp_size len);
1.1  mrg
1.1  mrg /* Pack the unsigned digits of v into array t */
1.1  mrg static int s_uvpack(mp_usmall v, mp_digit t[]);
1.1  mrg
1.1  mrg /* Compare magnitudes of a and b, returns <0, 0, >0 */
1.1  mrg static int s_ucmp(mp_int a, mp_int b);
1.1  mrg
1.1  mrg /* Compare magnitudes of a and v, returns <0, 0, >0 */
1.1  mrg static int s_vcmp(mp_int a, mp_small v);
1.1  mrg static int s_uvcmp(mp_int a, mp_usmall uv);
1.1  mrg
1.1  mrg /* Unsigned magnitude addition; assumes dc is big enough.
1.1  mrg    Carry out is returned (no memory allocated). */
1.1  mrg static mp_digit s_uadd(mp_digit *da, mp_digit *db, mp_digit *dc, mp_size size_a,
1.1  mrg                        mp_size size_b);
1.1  mrg
1.1  mrg /* Unsigned magnitude subtraction.  Assumes dc is big enough. */
1.1  mrg static void s_usub(mp_digit *da, mp_digit *db, mp_digit *dc, mp_size size_a,
1.1  mrg                    mp_size size_b);
1.1  mrg
1.1  mrg /* Unsigned recursive multiplication.  Assumes dc is big enough. */
1.1  mrg static int s_kmul(mp_digit *da, mp_digit *db, mp_digit *dc, mp_size size_a,
1.1  mrg                   mp_size size_b);
1.1  mrg
1.1  mrg /* Unsigned magnitude multiplication.  Assumes dc is big enough. */
1.1  mrg static void s_umul(mp_digit *da, mp_digit *db, mp_digit *dc, mp_size size_a,
1.1  mrg                    mp_size size_b);
1.1  mrg
1.1  mrg /* Unsigned recursive squaring.  Assumes dc is big enough. */
1.1  mrg static int s_ksqr(mp_digit *da, mp_digit *dc, mp_size size_a);
1.1  mrg
1.1  mrg /* Unsigned magnitude squaring.  Assumes dc is big enough. */
1.1  mrg static void s_usqr(mp_digit *da, mp_digit *dc, mp_size size_a);
1.1  mrg
1.1  mrg /* Single digit addition.  Assumes a is big enough. */
1.1  mrg static void s_dadd(mp_int a, mp_digit b);
1.1  mrg
1.1  mrg /* Single digit multiplication.  Assumes a is big enough. */
1.1  mrg static void s_dmul(mp_int a, mp_digit b);
1.1  mrg
1.1  mrg /* Single digit multiplication on buffers; assumes dc is big enough. */
1.1  mrg static void s_dbmul(mp_digit *da, mp_digit b, mp_digit *dc, mp_size size_a);
1.1  mrg
1.1  mrg /* Single digit division.  Replaces a with the quotient,
1.1  mrg    returns the remainder.  */
1.1  mrg static mp_digit s_ddiv(mp_int a, mp_digit b);
1.1  mrg
1.1  mrg /* Quick division by a power of 2, replaces z (no allocation) */
1.1  mrg static void s_qdiv(mp_int z, mp_size p2);
1.1  mrg
1.1  mrg /* Quick remainder by a power of 2, replaces z (no allocation) */
1.1  mrg static void s_qmod(mp_int z, mp_size p2);
1.1  mrg
1.1  mrg /* Quick multiplication by a power of 2, replaces z.
1.1  mrg    Allocates if necessary; returns false in case this fails. */
1.1  mrg static int s_qmul(mp_int z, mp_size p2);
1.1  mrg
1.1  mrg /* Quick subtraction from a power of 2, replaces z.
1.1  mrg    Allocates if necessary; returns false in case this fails. */
1.1  mrg static int s_qsub(mp_int z, mp_size p2);
1.1  mrg
1.1  mrg /* Return maximum k such that 2^k divides z. */
1.1  mrg static int s_dp2k(mp_int z);
1.1  mrg
1.1  mrg /* Return k >= 0 such that z = 2^k, or -1 if there is no such k. */
1.1  mrg static int s_isp2(mp_int z);
1.1  mrg
1.1  mrg /* Set z to 2^k.  May allocate; returns false in case this fails. */
1.1  mrg static int s_2expt(mp_int z, mp_small k);
1.1  mrg
1.1  mrg /* Normalize a and b for division, returns normalization constant */
1.1  mrg static int s_norm(mp_int a, mp_int b);
1.1  mrg
1.1  mrg /* Compute constant mu for Barrett reduction, given modulus m, result
1.1  mrg    replaces z, m is untouched. */
1.1  mrg static mp_result s_brmu(mp_int z, mp_int m);
1.1  mrg
1.1  mrg /* Reduce a modulo m, using Barrett's algorithm. */
1.1  mrg static int s_reduce(mp_int x, mp_int m, mp_int mu, mp_int q1, mp_int q2);
1.1  mrg
1.1  mrg /* Modular exponentiation, using Barrett reduction */
1.1  mrg static mp_result s_embar(mp_int a, mp_int b, mp_int m, mp_int mu, mp_int c);
1.1  mrg
1.1  mrg /* Unsigned magnitude division.  Assumes |a| > |b|.  Allocates temporaries;
1.1  mrg    overwrites a with quotient, b with remainder. */
1.1  mrg static mp_result s_udiv_knuth(mp_int a, mp_int b);
1.1  mrg
1.1  mrg /* Compute the number of digits in radix r required to represent the given
1.1  mrg    value.  Does not account for sign flags, terminators, etc. */
1.1  mrg static int s_outlen(mp_int z, mp_size r);
1.1  mrg
1.1  mrg /* Guess how many digits of precision will be needed to represent a radix r
1.1  mrg    value of the specified number of digits.  Returns a value guaranteed to be
1.1  mrg    no smaller than the actual number required. */
1.1  mrg static mp_size s_inlen(int len, mp_size r);
1.1  mrg
1.1  mrg /* Convert a character to a digit value in radix r, or
1.1  mrg    -1 if out of range */
1.1  mrg static int s_ch2val(char c, int r);
1.1  mrg
1.1  mrg /* Convert a digit value to a character */
1.1  mrg static char s_val2ch(int v, int caps);
1.1  mrg
1.1  mrg /* Take 2's complement of a buffer in place */
1.1  mrg static void s_2comp(unsigned char *buf, int len);
1.1  mrg
1.1  mrg /* Convert a value to binary, ignoring sign.  On input, *limpos is the bound on
1.1  mrg    how many bytes should be written to buf; on output, *limpos is set to the
1.1  mrg    number of bytes actually written. */
1.1  mrg static mp_result s_tobin(mp_int z, unsigned char *buf, int *limpos, int pad);
1.1  mrg
1.1  mrg /* Multiply X by Y into Z, ignoring signs.  Requires that Z have enough storage
1.1  mrg    preallocated to hold the result. */
1.1  mrg static inline void UMUL(mp_int X, mp_int Y, mp_int Z) {
1.1  mrg   mp_size ua_ = MP_USED(X);
1.1  mrg   mp_size ub_ = MP_USED(Y);
1.1  mrg   mp_size o_ = ua_ + ub_;
1.1  mrg   ZERO(MP_DIGITS(Z), o_);
1.1  mrg   (void)s_kmul(MP_DIGITS(X), MP_DIGITS(Y), MP_DIGITS(Z), ua_, ub_);
1.1  mrg   Z->used = o_;
1.1  mrg   CLAMP(Z);
1.1  mrg }
1.1  mrg
1.1  mrg /* Square X into Z.  Requires that Z have enough storage to hold the result. */
1.1  mrg static inline void USQR(mp_int X, mp_int Z) {
1.1  mrg   mp_size ua_ = MP_USED(X);
1.1  mrg   mp_size o_ = ua_ + ua_;
1.1  mrg   ZERO(MP_DIGITS(Z), o_);
1.1  mrg   (void)s_ksqr(MP_DIGITS(X), MP_DIGITS(Z), ua_);
1.1  mrg   Z->used = o_;
1.1  mrg   CLAMP(Z);
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_init(mp_int z) {
1.1  mrg   if (z == NULL) return MP_BADARG;
1.1  mrg
1.1  mrg   z->single = 0;
1.1  mrg   z->digits = &(z->single);
1.1  mrg   z->alloc = 1;
1.1  mrg   z->used = 1;
1.1  mrg   z->sign = MP_ZPOS;
1.1  mrg
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_int mp_int_alloc(void) {
1.1  mrg   mp_int out = malloc(sizeof(mpz_t));
1.1  mrg
1.1  mrg   if (out != NULL) mp_int_init(out);
1.1  mrg
1.1  mrg   return out;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_init_size(mp_int z, mp_size prec) {
1.1  mrg   assert(z != NULL);
1.1  mrg
1.1  mrg   if (prec == 0) {
1.1  mrg     prec = default_precision;
1.1  mrg   } else if (prec == 1) {
1.1  mrg     return mp_int_init(z);
1.1  mrg   } else {
1.1  mrg     prec = s_round_prec(prec);
1.1  mrg   }
1.1  mrg
1.1  mrg   z->digits = s_alloc(prec);
1.1  mrg   if (MP_DIGITS(z) == NULL) return MP_MEMORY;
1.1  mrg
1.1  mrg   z->digits[0] = 0;
1.1  mrg   z->used = 1;
1.1  mrg   z->alloc = prec;
1.1  mrg   z->sign = MP_ZPOS;
1.1  mrg
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_init_copy(mp_int z, mp_int old) {
1.1  mrg   assert(z != NULL && old != NULL);
1.1  mrg
1.1  mrg   mp_size uold = MP_USED(old);
1.1  mrg   if (uold == 1) {
1.1  mrg     mp_int_init(z);
1.1  mrg   } else {
1.1  mrg     mp_size target = MAX(uold, default_precision);
1.1  mrg     mp_result res = mp_int_init_size(z, target);
1.1  mrg     if (res != MP_OK) return res;
1.1  mrg   }
1.1  mrg
1.1  mrg   z->used = uold;
1.1  mrg   z->sign = old->sign;
1.1  mrg   COPY(MP_DIGITS(old), MP_DIGITS(z), uold);
1.1  mrg
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_init_value(mp_int z, mp_small value) {
1.1  mrg   mpz_t vtmp;
1.1  mrg   mp_digit vbuf[MP_VALUE_DIGITS(value)];
1.1  mrg
1.1  mrg   s_fake(&vtmp, value, vbuf);
1.1  mrg   return mp_int_init_copy(z, &vtmp);
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_init_uvalue(mp_int z, mp_usmall uvalue) {
1.1  mrg   mpz_t vtmp;
1.1  mrg   mp_digit vbuf[MP_VALUE_DIGITS(uvalue)];
1.1  mrg
1.1  mrg   s_ufake(&vtmp, uvalue, vbuf);
1.1  mrg   return mp_int_init_copy(z, &vtmp);
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_set_value(mp_int z, mp_small value) {
1.1  mrg   mpz_t vtmp;
1.1  mrg   mp_digit vbuf[MP_VALUE_DIGITS(value)];
1.1  mrg
1.1  mrg   s_fake(&vtmp, value, vbuf);
1.1  mrg   return mp_int_copy(&vtmp, z);
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_set_uvalue(mp_int z, mp_usmall uvalue) {
1.1  mrg   mpz_t vtmp;
1.1  mrg   mp_digit vbuf[MP_VALUE_DIGITS(uvalue)];
1.1  mrg
1.1  mrg   s_ufake(&vtmp, uvalue, vbuf);
1.1  mrg   return mp_int_copy(&vtmp, z);
1.1  mrg }
1.1  mrg
1.1  mrg void mp_int_clear(mp_int z) {
1.1  mrg   if (z == NULL) return;
1.1  mrg
1.1  mrg   if (MP_DIGITS(z) != NULL) {
1.1  mrg     if (MP_DIGITS(z) != &(z->single)) s_free(MP_DIGITS(z));
1.1  mrg
1.1  mrg     z->digits = NULL;
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg void mp_int_free(mp_int z) {
1.1  mrg   assert(z != NULL);
1.1  mrg
1.1  mrg   mp_int_clear(z);
1.1  mrg   free(z); /* note: NOT s_free() */
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_copy(mp_int a, mp_int c) {
1.1  mrg   assert(a != NULL && c != NULL);
1.1  mrg
1.1  mrg   if (a != c) {
1.1  mrg     mp_size ua = MP_USED(a);
1.1  mrg     mp_digit *da, *dc;
1.1  mrg
1.1  mrg     if (!s_pad(c, ua)) return MP_MEMORY;
1.1  mrg
1.1  mrg     da = MP_DIGITS(a);
1.1  mrg     dc = MP_DIGITS(c);
1.1  mrg     COPY(da, dc, ua);
1.1  mrg
1.1  mrg     c->used = ua;
1.1  mrg     c->sign = a->sign;
1.1  mrg   }
1.1  mrg
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg void mp_int_swap(mp_int a, mp_int c) {
1.1  mrg   if (a != c) {
1.1  mrg     mpz_t tmp = *a;
1.1  mrg
1.1  mrg     *a = *c;
1.1  mrg     *c = tmp;
1.1  mrg
1.1  mrg     if (MP_DIGITS(a) == &(c->single)) a->digits = &(a->single);
1.1  mrg     if (MP_DIGITS(c) == &(a->single)) c->digits = &(c->single);
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg void mp_int_zero(mp_int z) {
1.1  mrg   assert(z != NULL);
1.1  mrg
1.1  mrg   z->digits[0] = 0;
1.1  mrg   z->used = 1;
1.1  mrg   z->sign = MP_ZPOS;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_abs(mp_int a, mp_int c) {
1.1  mrg   assert(a != NULL && c != NULL);
1.1  mrg
1.1  mrg   mp_result res;
1.1  mrg   if ((res = mp_int_copy(a, c)) != MP_OK) return res;
1.1  mrg
1.1  mrg   c->sign = MP_ZPOS;
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_neg(mp_int a, mp_int c) {
1.1  mrg   assert(a != NULL && c != NULL);
1.1  mrg
1.1  mrg   mp_result res;
1.1  mrg   if ((res = mp_int_copy(a, c)) != MP_OK) return res;
1.1  mrg
1.1  mrg   if (CMPZ(c) != 0) c->sign = 1 - MP_SIGN(a);
1.1  mrg
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_add(mp_int a, mp_int b, mp_int c) {
1.1  mrg   assert(a != NULL && b != NULL && c != NULL);
1.1  mrg
1.1  mrg   mp_size ua = MP_USED(a);
1.1  mrg   mp_size ub = MP_USED(b);
1.1  mrg   mp_size max = MAX(ua, ub);
1.1  mrg
1.1  mrg   if (MP_SIGN(a) == MP_SIGN(b)) {
1.1  mrg     /* Same sign -- add magnitudes, preserve sign of addends */
1.1  mrg     if (!s_pad(c, max)) return MP_MEMORY;
1.1  mrg
1.1  mrg     mp_digit carry = s_uadd(MP_DIGITS(a), MP_DIGITS(b), MP_DIGITS(c), ua, ub);
1.1  mrg     mp_size uc = max;
1.1  mrg
1.1  mrg     if (carry) {
1.1  mrg       if (!s_pad(c, max + 1)) return MP_MEMORY;
1.1  mrg
1.1  mrg       c->digits[max] = carry;
1.1  mrg       ++uc;
1.1  mrg     }
1.1  mrg
1.1  mrg     c->used = uc;
1.1  mrg     c->sign = a->sign;
1.1  mrg
1.1  mrg   } else {
1.1  mrg     /* Different signs -- subtract magnitudes, preserve sign of greater */
1.1  mrg     int cmp = s_ucmp(a, b); /* magnitude comparison, sign ignored */
1.1  mrg
1.1  mrg     /* Set x to max(a, b), y to min(a, b) to simplify later code.
1.1  mrg        A special case yields zero for equal magnitudes.
1.1  mrg     */
1.1  mrg     mp_int x, y;
1.1  mrg     if (cmp == 0) {
1.1  mrg       mp_int_zero(c);
1.1  mrg       return MP_OK;
1.1  mrg     } else if (cmp < 0) {
1.1  mrg       x = b;
1.1  mrg       y = a;
1.1  mrg     } else {
1.1  mrg       x = a;
1.1  mrg       y = b;
1.1  mrg     }
1.1  mrg
1.1  mrg     if (!s_pad(c, MP_USED(x))) return MP_MEMORY;
1.1  mrg
1.1  mrg     /* Subtract smaller from larger */
1.1  mrg     s_usub(MP_DIGITS(x), MP_DIGITS(y), MP_DIGITS(c), MP_USED(x), MP_USED(y));
1.1  mrg     c->used = x->used;
1.1  mrg     CLAMP(c);
1.1  mrg
1.1  mrg     /* Give result the sign of the larger */
1.1  mrg     c->sign = x->sign;
1.1  mrg   }
1.1  mrg
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_add_value(mp_int a, mp_small value, mp_int c) {
1.1  mrg   mpz_t vtmp;
1.1  mrg   mp_digit vbuf[MP_VALUE_DIGITS(value)];
1.1  mrg
1.1  mrg   s_fake(&vtmp, value, vbuf);
1.1  mrg
1.1  mrg   return mp_int_add(a, &vtmp, c);
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_sub(mp_int a, mp_int b, mp_int c) {
1.1  mrg   assert(a != NULL && b != NULL && c != NULL);
1.1  mrg
1.1  mrg   mp_size ua = MP_USED(a);
1.1  mrg   mp_size ub = MP_USED(b);
1.1  mrg   mp_size max = MAX(ua, ub);
1.1  mrg
1.1  mrg   if (MP_SIGN(a) != MP_SIGN(b)) {
1.1  mrg     /* Different signs -- add magnitudes and keep sign of a */
1.1  mrg     if (!s_pad(c, max)) return MP_MEMORY;
1.1  mrg
1.1  mrg     mp_digit carry = s_uadd(MP_DIGITS(a), MP_DIGITS(b), MP_DIGITS(c), ua, ub);
1.1  mrg     mp_size uc = max;
1.1  mrg
1.1  mrg     if (carry) {
1.1  mrg       if (!s_pad(c, max + 1)) return MP_MEMORY;
1.1  mrg
1.1  mrg       c->digits[max] = carry;
1.1  mrg       ++uc;
1.1  mrg     }
1.1  mrg
1.1  mrg     c->used = uc;
1.1  mrg     c->sign = a->sign;
1.1  mrg
1.1  mrg   } else {
1.1  mrg     /* Same signs -- subtract magnitudes */
1.1  mrg     if (!s_pad(c, max)) return MP_MEMORY;
1.1  mrg     mp_int x, y;
1.1  mrg     mp_sign osign;
1.1  mrg
1.1  mrg     int cmp = s_ucmp(a, b);
1.1  mrg     if (cmp >= 0) {
1.1  mrg       x = a;
1.1  mrg       y = b;
1.1  mrg       osign = MP_ZPOS;
1.1  mrg     } else {
1.1  mrg       x = b;
1.1  mrg       y = a;
1.1  mrg       osign = MP_NEG;
1.1  mrg     }
1.1  mrg
1.1  mrg     if (MP_SIGN(a) == MP_NEG && cmp != 0) osign = 1 - osign;
1.1  mrg
1.1  mrg     s_usub(MP_DIGITS(x), MP_DIGITS(y), MP_DIGITS(c), MP_USED(x), MP_USED(y));
1.1  mrg     c->used = x->used;
1.1  mrg     CLAMP(c);
1.1  mrg
1.1  mrg     c->sign = osign;
1.1  mrg   }
1.1  mrg
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_sub_value(mp_int a, mp_small value, mp_int c) {
1.1  mrg   mpz_t vtmp;
1.1  mrg   mp_digit vbuf[MP_VALUE_DIGITS(value)];
1.1  mrg
1.1  mrg   s_fake(&vtmp, value, vbuf);
1.1  mrg
1.1  mrg   return mp_int_sub(a, &vtmp, c);
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_mul(mp_int a, mp_int b, mp_int c) {
1.1  mrg   assert(a != NULL && b != NULL && c != NULL);
1.1  mrg
1.1  mrg   /* If either input is zero, we can shortcut multiplication */
1.1  mrg   if (mp_int_compare_zero(a) == 0 || mp_int_compare_zero(b) == 0) {
1.1  mrg     mp_int_zero(c);
1.1  mrg     return MP_OK;
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Output is positive if inputs have same sign, otherwise negative */
1.1  mrg   mp_sign osign = (MP_SIGN(a) == MP_SIGN(b)) ? MP_ZPOS : MP_NEG;
1.1  mrg
1.1  mrg   /* If the output is not identical to any of the inputs, we'll write the
1.1  mrg      results directly; otherwise, allocate a temporary space. */
1.1  mrg   mp_size ua = MP_USED(a);
1.1  mrg   mp_size ub = MP_USED(b);
1.1  mrg   mp_size osize = MAX(ua, ub);
1.1  mrg   osize = 4 * ((osize + 1) / 2);
1.1  mrg
1.1  mrg   mp_digit *out;
1.1  mrg   mp_size p = 0;
1.1  mrg   if (c == a || c == b) {
1.1  mrg     p = MAX(s_round_prec(osize), default_precision);
1.1  mrg
1.1  mrg     if ((out = s_alloc(p)) == NULL) return MP_MEMORY;
1.1  mrg   } else {
1.1  mrg     if (!s_pad(c, osize)) return MP_MEMORY;
1.1  mrg
1.1  mrg     out = MP_DIGITS(c);
1.1  mrg   }
1.1  mrg   ZERO(out, osize);
1.1  mrg
1.1  mrg   if (!s_kmul(MP_DIGITS(a), MP_DIGITS(b), out, ua, ub)) return MP_MEMORY;
1.1  mrg
1.1  mrg   /* If we allocated a new buffer, get rid of whatever memory c was already
1.1  mrg      using, and fix up its fields to reflect that.
1.1  mrg    */
1.1  mrg   if (out != MP_DIGITS(c)) {
1.1  mrg     if ((void *)MP_DIGITS(c) != (void *)c) s_free(MP_DIGITS(c));
1.1  mrg     c->digits = out;
1.1  mrg     c->alloc = p;
1.1  mrg   }
1.1  mrg
1.1  mrg   c->used = osize; /* might not be true, but we'll fix it ... */
1.1  mrg   CLAMP(c);        /* ... right here */
1.1  mrg   c->sign = osign;
1.1  mrg
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_mul_value(mp_int a, mp_small value, mp_int c) {
1.1  mrg   mpz_t vtmp;
1.1  mrg   mp_digit vbuf[MP_VALUE_DIGITS(value)];
1.1  mrg
1.1  mrg   s_fake(&vtmp, value, vbuf);
1.1  mrg
1.1  mrg   return mp_int_mul(a, &vtmp, c);
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_mul_pow2(mp_int a, mp_small p2, mp_int c) {
1.1  mrg   assert(a != NULL && c != NULL && p2 >= 0);
1.1  mrg
1.1  mrg   mp_result res = mp_int_copy(a, c);
1.1  mrg   if (res != MP_OK) return res;
1.1  mrg
1.1  mrg   if (s_qmul(c, (mp_size)p2)) {
1.1  mrg     return MP_OK;
1.1  mrg   } else {
1.1  mrg     return MP_MEMORY;
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_sqr(mp_int a, mp_int c) {
1.1  mrg   assert(a != NULL && c != NULL);
1.1  mrg
1.1  mrg   /* Get a temporary buffer big enough to hold the result */
1.1  mrg   mp_size osize = (mp_size)4 * ((MP_USED(a) + 1) / 2);
1.1  mrg   mp_size p = 0;
1.1  mrg   mp_digit *out;
1.1  mrg   if (a == c) {
1.1  mrg     p = s_round_prec(osize);
1.1  mrg     p = MAX(p, default_precision);
1.1  mrg
1.1  mrg     if ((out = s_alloc(p)) == NULL) return MP_MEMORY;
1.1  mrg   } else {
1.1  mrg     if (!s_pad(c, osize)) return MP_MEMORY;
1.1  mrg
1.1  mrg     out = MP_DIGITS(c);
1.1  mrg   }
1.1  mrg   ZERO(out, osize);
1.1  mrg
1.1  mrg   s_ksqr(MP_DIGITS(a), out, MP_USED(a));
1.1  mrg
1.1  mrg   /* Get rid of whatever memory c was already using, and fix up its fields to
1.1  mrg      reflect the new digit array it's using
1.1  mrg    */
1.1  mrg   if (out != MP_DIGITS(c)) {
1.1  mrg     if ((void *)MP_DIGITS(c) != (void *)c) s_free(MP_DIGITS(c));
1.1  mrg     c->digits = out;
1.1  mrg     c->alloc = p;
1.1  mrg   }
1.1  mrg
1.1  mrg   c->used = osize; /* might not be true, but we'll fix it ... */
1.1  mrg   CLAMP(c);        /* ... right here */
1.1  mrg   c->sign = MP_ZPOS;
1.1  mrg
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_div(mp_int a, mp_int b, mp_int q, mp_int r) {
1.1  mrg   assert(a != NULL && b != NULL && q != r);
1.1  mrg
1.1  mrg   int cmp;
1.1  mrg   mp_result res = MP_OK;
1.1  mrg   mp_int qout, rout;
1.1  mrg   mp_sign sa = MP_SIGN(a);
1.1  mrg   mp_sign sb = MP_SIGN(b);
1.1  mrg   if (CMPZ(b) == 0) {
1.1  mrg     return MP_UNDEF;
1.1  mrg   } else if ((cmp = s_ucmp(a, b)) < 0) {
1.1  mrg     /* If |a| < |b|, no division is required:
1.1  mrg        q = 0, r = a
1.1  mrg      */
1.1  mrg     if (r && (res = mp_int_copy(a, r)) != MP_OK) return res;
1.1  mrg
1.1  mrg     if (q) mp_int_zero(q);
1.1  mrg
1.1  mrg     return MP_OK;
1.1  mrg   } else if (cmp == 0) {
1.1  mrg     /* If |a| = |b|, no division is required:
1.1  mrg        q = 1 or -1, r = 0
1.1  mrg      */
1.1  mrg     if (r) mp_int_zero(r);
1.1  mrg
1.1  mrg     if (q) {
1.1  mrg       mp_int_zero(q);
1.1  mrg       q->digits[0] = 1;
1.1  mrg
1.1  mrg       if (sa != sb) q->sign = MP_NEG;
1.1  mrg     }
1.1  mrg
1.1  mrg     return MP_OK;
1.1  mrg   }
1.1  mrg
1.1  mrg   /* When |a| > |b|, real division is required.  We need someplace to store
1.1  mrg      quotient and remainder, but q and r are allowed to be NULL or to overlap
1.1  mrg      with the inputs.
1.1  mrg    */
1.1  mrg   DECLARE_TEMP(2);
1.1  mrg   int lg;
1.1  mrg   if ((lg = s_isp2(b)) < 0) {
1.1  mrg     if (q && b != q) {
1.1  mrg       REQUIRE(mp_int_copy(a, q));
1.1  mrg       qout = q;
1.1  mrg     } else {
1.1  mrg       REQUIRE(mp_int_copy(a, TEMP(0)));
1.1  mrg       qout = TEMP(0);
1.1  mrg     }
1.1  mrg
1.1  mrg     if (r && a != r) {
1.1  mrg       REQUIRE(mp_int_copy(b, r));
1.1  mrg       rout = r;
1.1  mrg     } else {
1.1  mrg       REQUIRE(mp_int_copy(b, TEMP(1)));
1.1  mrg       rout = TEMP(1);
1.1  mrg     }
1.1  mrg
1.1  mrg     REQUIRE(s_udiv_knuth(qout, rout));
1.1  mrg   } else {
1.1  mrg     if (q) REQUIRE(mp_int_copy(a, q));
1.1  mrg     if (r) REQUIRE(mp_int_copy(a, r));
1.1  mrg
1.1  mrg     if (q) s_qdiv(q, (mp_size)lg);
1.1  mrg     qout = q;
1.1  mrg     if (r) s_qmod(r, (mp_size)lg);
1.1  mrg     rout = r;
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Recompute signs for output */
1.1  mrg   if (rout) {
1.1  mrg     rout->sign = sa;
1.1  mrg     if (CMPZ(rout) == 0) rout->sign = MP_ZPOS;
1.1  mrg   }
1.1  mrg   if (qout) {
1.1  mrg     qout->sign = (sa == sb) ? MP_ZPOS : MP_NEG;
1.1  mrg     if (CMPZ(qout) == 0) qout->sign = MP_ZPOS;
1.1  mrg   }
1.1  mrg
1.1  mrg   if (q) REQUIRE(mp_int_copy(qout, q));
1.1  mrg   if (r) REQUIRE(mp_int_copy(rout, r));
1.1  mrg   CLEANUP_TEMP();
1.1  mrg   return res;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_mod(mp_int a, mp_int m, mp_int c) {
1.1  mrg   DECLARE_TEMP(1);
1.1  mrg   mp_int out = (m == c) ? TEMP(0) : c;
1.1  mrg   REQUIRE(mp_int_div(a, m, NULL, out));
1.1  mrg   if (CMPZ(out) < 0) {
1.1  mrg     REQUIRE(mp_int_add(out, m, c));
1.1  mrg   } else {
1.1  mrg     REQUIRE(mp_int_copy(out, c));
1.1  mrg   }
1.1  mrg   CLEANUP_TEMP();
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_div_value(mp_int a, mp_small value, mp_int q, mp_small *r) {
1.1  mrg   mpz_t vtmp;
1.1  mrg   mp_digit vbuf[MP_VALUE_DIGITS(value)];
1.1  mrg   s_fake(&vtmp, value, vbuf);
1.1  mrg
1.1  mrg   DECLARE_TEMP(1);
1.1  mrg   REQUIRE(mp_int_div(a, &vtmp, q, TEMP(0)));
1.1  mrg
1.1  mrg   if (r) (void)mp_int_to_int(TEMP(0), r); /* can't fail */
1.1  mrg
1.1  mrg   CLEANUP_TEMP();
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_div_pow2(mp_int a, mp_small p2, mp_int q, mp_int r) {
1.1  mrg   assert(a != NULL && p2 >= 0 && q != r);
1.1  mrg
1.1  mrg   mp_result res = MP_OK;
1.1  mrg   if (q != NULL && (res = mp_int_copy(a, q)) == MP_OK) {
1.1  mrg     s_qdiv(q, (mp_size)p2);
1.1  mrg   }
1.1  mrg
1.1  mrg   if (res == MP_OK && r != NULL && (res = mp_int_copy(a, r)) == MP_OK) {
1.1  mrg     s_qmod(r, (mp_size)p2);
1.1  mrg   }
1.1  mrg
1.1  mrg   return res;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_expt(mp_int a, mp_small b, mp_int c) {
1.1  mrg   assert(c != NULL);
1.1  mrg   if (b < 0) return MP_RANGE;
1.1  mrg
1.1  mrg   DECLARE_TEMP(1);
1.1  mrg   REQUIRE(mp_int_copy(a, TEMP(0)));
1.1  mrg
1.1  mrg   (void)mp_int_set_value(c, 1);
1.1  mrg   unsigned int v = labs(b);
1.1  mrg   while (v != 0) {
1.1  mrg     if (v & 1) {
1.1  mrg       REQUIRE(mp_int_mul(c, TEMP(0), c));
1.1  mrg     }
1.1  mrg
1.1  mrg     v >>= 1;
1.1  mrg     if (v == 0) break;
1.1  mrg
1.1  mrg     REQUIRE(mp_int_sqr(TEMP(0), TEMP(0)));
1.1  mrg   }
1.1  mrg
1.1  mrg   CLEANUP_TEMP();
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_expt_value(mp_small a, mp_small b, mp_int c) {
1.1  mrg   assert(c != NULL);
1.1  mrg   if (b < 0) return MP_RANGE;
1.1  mrg
1.1  mrg   DECLARE_TEMP(1);
1.1  mrg   REQUIRE(mp_int_set_value(TEMP(0), a));
1.1  mrg
1.1  mrg   (void)mp_int_set_value(c, 1);
1.1  mrg   unsigned int v = labs(b);
1.1  mrg   while (v != 0) {
1.1  mrg     if (v & 1) {
1.1  mrg       REQUIRE(mp_int_mul(c, TEMP(0), c));
1.1  mrg     }
1.1  mrg
1.1  mrg     v >>= 1;
1.1  mrg     if (v == 0) break;
1.1  mrg
1.1  mrg     REQUIRE(mp_int_sqr(TEMP(0), TEMP(0)));
1.1  mrg   }
1.1  mrg
1.1  mrg   CLEANUP_TEMP();
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_expt_full(mp_int a, mp_int b, mp_int c) {
1.1  mrg   assert(a != NULL && b != NULL && c != NULL);
1.1  mrg   if (MP_SIGN(b) == MP_NEG) return MP_RANGE;
1.1  mrg
1.1  mrg   DECLARE_TEMP(1);
1.1  mrg   REQUIRE(mp_int_copy(a, TEMP(0)));
1.1  mrg
1.1  mrg   (void)mp_int_set_value(c, 1);
1.1  mrg   for (unsigned ix = 0; ix < MP_USED(b); ++ix) {
1.1  mrg     mp_digit d = b->digits[ix];
1.1  mrg
1.1  mrg     for (unsigned jx = 0; jx < MP_DIGIT_BIT; ++jx) {
1.1  mrg       if (d & 1) {
1.1  mrg         REQUIRE(mp_int_mul(c, TEMP(0), c));
1.1  mrg       }
1.1  mrg
1.1  mrg       d >>= 1;
1.1  mrg       if (d == 0 && ix + 1 == MP_USED(b)) break;
1.1  mrg       REQUIRE(mp_int_sqr(TEMP(0), TEMP(0)));
1.1  mrg     }
1.1  mrg   }
1.1  mrg
1.1  mrg   CLEANUP_TEMP();
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg int mp_int_compare(mp_int a, mp_int b) {
1.1  mrg   assert(a != NULL && b != NULL);
1.1  mrg
1.1  mrg   mp_sign sa = MP_SIGN(a);
1.1  mrg   if (sa == MP_SIGN(b)) {
1.1  mrg     int cmp = s_ucmp(a, b);
1.1  mrg
1.1  mrg     /* If they're both zero or positive, the normal comparison applies; if both
1.1  mrg        negative, the sense is reversed. */
1.1  mrg     if (sa == MP_ZPOS) {
1.1  mrg       return cmp;
1.1  mrg     } else {
1.1  mrg       return -cmp;
1.1  mrg     }
1.1  mrg   } else if (sa == MP_ZPOS) {
1.1  mrg     return 1;
1.1  mrg   } else {
1.1  mrg     return -1;
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg int mp_int_compare_unsigned(mp_int a, mp_int b) {
1.1  mrg   assert(a != NULL && b != NULL);
1.1  mrg
1.1  mrg   return s_ucmp(a, b);
1.1  mrg }
1.1  mrg
1.1  mrg int mp_int_compare_zero(mp_int z) {
1.1  mrg   assert(z != NULL);
1.1  mrg
1.1  mrg   if (MP_USED(z) == 1 && z->digits[0] == 0) {
1.1  mrg     return 0;
1.1  mrg   } else if (MP_SIGN(z) == MP_ZPOS) {
1.1  mrg     return 1;
1.1  mrg   } else {
1.1  mrg     return -1;
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg int mp_int_compare_value(mp_int z, mp_small value) {
1.1  mrg   assert(z != NULL);
1.1  mrg
1.1  mrg   mp_sign vsign = (value < 0) ? MP_NEG : MP_ZPOS;
1.1  mrg   if (vsign == MP_SIGN(z)) {
1.1  mrg     int cmp = s_vcmp(z, value);
1.1  mrg
1.1  mrg     return (vsign == MP_ZPOS) ? cmp : -cmp;
1.1  mrg   } else {
1.1  mrg     return (value < 0) ? 1 : -1;
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg int mp_int_compare_uvalue(mp_int z, mp_usmall uv) {
1.1  mrg   assert(z != NULL);
1.1  mrg
1.1  mrg   if (MP_SIGN(z) == MP_NEG) {
1.1  mrg     return -1;
1.1  mrg   } else {
1.1  mrg     return s_uvcmp(z, uv);
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_exptmod(mp_int a, mp_int b, mp_int m, mp_int c) {
1.1  mrg   assert(a != NULL && b != NULL && c != NULL && m != NULL);
1.1  mrg
1.1  mrg   /* Zero moduli and negative exponents are not considered. */
1.1  mrg   if (CMPZ(m) == 0) return MP_UNDEF;
1.1  mrg   if (CMPZ(b) < 0) return MP_RANGE;
1.1  mrg
1.1  mrg   mp_size um = MP_USED(m);
1.1  mrg   DECLARE_TEMP(3);
1.1  mrg   REQUIRE(GROW(TEMP(0), 2 * um));
1.1  mrg   REQUIRE(GROW(TEMP(1), 2 * um));
1.1  mrg
1.1  mrg   mp_int s;
1.1  mrg   if (c == b || c == m) {
1.1  mrg     REQUIRE(GROW(TEMP(2), 2 * um));
1.1  mrg     s = TEMP(2);
1.1  mrg   } else {
1.1  mrg     s = c;
1.1  mrg   }
1.1  mrg
1.1  mrg   REQUIRE(mp_int_mod(a, m, TEMP(0)));
1.1  mrg   REQUIRE(s_brmu(TEMP(1), m));
1.1  mrg   REQUIRE(s_embar(TEMP(0), b, m, TEMP(1), s));
1.1  mrg   REQUIRE(mp_int_copy(s, c));
1.1  mrg
1.1  mrg   CLEANUP_TEMP();
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_exptmod_evalue(mp_int a, mp_small value, mp_int m, mp_int c) {
1.1  mrg   mpz_t vtmp;
1.1  mrg   mp_digit vbuf[MP_VALUE_DIGITS(value)];
1.1  mrg
1.1  mrg   s_fake(&vtmp, value, vbuf);
1.1  mrg
1.1  mrg   return mp_int_exptmod(a, &vtmp, m, c);
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_exptmod_bvalue(mp_small value, mp_int b, mp_int m, mp_int c) {
1.1  mrg   mpz_t vtmp;
1.1  mrg   mp_digit vbuf[MP_VALUE_DIGITS(value)];
1.1  mrg
1.1  mrg   s_fake(&vtmp, value, vbuf);
1.1  mrg
1.1  mrg   return mp_int_exptmod(&vtmp, b, m, c);
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_exptmod_known(mp_int a, mp_int b, mp_int m, mp_int mu,
1.1  mrg                                mp_int c) {
1.1  mrg   assert(a && b && m && c);
1.1  mrg
1.1  mrg   /* Zero moduli and negative exponents are not considered. */
1.1  mrg   if (CMPZ(m) == 0) return MP_UNDEF;
1.1  mrg   if (CMPZ(b) < 0) return MP_RANGE;
1.1  mrg
1.1  mrg   DECLARE_TEMP(2);
1.1  mrg   mp_size um = MP_USED(m);
1.1  mrg   REQUIRE(GROW(TEMP(0), 2 * um));
1.1  mrg
1.1  mrg   mp_int s;
1.1  mrg   if (c == b || c == m) {
1.1  mrg     REQUIRE(GROW(TEMP(1), 2 * um));
1.1  mrg     s = TEMP(1);
1.1  mrg   } else {
1.1  mrg     s = c;
1.1  mrg   }
1.1  mrg
1.1  mrg   REQUIRE(mp_int_mod(a, m, TEMP(0)));
1.1  mrg   REQUIRE(s_embar(TEMP(0), b, m, mu, s));
1.1  mrg   REQUIRE(mp_int_copy(s, c));
1.1  mrg
1.1  mrg   CLEANUP_TEMP();
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_redux_const(mp_int m, mp_int c) {
1.1  mrg   assert(m != NULL && c != NULL && m != c);
1.1  mrg
1.1  mrg   return s_brmu(c, m);
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_invmod(mp_int a, mp_int m, mp_int c) {
1.1  mrg   assert(a != NULL && m != NULL && c != NULL);
1.1  mrg
1.1  mrg   if (CMPZ(a) == 0 || CMPZ(m) <= 0) return MP_RANGE;
1.1  mrg
1.1  mrg   DECLARE_TEMP(2);
1.1  mrg
1.1  mrg   REQUIRE(mp_int_egcd(a, m, TEMP(0), TEMP(1), NULL));
1.1  mrg
1.1  mrg   if (mp_int_compare_value(TEMP(0), 1) != 0) {
1.1  mrg     REQUIRE(MP_UNDEF);
1.1  mrg   }
1.1  mrg
1.1  mrg   /* It is first necessary to constrain the value to the proper range */
1.1  mrg   REQUIRE(mp_int_mod(TEMP(1), m, TEMP(1)));
1.1  mrg
1.1  mrg   /* Now, if 'a' was originally negative, the value we have is actually the
1.1  mrg      magnitude of the negative representative; to get the positive value we
1.1  mrg      have to subtract from the modulus.  Otherwise, the value is okay as it
1.1  mrg      stands.
1.1  mrg    */
1.1  mrg   if (MP_SIGN(a) == MP_NEG) {
1.1  mrg     REQUIRE(mp_int_sub(m, TEMP(1), c));
1.1  mrg   } else {
1.1  mrg     REQUIRE(mp_int_copy(TEMP(1), c));
1.1  mrg   }
1.1  mrg
1.1  mrg   CLEANUP_TEMP();
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg /* Binary GCD algorithm due to Josef Stein, 1961 */
1.1  mrg mp_result mp_int_gcd(mp_int a, mp_int b, mp_int c) {
1.1  mrg   assert(a != NULL && b != NULL && c != NULL);
1.1  mrg
1.1  mrg   int ca = CMPZ(a);
1.1  mrg   int cb = CMPZ(b);
1.1  mrg   if (ca == 0 && cb == 0) {
1.1  mrg     return MP_UNDEF;
1.1  mrg   } else if (ca == 0) {
1.1  mrg     return mp_int_abs(b, c);
1.1  mrg   } else if (cb == 0) {
1.1  mrg     return mp_int_abs(a, c);
1.1  mrg   }
1.1  mrg
1.1  mrg   DECLARE_TEMP(3);
1.1  mrg   REQUIRE(mp_int_copy(a, TEMP(0)));
1.1  mrg   REQUIRE(mp_int_copy(b, TEMP(1)));
1.1  mrg
1.1  mrg   TEMP(0)->sign = MP_ZPOS;
1.1  mrg   TEMP(1)->sign = MP_ZPOS;
1.1  mrg
1.1  mrg   int k = 0;
1.1  mrg   { /* Divide out common factors of 2 from u and v */
1.1  mrg     int div2_u = s_dp2k(TEMP(0));
1.1  mrg     int div2_v = s_dp2k(TEMP(1));
1.1  mrg
1.1  mrg     k = MIN(div2_u, div2_v);
1.1  mrg     s_qdiv(TEMP(0), (mp_size)k);
1.1  mrg     s_qdiv(TEMP(1), (mp_size)k);
1.1  mrg   }
1.1  mrg
1.1  mrg   if (mp_int_is_odd(TEMP(0))) {
1.1  mrg     REQUIRE(mp_int_neg(TEMP(1), TEMP(2)));
1.1  mrg   } else {
1.1  mrg     REQUIRE(mp_int_copy(TEMP(0), TEMP(2)));
1.1  mrg   }
1.1  mrg
1.1  mrg   for (;;) {
1.1  mrg     s_qdiv(TEMP(2), s_dp2k(TEMP(2)));
1.1  mrg
1.1  mrg     if (CMPZ(TEMP(2)) > 0) {
1.1  mrg       REQUIRE(mp_int_copy(TEMP(2), TEMP(0)));
1.1  mrg     } else {
1.1  mrg       REQUIRE(mp_int_neg(TEMP(2), TEMP(1)));
1.1  mrg     }
1.1  mrg
1.1  mrg     REQUIRE(mp_int_sub(TEMP(0), TEMP(1), TEMP(2)));
1.1  mrg
1.1  mrg     if (CMPZ(TEMP(2)) == 0) break;
1.1  mrg   }
1.1  mrg
1.1  mrg   REQUIRE(mp_int_abs(TEMP(0), c));
1.1  mrg   if (!s_qmul(c, (mp_size)k)) REQUIRE(MP_MEMORY);
1.1  mrg
1.1  mrg   CLEANUP_TEMP();
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg /* This is the binary GCD algorithm again, but this time we keep track of the
1.1  mrg    elementary matrix operations as we go, so we can get values x and y
1.1  mrg    satisfying c = ax + by.
1.1  mrg  */
1.1  mrg mp_result mp_int_egcd(mp_int a, mp_int b, mp_int c, mp_int x, mp_int y) {
1.1  mrg   assert(a != NULL && b != NULL && c != NULL && (x != NULL || y != NULL));
1.1  mrg
1.1  mrg   mp_result res = MP_OK;
1.1  mrg   int ca = CMPZ(a);
1.1  mrg   int cb = CMPZ(b);
1.1  mrg   if (ca == 0 && cb == 0) {
1.1  mrg     return MP_UNDEF;
1.1  mrg   } else if (ca == 0) {
1.1  mrg     if ((res = mp_int_abs(b, c)) != MP_OK) return res;
1.1  mrg     mp_int_zero(x);
1.1  mrg     (void)mp_int_set_value(y, 1);
1.1  mrg     return MP_OK;
1.1  mrg   } else if (cb == 0) {
1.1  mrg     if ((res = mp_int_abs(a, c)) != MP_OK) return res;
1.1  mrg     (void)mp_int_set_value(x, 1);
1.1  mrg     mp_int_zero(y);
1.1  mrg     return MP_OK;
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Initialize temporaries:
1.1  mrg      A:0, B:1, C:2, D:3, u:4, v:5, ou:6, ov:7 */
1.1  mrg   DECLARE_TEMP(8);
1.1  mrg   REQUIRE(mp_int_set_value(TEMP(0), 1));
1.1  mrg   REQUIRE(mp_int_set_value(TEMP(3), 1));
1.1  mrg   REQUIRE(mp_int_copy(a, TEMP(4)));
1.1  mrg   REQUIRE(mp_int_copy(b, TEMP(5)));
1.1  mrg
1.1  mrg   /* We will work with absolute values here */
1.1  mrg   TEMP(4)->sign = MP_ZPOS;
1.1  mrg   TEMP(5)->sign = MP_ZPOS;
1.1  mrg
1.1  mrg   int k = 0;
1.1  mrg   { /* Divide out common factors of 2 from u and v */
1.1  mrg     int div2_u = s_dp2k(TEMP(4)), div2_v = s_dp2k(TEMP(5));
1.1  mrg
1.1  mrg     k = MIN(div2_u, div2_v);
1.1  mrg     s_qdiv(TEMP(4), k);
1.1  mrg     s_qdiv(TEMP(5), k);
1.1  mrg   }
1.1  mrg
1.1  mrg   REQUIRE(mp_int_copy(TEMP(4), TEMP(6)));
1.1  mrg   REQUIRE(mp_int_copy(TEMP(5), TEMP(7)));
1.1  mrg
1.1  mrg   for (;;) {
1.1  mrg     while (mp_int_is_even(TEMP(4))) {
1.1  mrg       s_qdiv(TEMP(4), 1);
1.1  mrg
1.1  mrg       if (mp_int_is_odd(TEMP(0)) || mp_int_is_odd(TEMP(1))) {
1.1  mrg         REQUIRE(mp_int_add(TEMP(0), TEMP(7), TEMP(0)));
1.1  mrg         REQUIRE(mp_int_sub(TEMP(1), TEMP(6), TEMP(1)));
1.1  mrg       }
1.1  mrg
1.1  mrg       s_qdiv(TEMP(0), 1);
1.1  mrg       s_qdiv(TEMP(1), 1);
1.1  mrg     }
1.1  mrg
1.1  mrg     while (mp_int_is_even(TEMP(5))) {
1.1  mrg       s_qdiv(TEMP(5), 1);
1.1  mrg
1.1  mrg       if (mp_int_is_odd(TEMP(2)) || mp_int_is_odd(TEMP(3))) {
1.1  mrg         REQUIRE(mp_int_add(TEMP(2), TEMP(7), TEMP(2)));
1.1  mrg         REQUIRE(mp_int_sub(TEMP(3), TEMP(6), TEMP(3)));
1.1  mrg       }
1.1  mrg
1.1  mrg       s_qdiv(TEMP(2), 1);
1.1  mrg       s_qdiv(TEMP(3), 1);
1.1  mrg     }
1.1  mrg
1.1  mrg     if (mp_int_compare(TEMP(4), TEMP(5)) >= 0) {
1.1  mrg       REQUIRE(mp_int_sub(TEMP(4), TEMP(5), TEMP(4)));
1.1  mrg       REQUIRE(mp_int_sub(TEMP(0), TEMP(2), TEMP(0)));
1.1  mrg       REQUIRE(mp_int_sub(TEMP(1), TEMP(3), TEMP(1)));
1.1  mrg     } else {
1.1  mrg       REQUIRE(mp_int_sub(TEMP(5), TEMP(4), TEMP(5)));
1.1  mrg       REQUIRE(mp_int_sub(TEMP(2), TEMP(0), TEMP(2)));
1.1  mrg       REQUIRE(mp_int_sub(TEMP(3), TEMP(1), TEMP(3)));
1.1  mrg     }
1.1  mrg
1.1  mrg     if (CMPZ(TEMP(4)) == 0) {
1.1  mrg       if (x) REQUIRE(mp_int_copy(TEMP(2), x));
1.1  mrg       if (y) REQUIRE(mp_int_copy(TEMP(3), y));
1.1  mrg       if (c) {
1.1  mrg         if (!s_qmul(TEMP(5), k)) {
1.1  mrg           REQUIRE(MP_MEMORY);
1.1  mrg         }
1.1  mrg         REQUIRE(mp_int_copy(TEMP(5), c));
1.1  mrg       }
1.1  mrg
1.1  mrg       break;
1.1  mrg     }
1.1  mrg   }
1.1  mrg
1.1  mrg   CLEANUP_TEMP();
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_lcm(mp_int a, mp_int b, mp_int c) {
1.1  mrg   assert(a != NULL && b != NULL && c != NULL);
1.1  mrg
1.1  mrg   /* Since a * b = gcd(a, b) * lcm(a, b), we can compute
1.1  mrg      lcm(a, b) = (a / gcd(a, b)) * b.
1.1  mrg
1.1  mrg      This formulation insures everything works even if the input
1.1  mrg      variables share space.
1.1  mrg    */
1.1  mrg   DECLARE_TEMP(1);
1.1  mrg   REQUIRE(mp_int_gcd(a, b, TEMP(0)));
1.1  mrg   REQUIRE(mp_int_div(a, TEMP(0), TEMP(0), NULL));
1.1  mrg   REQUIRE(mp_int_mul(TEMP(0), b, TEMP(0)));
1.1  mrg   REQUIRE(mp_int_copy(TEMP(0), c));
1.1  mrg
1.1  mrg   CLEANUP_TEMP();
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg bool mp_int_divisible_value(mp_int a, mp_small v) {
1.1  mrg   mp_small rem = 0;
1.1  mrg
1.1  mrg   if (mp_int_div_value(a, v, NULL, &rem) != MP_OK) {
1.1  mrg     return false;
1.1  mrg   }
1.1  mrg   return rem == 0;
1.1  mrg }
1.1  mrg
1.1  mrg int mp_int_is_pow2(mp_int z) {
1.1  mrg   assert(z != NULL);
1.1  mrg
1.1  mrg   return s_isp2(z);
1.1  mrg }
1.1  mrg
1.1  mrg /* Implementation of Newton's root finding method, based loosely on a patch
1.1  mrg    contributed by Hal Finkel <half (at) halssoftware.com>
1.1  mrg    modified by M. J. Fromberger.
1.1  mrg  */
1.1  mrg mp_result mp_int_root(mp_int a, mp_small b, mp_int c) {
1.1  mrg   assert(a != NULL && c != NULL && b > 0);
1.1  mrg
1.1  mrg   if (b == 1) {
1.1  mrg     return mp_int_copy(a, c);
1.1  mrg   }
1.1  mrg   bool flips = false;
1.1  mrg   if (MP_SIGN(a) == MP_NEG) {
1.1  mrg     if (b % 2 == 0) {
1.1  mrg       return MP_UNDEF; /* root does not exist for negative a with even b */
1.1  mrg     } else {
1.1  mrg       flips = true;
1.1  mrg     }
1.1  mrg   }
1.1  mrg
1.1  mrg   DECLARE_TEMP(5);
1.1  mrg   REQUIRE(mp_int_copy(a, TEMP(0)));
1.1  mrg   REQUIRE(mp_int_copy(a, TEMP(1)));
1.1  mrg   TEMP(0)->sign = MP_ZPOS;
1.1  mrg   TEMP(1)->sign = MP_ZPOS;
1.1  mrg
1.1  mrg   for (;;) {
1.1  mrg     REQUIRE(mp_int_expt(TEMP(1), b, TEMP(2)));
1.1  mrg
1.1  mrg     if (mp_int_compare_unsigned(TEMP(2), TEMP(0)) <= 0) break;
1.1  mrg
1.1  mrg     REQUIRE(mp_int_sub(TEMP(2), TEMP(0), TEMP(2)));
1.1  mrg     REQUIRE(mp_int_expt(TEMP(1), b - 1, TEMP(3)));
1.1  mrg     REQUIRE(mp_int_mul_value(TEMP(3), b, TEMP(3)));
1.1  mrg     REQUIRE(mp_int_div(TEMP(2), TEMP(3), TEMP(4), NULL));
1.1  mrg     REQUIRE(mp_int_sub(TEMP(1), TEMP(4), TEMP(4)));
1.1  mrg
1.1  mrg     if (mp_int_compare_unsigned(TEMP(1), TEMP(4)) == 0) {
1.1  mrg       REQUIRE(mp_int_sub_value(TEMP(4), 1, TEMP(4)));
1.1  mrg     }
1.1  mrg     REQUIRE(mp_int_copy(TEMP(4), TEMP(1)));
1.1  mrg   }
1.1  mrg
1.1  mrg   REQUIRE(mp_int_copy(TEMP(1), c));
1.1  mrg
1.1  mrg   /* If the original value of a was negative, flip the output sign. */
1.1  mrg   if (flips) (void)mp_int_neg(c, c); /* cannot fail */
1.1  mrg
1.1  mrg   CLEANUP_TEMP();
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_to_int(mp_int z, mp_small *out) {
1.1  mrg   assert(z != NULL);
1.1  mrg
1.1  mrg   /* Make sure the value is representable as a small integer */
1.1  mrg   mp_sign sz = MP_SIGN(z);
1.1  mrg   if ((sz == MP_ZPOS && mp_int_compare_value(z, MP_SMALL_MAX) > 0) ||
1.1  mrg       mp_int_compare_value(z, MP_SMALL_MIN) < 0) {
1.1  mrg     return MP_RANGE;
1.1  mrg   }
1.1  mrg
1.1  mrg   mp_usmall uz = MP_USED(z);
1.1  mrg   mp_digit *dz = MP_DIGITS(z) + uz - 1;
1.1  mrg   mp_small uv = 0;
1.1  mrg   while (uz > 0) {
1.1  mrg     uv <<= MP_DIGIT_BIT / 2;
1.1  mrg     uv = (uv << (MP_DIGIT_BIT / 2)) | *dz--;
1.1  mrg     --uz;
1.1  mrg   }
1.1  mrg
1.1  mrg   if (out) *out = (mp_small)((sz == MP_NEG) ? -uv : uv);
1.1  mrg
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_to_uint(mp_int z, mp_usmall *out) {
1.1  mrg   assert(z != NULL);
1.1  mrg
1.1  mrg   /* Make sure the value is representable as an unsigned small integer */
1.1  mrg   mp_size sz = MP_SIGN(z);
1.1  mrg   if (sz == MP_NEG || mp_int_compare_uvalue(z, MP_USMALL_MAX) > 0) {
1.1  mrg     return MP_RANGE;
1.1  mrg   }
1.1  mrg
1.1  mrg   mp_size uz = MP_USED(z);
1.1  mrg   mp_digit *dz = MP_DIGITS(z) + uz - 1;
1.1  mrg   mp_usmall uv = 0;
1.1  mrg
1.1  mrg   while (uz > 0) {
1.1  mrg     uv <<= MP_DIGIT_BIT / 2;
1.1  mrg     uv = (uv << (MP_DIGIT_BIT / 2)) | *dz--;
1.1  mrg     --uz;
1.1  mrg   }
1.1  mrg
1.1  mrg   if (out) *out = uv;
1.1  mrg
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_to_string(mp_int z, mp_size radix, char *str, int limit) {
1.1  mrg   assert(z != NULL && str != NULL && limit >= 2);
1.1  mrg   assert(radix >= MP_MIN_RADIX && radix <= MP_MAX_RADIX);
1.1  mrg
1.1  mrg   int cmp = 0;
1.1  mrg   if (CMPZ(z) == 0) {
1.1  mrg     *str++ = s_val2ch(0, 1);
1.1  mrg   } else {
1.1  mrg     mp_result res;
1.1  mrg     mpz_t tmp;
1.1  mrg     char *h, *t;
1.1  mrg
1.1  mrg     if ((res = mp_int_init_copy(&tmp, z)) != MP_OK) return res;
1.1  mrg
1.1  mrg     if (MP_SIGN(z) == MP_NEG) {
1.1  mrg       *str++ = '-';
1.1  mrg       --limit;
1.1  mrg     }
1.1  mrg     h = str;
1.1  mrg
1.1  mrg     /* Generate digits in reverse order until finished or limit reached */
1.1  mrg     for (/* */; limit > 0; --limit) {
1.1  mrg       mp_digit d;
1.1  mrg
1.1  mrg       if ((cmp = CMPZ(&tmp)) == 0) break;
1.1  mrg
1.1  mrg       d = s_ddiv(&tmp, (mp_digit)radix);
1.1  mrg       *str++ = s_val2ch(d, 1);
1.1  mrg     }
1.1  mrg     t = str - 1;
1.1  mrg
1.1  mrg     /* Put digits back in correct output order */
1.1  mrg     while (h < t) {
1.1  mrg       char tc = *h;
1.1  mrg       *h++ = *t;
1.1  mrg       *t-- = tc;
1.1  mrg     }
1.1  mrg
1.1  mrg     mp_int_clear(&tmp);
1.1  mrg   }
1.1  mrg
1.1  mrg   *str = '\0';
1.1  mrg   if (cmp == 0) {
1.1  mrg     return MP_OK;
1.1  mrg   } else {
1.1  mrg     return MP_TRUNC;
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_string_len(mp_int z, mp_size radix) {
1.1  mrg   assert(z != NULL);
1.1  mrg   assert(radix >= MP_MIN_RADIX && radix <= MP_MAX_RADIX);
1.1  mrg
1.1  mrg   int len = s_outlen(z, radix) + 1; /* for terminator */
1.1  mrg
1.1  mrg   /* Allow for sign marker on negatives */
1.1  mrg   if (MP_SIGN(z) == MP_NEG) len += 1;
1.1  mrg
1.1  mrg   return len;
1.1  mrg }
1.1  mrg
1.1  mrg /* Read zero-terminated string into z */
1.1  mrg mp_result mp_int_read_string(mp_int z, mp_size radix, const char *str) {
1.1  mrg   return mp_int_read_cstring(z, radix, str, NULL);
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_read_cstring(mp_int z, mp_size radix, const char *str,
1.1  mrg                               char **end) {
1.1  mrg   assert(z != NULL && str != NULL);
1.1  mrg   assert(radix >= MP_MIN_RADIX && radix <= MP_MAX_RADIX);
1.1  mrg
1.1  mrg   /* Skip leading whitespace */
1.1  mrg   while (isspace((unsigned char)*str)) ++str;
1.1  mrg
1.1  mrg   /* Handle leading sign tag (+/-, positive default) */
1.1  mrg   switch (*str) {
1.1  mrg     case '-':
1.1  mrg       z->sign = MP_NEG;
1.1  mrg       ++str;
1.1  mrg       break;
1.1  mrg     case '+':
1.1  mrg       ++str; /* fallthrough */
1.1  mrg     default:
1.1  mrg       z->sign = MP_ZPOS;
1.1  mrg       break;
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Skip leading zeroes */
1.1  mrg   int ch;
1.1  mrg   while ((ch = s_ch2val(*str, radix)) == 0) ++str;
1.1  mrg
1.1  mrg   /* Make sure there is enough space for the value */
1.1  mrg   if (!s_pad(z, s_inlen(strlen(str), radix))) return MP_MEMORY;
1.1  mrg
1.1  mrg   z->used = 1;
1.1  mrg   z->digits[0] = 0;
1.1  mrg
1.1  mrg   while (*str != '\0' && ((ch = s_ch2val(*str, radix)) >= 0)) {
1.1  mrg     s_dmul(z, (mp_digit)radix);
1.1  mrg     s_dadd(z, (mp_digit)ch);
1.1  mrg     ++str;
1.1  mrg   }
1.1  mrg
1.1  mrg   CLAMP(z);
1.1  mrg
1.1  mrg   /* Override sign for zero, even if negative specified. */
1.1  mrg   if (CMPZ(z) == 0) z->sign = MP_ZPOS;
1.1  mrg
1.1  mrg   if (end != NULL) *end = (char *)str;
1.1  mrg
1.1  mrg   /* Return a truncation error if the string has unprocessed characters
1.1  mrg      remaining, so the caller can tell if the whole string was done */
1.1  mrg   if (*str != '\0') {
1.1  mrg     return MP_TRUNC;
1.1  mrg   } else {
1.1  mrg     return MP_OK;
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_count_bits(mp_int z) {
1.1  mrg   assert(z != NULL);
1.1  mrg
1.1  mrg   mp_size uz = MP_USED(z);
1.1  mrg   if (uz == 1 && z->digits[0] == 0) return 1;
1.1  mrg
1.1  mrg   --uz;
1.1  mrg   mp_size nbits = uz * MP_DIGIT_BIT;
1.1  mrg   mp_digit d = z->digits[uz];
1.1  mrg
1.1  mrg   while (d != 0) {
1.1  mrg     d >>= 1;
1.1  mrg     ++nbits;
1.1  mrg   }
1.1  mrg
1.1  mrg   return nbits;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_to_binary(mp_int z, unsigned char *buf, int limit) {
1.1  mrg   static const int PAD_FOR_2C = 1;
1.1  mrg
1.1  mrg   assert(z != NULL && buf != NULL);
1.1  mrg
1.1  mrg   int limpos = limit;
1.1  mrg   mp_result res = s_tobin(z, buf, &limpos, PAD_FOR_2C);
1.1  mrg
1.1  mrg   if (MP_SIGN(z) == MP_NEG) s_2comp(buf, limpos);
1.1  mrg
1.1  mrg   return res;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_read_binary(mp_int z, unsigned char *buf, int len) {
1.1  mrg   assert(z != NULL && buf != NULL && len > 0);
1.1  mrg
1.1  mrg   /* Figure out how many digits are needed to represent this value */
1.1  mrg   mp_size need = ((len * CHAR_BIT) + (MP_DIGIT_BIT - 1)) / MP_DIGIT_BIT;
1.1  mrg   if (!s_pad(z, need)) return MP_MEMORY;
1.1  mrg
1.1  mrg   mp_int_zero(z);
1.1  mrg
1.1  mrg   /* If the high-order bit is set, take the 2's complement before reading the
1.1  mrg      value (it will be restored afterward) */
1.1  mrg   if (buf[0] >> (CHAR_BIT - 1)) {
1.1  mrg     z->sign = MP_NEG;
1.1  mrg     s_2comp(buf, len);
1.1  mrg   }
1.1  mrg
1.1  mrg   mp_digit *dz = MP_DIGITS(z);
1.1  mrg   unsigned char *tmp = buf;
1.1  mrg   for (int i = len; i > 0; --i, ++tmp) {
1.1  mrg     s_qmul(z, (mp_size)CHAR_BIT);
1.1  mrg     *dz |= *tmp;
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Restore 2's complement if we took it before */
1.1  mrg   if (MP_SIGN(z) == MP_NEG) s_2comp(buf, len);
1.1  mrg
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_binary_len(mp_int z) {
1.1  mrg   mp_result res = mp_int_count_bits(z);
1.1  mrg   if (res <= 0) return res;
1.1  mrg
1.1  mrg   int bytes = mp_int_unsigned_len(z);
1.1  mrg
1.1  mrg   /* If the highest-order bit falls exactly on a byte boundary, we need to pad
1.1  mrg      with an extra byte so that the sign will be read correctly when reading it
1.1  mrg      back in. */
1.1  mrg   if (bytes * CHAR_BIT == res) ++bytes;
1.1  mrg
1.1  mrg   return bytes;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_to_unsigned(mp_int z, unsigned char *buf, int limit) {
1.1  mrg   static const int NO_PADDING = 0;
1.1  mrg
1.1  mrg   assert(z != NULL && buf != NULL);
1.1  mrg
1.1  mrg   return s_tobin(z, buf, &limit, NO_PADDING);
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_read_unsigned(mp_int z, unsigned char *buf, int len) {
1.1  mrg   assert(z != NULL && buf != NULL && len > 0);
1.1  mrg
1.1  mrg   /* Figure out how many digits are needed to represent this value */
1.1  mrg   mp_size need = ((len * CHAR_BIT) + (MP_DIGIT_BIT - 1)) / MP_DIGIT_BIT;
1.1  mrg   if (!s_pad(z, need)) return MP_MEMORY;
1.1  mrg
1.1  mrg   mp_int_zero(z);
1.1  mrg
1.1  mrg   unsigned char *tmp = buf;
1.1  mrg   for (int i = len; i > 0; --i, ++tmp) {
1.1  mrg     (void)s_qmul(z, CHAR_BIT);
1.1  mrg     *MP_DIGITS(z) |= *tmp;
1.1  mrg   }
1.1  mrg
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg mp_result mp_int_unsigned_len(mp_int z) {
1.1  mrg   mp_result res = mp_int_count_bits(z);
1.1  mrg   if (res <= 0) return res;
1.1  mrg
1.1  mrg   int bytes = (res + (CHAR_BIT - 1)) / CHAR_BIT;
1.1  mrg   return bytes;
1.1  mrg }
1.1  mrg
1.1  mrg const char *mp_error_string(mp_result res) {
1.1  mrg   if (res > 0) return s_unknown_err;
1.1  mrg
1.1  mrg   res = -res;
1.1  mrg   int ix;
1.1  mrg   for (ix = 0; ix < res && s_error_msg[ix] != NULL; ++ix)
1.1  mrg     ;
1.1  mrg
1.1  mrg   if (s_error_msg[ix] != NULL) {
1.1  mrg     return s_error_msg[ix];
1.1  mrg   } else {
1.1  mrg     return s_unknown_err;
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg /*------------------------------------------------------------------------*/
1.1  mrg /* Private functions for internal use.  These make assumptions.           */
1.1  mrg
1.1  mrg #if DEBUG
1.1  mrg static const mp_digit fill = (mp_digit)0xdeadbeefabad1dea;
1.1  mrg #endif
1.1  mrg
1.1  mrg static mp_digit *s_alloc(mp_size num) {
1.1  mrg   mp_digit *out = malloc(num * sizeof(mp_digit));
1.1  mrg   assert(out != NULL);
1.1  mrg
1.1  mrg #if DEBUG
1.1  mrg   for (mp_size ix = 0; ix < num; ++ix) out[ix] = fill;
1.1  mrg #endif
1.1  mrg   return out;
1.1  mrg }
1.1  mrg
1.1  mrg static mp_digit *s_realloc(mp_digit *old, mp_size osize, mp_size nsize) {
1.1  mrg #if DEBUG
1.1  mrg   mp_digit *new = s_alloc(nsize);
1.1  mrg   assert(new != NULL);
1.1  mrg
1.1  mrg   for (mp_size ix = 0; ix < nsize; ++ix) new[ix] = fill;
1.1  mrg   memcpy(new, old, osize * sizeof(mp_digit));
1.1  mrg #else
1.1  mrg   mp_digit *new = realloc(old, nsize * sizeof(mp_digit));
1.1  mrg   assert(new != NULL);
1.1  mrg #endif
1.1  mrg
1.1  mrg   return new;
1.1  mrg }
1.1  mrg
1.1  mrg static void s_free(void *ptr) { free(ptr); }
1.1  mrg
1.1  mrg static bool s_pad(mp_int z, mp_size min) {
1.1  mrg   if (MP_ALLOC(z) < min) {
1.1  mrg     mp_size nsize = s_round_prec(min);
1.1  mrg     mp_digit *tmp;
1.1  mrg
1.1  mrg     if (z->digits == &(z->single)) {
1.1  mrg       if ((tmp = s_alloc(nsize)) == NULL) return false;
1.1  mrg       tmp[0] = z->single;
1.1  mrg     } else if ((tmp = s_realloc(MP_DIGITS(z), MP_ALLOC(z), nsize)) == NULL) {
1.1  mrg       return false;
1.1  mrg     }
1.1  mrg
1.1  mrg     z->digits = tmp;
1.1  mrg     z->alloc = nsize;
1.1  mrg   }
1.1  mrg
1.1  mrg   return true;
1.1  mrg }
1.1  mrg
1.1  mrg /* Note: This will not work correctly when value == MP_SMALL_MIN */
1.1  mrg static void s_fake(mp_int z, mp_small value, mp_digit vbuf[]) {
1.1  mrg   mp_usmall uv = (mp_usmall)(value < 0) ? -value : value;
1.1  mrg   s_ufake(z, uv, vbuf);
1.1  mrg   if (value < 0) z->sign = MP_NEG;
1.1  mrg }
1.1  mrg
1.1  mrg static void s_ufake(mp_int z, mp_usmall value, mp_digit vbuf[]) {
1.1  mrg   mp_size ndig = (mp_size)s_uvpack(value, vbuf);
1.1  mrg
1.1  mrg   z->used = ndig;
1.1  mrg   z->alloc = MP_VALUE_DIGITS(value);
1.1  mrg   z->sign = MP_ZPOS;
1.1  mrg   z->digits = vbuf;
1.1  mrg }
1.1  mrg
1.1  mrg static int s_cdig(mp_digit *da, mp_digit *db, mp_size len) {
1.1  mrg   mp_digit *dat = da + len - 1, *dbt = db + len - 1;
1.1  mrg
1.1  mrg   for (/* */; len != 0; --len, --dat, --dbt) {
1.1  mrg     if (*dat > *dbt) {
1.1  mrg       return 1;
1.1  mrg     } else if (*dat < *dbt) {
1.1  mrg       return -1;
1.1  mrg     }
1.1  mrg   }
1.1  mrg
1.1  mrg   return 0;
1.1  mrg }
1.1  mrg
1.1  mrg static int s_uvpack(mp_usmall uv, mp_digit t[]) {
1.1  mrg   int ndig = 0;
1.1  mrg
1.1  mrg   if (uv == 0)
1.1  mrg     t[ndig++] = 0;
1.1  mrg   else {
1.1  mrg     while (uv != 0) {
1.1  mrg       t[ndig++] = (mp_digit)uv;
1.1  mrg       uv >>= MP_DIGIT_BIT / 2;
1.1  mrg       uv >>= MP_DIGIT_BIT / 2;
1.1  mrg     }
1.1  mrg   }
1.1  mrg
1.1  mrg   return ndig;
1.1  mrg }
1.1  mrg
1.1  mrg static int s_ucmp(mp_int a, mp_int b) {
1.1  mrg   mp_size ua = MP_USED(a), ub = MP_USED(b);
1.1  mrg
1.1  mrg   if (ua > ub) {
1.1  mrg     return 1;
1.1  mrg   } else if (ub > ua) {
1.1  mrg     return -1;
1.1  mrg   } else {
1.1  mrg     return s_cdig(MP_DIGITS(a), MP_DIGITS(b), ua);
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg static int s_vcmp(mp_int a, mp_small v) {
1.1  mrg   mp_usmall uv = (v < 0) ? -(mp_usmall)v : (mp_usmall)v;
1.1  mrg   return s_uvcmp(a, uv);
1.1  mrg }
1.1  mrg
1.1  mrg static int s_uvcmp(mp_int a, mp_usmall uv) {
1.1  mrg   mpz_t vtmp;
1.1  mrg   mp_digit vdig[MP_VALUE_DIGITS(uv)];
1.1  mrg
1.1  mrg   s_ufake(&vtmp, uv, vdig);
1.1  mrg   return s_ucmp(a, &vtmp);
1.1  mrg }
1.1  mrg
1.1  mrg static mp_digit s_uadd(mp_digit *da, mp_digit *db, mp_digit *dc, mp_size size_a,
1.1  mrg                        mp_size size_b) {
1.1  mrg   mp_size pos;
1.1  mrg   mp_word w = 0;
1.1  mrg
1.1  mrg   /* Insure that da is the longer of the two to simplify later code */
1.1  mrg   if (size_b > size_a) {
1.1  mrg     SWAP(mp_digit *, da, db);
1.1  mrg     SWAP(mp_size, size_a, size_b);
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Add corresponding digits until the shorter number runs out */
1.1  mrg   for (pos = 0; pos < size_b; ++pos, ++da, ++db, ++dc) {
1.1  mrg     w = w + (mp_word)*da + (mp_word)*db;
1.1  mrg     *dc = LOWER_HALF(w);
1.1  mrg     w = UPPER_HALF(w);
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Propagate carries as far as necessary */
1.1  mrg   for (/* */; pos < size_a; ++pos, ++da, ++dc) {
1.1  mrg     w = w + *da;
1.1  mrg
1.1  mrg     *dc = LOWER_HALF(w);
1.1  mrg     w = UPPER_HALF(w);
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Return carry out */
1.1  mrg   return (mp_digit)w;
1.1  mrg }
1.1  mrg
1.1  mrg static void s_usub(mp_digit *da, mp_digit *db, mp_digit *dc, mp_size size_a,
1.1  mrg                    mp_size size_b) {
1.1  mrg   mp_size pos;
1.1  mrg   mp_word w = 0;
1.1  mrg
1.1  mrg   /* We assume that |a| >= |b| so this should definitely hold */
1.1  mrg   assert(size_a >= size_b);
1.1  mrg
1.1  mrg   /* Subtract corresponding digits and propagate borrow */
1.1  mrg   for (pos = 0; pos < size_b; ++pos, ++da, ++db, ++dc) {
1.1  mrg     w = ((mp_word)MP_DIGIT_MAX + 1 + /* MP_RADIX */
1.1  mrg          (mp_word)*da) -
1.1  mrg         w - (mp_word)*db;
1.1  mrg
1.1  mrg     *dc = LOWER_HALF(w);
1.1  mrg     w = (UPPER_HALF(w) == 0);
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Finish the subtraction for remaining upper digits of da */
1.1  mrg   for (/* */; pos < size_a; ++pos, ++da, ++dc) {
1.1  mrg     w = ((mp_word)MP_DIGIT_MAX + 1 + /* MP_RADIX */
1.1  mrg          (mp_word)*da) -
1.1  mrg         w;
1.1  mrg
1.1  mrg     *dc = LOWER_HALF(w);
1.1  mrg     w = (UPPER_HALF(w) == 0);
1.1  mrg   }
1.1  mrg
1.1  mrg   /* If there is a borrow out at the end, it violates the precondition */
1.1  mrg   assert(w == 0);
1.1  mrg }
1.1  mrg
1.1  mrg static int s_kmul(mp_digit *da, mp_digit *db, mp_digit *dc, mp_size size_a,
1.1  mrg                   mp_size size_b) {
1.1  mrg   mp_size bot_size;
1.1  mrg
1.1  mrg   /* Make sure b is the smaller of the two input values */
1.1  mrg   if (size_b > size_a) {
1.1  mrg     SWAP(mp_digit *, da, db);
1.1  mrg     SWAP(mp_size, size_a, size_b);
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Insure that the bottom is the larger half in an odd-length split; the code
1.1  mrg      below relies on this being true.
1.1  mrg    */
1.1  mrg   bot_size = (size_a + 1) / 2;
1.1  mrg
1.1  mrg   /* If the values are big enough to bother with recursion, use the Karatsuba
1.1  mrg      algorithm to compute the product; otherwise use the normal multiplication
1.1  mrg      algorithm
1.1  mrg    */
1.1  mrg   if (multiply_threshold && size_a >= multiply_threshold && size_b > bot_size) {
1.1  mrg     mp_digit *t1, *t2, *t3, carry;
1.1  mrg
1.1  mrg     mp_digit *a_top = da + bot_size;
1.1  mrg     mp_digit *b_top = db + bot_size;
1.1  mrg
1.1  mrg     mp_size at_size = size_a - bot_size;
1.1  mrg     mp_size bt_size = size_b - bot_size;
1.1  mrg     mp_size buf_size = 2 * bot_size;
1.1  mrg
1.1  mrg     /* Do a single allocation for all three temporary buffers needed; each
1.1  mrg        buffer must be big enough to hold the product of two bottom halves, and
1.1  mrg        one buffer needs space for the completed product; twice the space is
1.1  mrg        plenty.
1.1  mrg      */
1.1  mrg     if ((t1 = s_alloc(4 * buf_size)) == NULL) return 0;
1.1  mrg     t2 = t1 + buf_size;
1.1  mrg     t3 = t2 + buf_size;
1.1  mrg     ZERO(t1, 4 * buf_size);
1.1  mrg
1.1  mrg     /* t1 and t2 are initially used as temporaries to compute the inner product
1.1  mrg        (a1 + a0)(b1 + b0) = a1b1 + a1b0 + a0b1 + a0b0
1.1  mrg      */
1.1  mrg     carry = s_uadd(da, a_top, t1, bot_size, at_size); /* t1 = a1 + a0 */
1.1  mrg     t1[bot_size] = carry;
1.1  mrg
1.1  mrg     carry = s_uadd(db, b_top, t2, bot_size, bt_size); /* t2 = b1 + b0 */
1.1  mrg     t2[bot_size] = carry;
1.1  mrg
1.1  mrg     (void)s_kmul(t1, t2, t3, bot_size + 1, bot_size + 1); /* t3 = t1 * t2 */
1.1  mrg
1.1  mrg     /* Now we'll get t1 = a0b0 and t2 = a1b1, and subtract them out so that
1.1  mrg        we're left with only the pieces we want:  t3 = a1b0 + a0b1
1.1  mrg      */
1.1  mrg     ZERO(t1, buf_size);
1.1  mrg     ZERO(t2, buf_size);
1.1  mrg     (void)s_kmul(da, db, t1, bot_size, bot_size);     /* t1 = a0 * b0 */
1.1  mrg     (void)s_kmul(a_top, b_top, t2, at_size, bt_size); /* t2 = a1 * b1 */
1.1  mrg
1.1  mrg     /* Subtract out t1 and t2 to get the inner product */
1.1  mrg     s_usub(t3, t1, t3, buf_size + 2, buf_size);
1.1  mrg     s_usub(t3, t2, t3, buf_size + 2, buf_size);
1.1  mrg
1.1  mrg     /* Assemble the output value */
1.1  mrg     COPY(t1, dc, buf_size);
1.1  mrg     carry = s_uadd(t3, dc + bot_size, dc + bot_size, buf_size + 1, buf_size);
1.1  mrg     assert(carry == 0);
1.1  mrg
1.1  mrg     carry =
1.1  mrg         s_uadd(t2, dc + 2 * bot_size, dc + 2 * bot_size, buf_size, buf_size);
1.1  mrg     assert(carry == 0);
1.1  mrg
1.1  mrg     s_free(t1); /* note t2 and t3 are just internal pointers to t1 */
1.1  mrg   } else {
1.1  mrg     s_umul(da, db, dc, size_a, size_b);
1.1  mrg   }
1.1  mrg
1.1  mrg   return 1;
1.1  mrg }
1.1  mrg
1.1  mrg static void s_umul(mp_digit *da, mp_digit *db, mp_digit *dc, mp_size size_a,
1.1  mrg                    mp_size size_b) {
1.1  mrg   mp_size a, b;
1.1  mrg   mp_word w;
1.1  mrg
1.1  mrg   for (a = 0; a < size_a; ++a, ++dc, ++da) {
1.1  mrg     mp_digit *dct = dc;
1.1  mrg     mp_digit *dbt = db;
1.1  mrg
1.1  mrg     if (*da == 0) continue;
1.1  mrg
1.1  mrg     w = 0;
1.1  mrg     for (b = 0; b < size_b; ++b, ++dbt, ++dct) {
1.1  mrg       w = (mp_word)*da * (mp_word)*dbt + w + (mp_word)*dct;
1.1  mrg
1.1  mrg       *dct = LOWER_HALF(w);
1.1  mrg       w = UPPER_HALF(w);
1.1  mrg     }
1.1  mrg
1.1  mrg     *dct = (mp_digit)w;
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg static int s_ksqr(mp_digit *da, mp_digit *dc, mp_size size_a) {
1.1  mrg   if (multiply_threshold && size_a > multiply_threshold) {
1.1  mrg     mp_size bot_size = (size_a + 1) / 2;
1.1  mrg     mp_digit *a_top = da + bot_size;
1.1  mrg     mp_digit *t1, *t2, *t3, carry;
1.1  mrg     mp_size at_size = size_a - bot_size;
1.1  mrg     mp_size buf_size = 2 * bot_size;
1.1  mrg
1.1  mrg     if ((t1 = s_alloc(4 * buf_size)) == NULL) return 0;
1.1  mrg     t2 = t1 + buf_size;
1.1  mrg     t3 = t2 + buf_size;
1.1  mrg     ZERO(t1, 4 * buf_size);
1.1  mrg
1.1  mrg     (void)s_ksqr(da, t1, bot_size);   /* t1 = a0 ^ 2 */
1.1  mrg     (void)s_ksqr(a_top, t2, at_size); /* t2 = a1 ^ 2 */
1.1  mrg
1.1  mrg     (void)s_kmul(da, a_top, t3, bot_size, at_size); /* t3 = a0 * a1 */
1.1  mrg
1.1  mrg     /* Quick multiply t3 by 2, shifting left (can't overflow) */
1.1  mrg     {
1.1  mrg       int i, top = bot_size + at_size;
1.1  mrg       mp_word w, save = 0;
1.1  mrg
1.1  mrg       for (i = 0; i < top; ++i) {
1.1  mrg         w = t3[i];
1.1  mrg         w = (w << 1) | save;
1.1  mrg         t3[i] = LOWER_HALF(w);
1.1  mrg         save = UPPER_HALF(w);
1.1  mrg       }
1.1  mrg       t3[i] = LOWER_HALF(save);
1.1  mrg     }
1.1  mrg
1.1  mrg     /* Assemble the output value */
1.1  mrg     COPY(t1, dc, 2 * bot_size);
1.1  mrg     carry = s_uadd(t3, dc + bot_size, dc + bot_size, buf_size + 1, buf_size);
1.1  mrg     assert(carry == 0);
1.1  mrg
1.1  mrg     carry =
1.1  mrg         s_uadd(t2, dc + 2 * bot_size, dc + 2 * bot_size, buf_size, buf_size);
1.1  mrg     assert(carry == 0);
1.1  mrg
1.1  mrg     s_free(t1); /* note that t2 and t2 are internal pointers only */
1.1  mrg
1.1  mrg   } else {
1.1  mrg     s_usqr(da, dc, size_a);
1.1  mrg   }
1.1  mrg
1.1  mrg   return 1;
1.1  mrg }
1.1  mrg
1.1  mrg static void s_usqr(mp_digit *da, mp_digit *dc, mp_size size_a) {
1.1  mrg   mp_size i, j;
1.1  mrg   mp_word w;
1.1  mrg
1.1  mrg   for (i = 0; i < size_a; ++i, dc += 2, ++da) {
1.1  mrg     mp_digit *dct = dc, *dat = da;
1.1  mrg
1.1  mrg     if (*da == 0) continue;
1.1  mrg
1.1  mrg     /* Take care of the first digit, no rollover */
1.1  mrg     w = (mp_word)*dat * (mp_word)*dat + (mp_word)*dct;
1.1  mrg     *dct = LOWER_HALF(w);
1.1  mrg     w = UPPER_HALF(w);
1.1  mrg     ++dat;
1.1  mrg     ++dct;
1.1  mrg
1.1  mrg     for (j = i + 1; j < size_a; ++j, ++dat, ++dct) {
1.1  mrg       mp_word t = (mp_word)*da * (mp_word)*dat;
1.1  mrg       mp_word u = w + (mp_word)*dct, ov = 0;
1.1  mrg
1.1  mrg       /* Check if doubling t will overflow a word */
1.1  mrg       if (HIGH_BIT_SET(t)) ov = 1;
1.1  mrg
1.1  mrg       w = t + t;
1.1  mrg
1.1  mrg       /* Check if adding u to w will overflow a word */
1.1  mrg       if (ADD_WILL_OVERFLOW(w, u)) ov = 1;
1.1  mrg
1.1  mrg       w += u;
1.1  mrg
1.1  mrg       *dct = LOWER_HALF(w);
1.1  mrg       w = UPPER_HALF(w);
1.1  mrg       if (ov) {
1.1  mrg         w += MP_DIGIT_MAX; /* MP_RADIX */
1.1  mrg         ++w;
1.1  mrg       }
1.1  mrg     }
1.1  mrg
1.1  mrg     w = w + *dct;
1.1  mrg     *dct = (mp_digit)w;
1.1  mrg     while ((w = UPPER_HALF(w)) != 0) {
1.1  mrg       ++dct;
1.1  mrg       w = w + *dct;
1.1  mrg       *dct = LOWER_HALF(w);
1.1  mrg     }
1.1  mrg
1.1  mrg     assert(w == 0);
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg static void s_dadd(mp_int a, mp_digit b) {
1.1  mrg   mp_word w = 0;
1.1  mrg   mp_digit *da = MP_DIGITS(a);
1.1  mrg   mp_size ua = MP_USED(a);
1.1  mrg
1.1  mrg   w = (mp_word)*da + b;
1.1  mrg   *da++ = LOWER_HALF(w);
1.1  mrg   w = UPPER_HALF(w);
1.1  mrg
1.1  mrg   for (ua -= 1; ua > 0; --ua, ++da) {
1.1  mrg     w = (mp_word)*da + w;
1.1  mrg
1.1  mrg     *da = LOWER_HALF(w);
1.1  mrg     w = UPPER_HALF(w);
1.1  mrg   }
1.1  mrg
1.1  mrg   if (w) {
1.1  mrg     *da = (mp_digit)w;
1.1  mrg     a->used += 1;
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg static void s_dmul(mp_int a, mp_digit b) {
1.1  mrg   mp_word w = 0;
1.1  mrg   mp_digit *da = MP_DIGITS(a);
1.1  mrg   mp_size ua = MP_USED(a);
1.1  mrg
1.1  mrg   while (ua > 0) {
1.1  mrg     w = (mp_word)*da * b + w;
1.1  mrg     *da++ = LOWER_HALF(w);
1.1  mrg     w = UPPER_HALF(w);
1.1  mrg     --ua;
1.1  mrg   }
1.1  mrg
1.1  mrg   if (w) {
1.1  mrg     *da = (mp_digit)w;
1.1  mrg     a->used += 1;
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg static void s_dbmul(mp_digit *da, mp_digit b, mp_digit *dc, mp_size size_a) {
1.1  mrg   mp_word w = 0;
1.1  mrg
1.1  mrg   while (size_a > 0) {
1.1  mrg     w = (mp_word)*da++ * (mp_word)b + w;
1.1  mrg
1.1  mrg     *dc++ = LOWER_HALF(w);
1.1  mrg     w = UPPER_HALF(w);
1.1  mrg     --size_a;
1.1  mrg   }
1.1  mrg
1.1  mrg   if (w) *dc = LOWER_HALF(w);
1.1  mrg }
1.1  mrg
1.1  mrg static mp_digit s_ddiv(mp_int a, mp_digit b) {
1.1  mrg   mp_word w = 0, qdigit;
1.1  mrg   mp_size ua = MP_USED(a);
1.1  mrg   mp_digit *da = MP_DIGITS(a) + ua - 1;
1.1  mrg
1.1  mrg   for (/* */; ua > 0; --ua, --da) {
1.1  mrg     w = (w << MP_DIGIT_BIT) | *da;
1.1  mrg
1.1  mrg     if (w >= b) {
1.1  mrg       qdigit = w / b;
1.1  mrg       w = w % b;
1.1  mrg     } else {
1.1  mrg       qdigit = 0;
1.1  mrg     }
1.1  mrg
1.1  mrg     *da = (mp_digit)qdigit;
1.1  mrg   }
1.1  mrg
1.1  mrg   CLAMP(a);
1.1  mrg   return (mp_digit)w;
1.1  mrg }
1.1  mrg
1.1  mrg static void s_qdiv(mp_int z, mp_size p2) {
1.1  mrg   mp_size ndig = p2 / MP_DIGIT_BIT, nbits = p2 % MP_DIGIT_BIT;
1.1  mrg   mp_size uz = MP_USED(z);
1.1  mrg
1.1  mrg   if (ndig) {
1.1  mrg     mp_size mark;
1.1  mrg     mp_digit *to, *from;
1.1  mrg
1.1  mrg     if (ndig >= uz) {
1.1  mrg       mp_int_zero(z);
1.1  mrg       return;
1.1  mrg     }
1.1  mrg
1.1  mrg     to = MP_DIGITS(z);
1.1  mrg     from = to + ndig;
1.1  mrg
1.1  mrg     for (mark = ndig; mark < uz; ++mark) {
1.1  mrg       *to++ = *from++;
1.1  mrg     }
1.1  mrg
1.1  mrg     z->used = uz - ndig;
1.1  mrg   }
1.1  mrg
1.1  mrg   if (nbits) {
1.1  mrg     mp_digit d = 0, *dz, save;
1.1  mrg     mp_size up = MP_DIGIT_BIT - nbits;
1.1  mrg
1.1  mrg     uz = MP_USED(z);
1.1  mrg     dz = MP_DIGITS(z) + uz - 1;
1.1  mrg
1.1  mrg     for (/* */; uz > 0; --uz, --dz) {
1.1  mrg       save = *dz;
1.1  mrg
1.1  mrg       *dz = (*dz >> nbits) | (d << up);
1.1  mrg       d = save;
1.1  mrg     }
1.1  mrg
1.1  mrg     CLAMP(z);
1.1  mrg   }
1.1  mrg
1.1  mrg   if (MP_USED(z) == 1 && z->digits[0] == 0) z->sign = MP_ZPOS;
1.1  mrg }
1.1  mrg
1.1  mrg static void s_qmod(mp_int z, mp_size p2) {
1.1  mrg   mp_size start = p2 / MP_DIGIT_BIT + 1, rest = p2 % MP_DIGIT_BIT;
1.1  mrg   mp_size uz = MP_USED(z);
1.1  mrg   mp_digit mask = (1u << rest) - 1;
1.1  mrg
1.1  mrg   if (start <= uz) {
1.1  mrg     z->used = start;
1.1  mrg     z->digits[start - 1] &= mask;
1.1  mrg     CLAMP(z);
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg static int s_qmul(mp_int z, mp_size p2) {
1.1  mrg   mp_size uz, need, rest, extra, i;
1.1  mrg   mp_digit *from, *to, d;
1.1  mrg
1.1  mrg   if (p2 == 0) return 1;
1.1  mrg
1.1  mrg   uz = MP_USED(z);
1.1  mrg   need = p2 / MP_DIGIT_BIT;
1.1  mrg   rest = p2 % MP_DIGIT_BIT;
1.1  mrg
1.1  mrg   /* Figure out if we need an extra digit at the top end; this occurs if the
1.1  mrg      topmost `rest' bits of the high-order digit of z are not zero, meaning
1.1  mrg      they will be shifted off the end if not preserved */
1.1  mrg   extra = 0;
1.1  mrg   if (rest != 0) {
1.1  mrg     mp_digit *dz = MP_DIGITS(z) + uz - 1;
1.1  mrg
1.1  mrg     if ((*dz >> (MP_DIGIT_BIT - rest)) != 0) extra = 1;
1.1  mrg   }
1.1  mrg
1.1  mrg   if (!s_pad(z, uz + need + extra)) return 0;
1.1  mrg
1.1  mrg   /* If we need to shift by whole digits, do that in one pass, then
1.1  mrg      to back and shift by partial digits.
1.1  mrg    */
1.1  mrg   if (need > 0) {
1.1  mrg     from = MP_DIGITS(z) + uz - 1;
1.1  mrg     to = from + need;
1.1  mrg
1.1  mrg     for (i = 0; i < uz; ++i) *to-- = *from--;
1.1  mrg
1.1  mrg     ZERO(MP_DIGITS(z), need);
1.1  mrg     uz += need;
1.1  mrg   }
1.1  mrg
1.1  mrg   if (rest) {
1.1  mrg     d = 0;
1.1  mrg     for (i = need, from = MP_DIGITS(z) + need; i < uz; ++i, ++from) {
1.1  mrg       mp_digit save = *from;
1.1  mrg
1.1  mrg       *from = (*from << rest) | (d >> (MP_DIGIT_BIT - rest));
1.1  mrg       d = save;
1.1  mrg     }
1.1  mrg
1.1  mrg     d >>= (MP_DIGIT_BIT - rest);
1.1  mrg     if (d != 0) {
1.1  mrg       *from = d;
1.1  mrg       uz += extra;
1.1  mrg     }
1.1  mrg   }
1.1  mrg
1.1  mrg   z->used = uz;
1.1  mrg   CLAMP(z);
1.1  mrg
1.1  mrg   return 1;
1.1  mrg }
1.1  mrg
1.1  mrg /* Compute z = 2^p2 - |z|; requires that 2^p2 >= |z|
1.1  mrg    The sign of the result is always zero/positive.
1.1  mrg  */
1.1  mrg static int s_qsub(mp_int z, mp_size p2) {
1.1  mrg   mp_digit hi = (1u << (p2 % MP_DIGIT_BIT)), *zp;
1.1  mrg   mp_size tdig = (p2 / MP_DIGIT_BIT), pos;
1.1  mrg   mp_word w = 0;
1.1  mrg
1.1  mrg   if (!s_pad(z, tdig + 1)) return 0;
1.1  mrg
1.1  mrg   for (pos = 0, zp = MP_DIGITS(z); pos < tdig; ++pos, ++zp) {
1.1  mrg     w = ((mp_word)MP_DIGIT_MAX + 1) - w - (mp_word)*zp;
1.1  mrg
1.1  mrg     *zp = LOWER_HALF(w);
1.1  mrg     w = UPPER_HALF(w) ? 0 : 1;
1.1  mrg   }
1.1  mrg
1.1  mrg   w = ((mp_word)MP_DIGIT_MAX + 1 + hi) - w - (mp_word)*zp;
1.1  mrg   *zp = LOWER_HALF(w);
1.1  mrg
1.1  mrg   assert(UPPER_HALF(w) != 0); /* no borrow out should be possible */
1.1  mrg
1.1  mrg   z->sign = MP_ZPOS;
1.1  mrg   CLAMP(z);
1.1  mrg
1.1  mrg   return 1;
1.1  mrg }
1.1  mrg
1.1  mrg static int s_dp2k(mp_int z) {
1.1  mrg   int k = 0;
1.1  mrg   mp_digit *dp = MP_DIGITS(z), d;
1.1  mrg
1.1  mrg   if (MP_USED(z) == 1 && *dp == 0) return 1;
1.1  mrg
1.1  mrg   while (*dp == 0) {
1.1  mrg     k += MP_DIGIT_BIT;
1.1  mrg     ++dp;
1.1  mrg   }
1.1  mrg
1.1  mrg   d = *dp;
1.1  mrg   while ((d & 1) == 0) {
1.1  mrg     d >>= 1;
1.1  mrg     ++k;
1.1  mrg   }
1.1  mrg
1.1  mrg   return k;
1.1  mrg }
1.1  mrg
1.1  mrg static int s_isp2(mp_int z) {
1.1  mrg   mp_size uz = MP_USED(z), k = 0;
1.1  mrg   mp_digit *dz = MP_DIGITS(z), d;
1.1  mrg
1.1  mrg   while (uz > 1) {
1.1  mrg     if (*dz++ != 0) return -1;
1.1  mrg     k += MP_DIGIT_BIT;
1.1  mrg     --uz;
1.1  mrg   }
1.1  mrg
1.1  mrg   d = *dz;
1.1  mrg   while (d > 1) {
1.1  mrg     if (d & 1) return -1;
1.1  mrg     ++k;
1.1  mrg     d >>= 1;
1.1  mrg   }
1.1  mrg
1.1  mrg   return (int)k;
1.1  mrg }
1.1  mrg
1.1  mrg static int s_2expt(mp_int z, mp_small k) {
1.1  mrg   mp_size ndig, rest;
1.1  mrg   mp_digit *dz;
1.1  mrg
1.1  mrg   ndig = (k + MP_DIGIT_BIT) / MP_DIGIT_BIT;
1.1  mrg   rest = k % MP_DIGIT_BIT;
1.1  mrg
1.1  mrg   if (!s_pad(z, ndig)) return 0;
1.1  mrg
1.1  mrg   dz = MP_DIGITS(z);
1.1  mrg   ZERO(dz, ndig);
1.1  mrg   *(dz + ndig - 1) = (1u << rest);
1.1  mrg   z->used = ndig;
1.1  mrg
1.1  mrg   return 1;
1.1  mrg }
1.1  mrg
1.1  mrg static int s_norm(mp_int a, mp_int b) {
1.1  mrg   mp_digit d = b->digits[MP_USED(b) - 1];
1.1  mrg   int k = 0;
1.1  mrg
1.1  mrg   while (d < (1u << (mp_digit)(MP_DIGIT_BIT - 1))) { /* d < (MP_RADIX / 2) */
1.1  mrg     d <<= 1;
1.1  mrg     ++k;
1.1  mrg   }
1.1  mrg
1.1  mrg   /* These multiplications can't fail */
1.1  mrg   if (k != 0) {
1.1  mrg     (void)s_qmul(a, (mp_size)k);
1.1  mrg     (void)s_qmul(b, (mp_size)k);
1.1  mrg   }
1.1  mrg
1.1  mrg   return k;
1.1  mrg }
1.1  mrg
1.1  mrg static mp_result s_brmu(mp_int z, mp_int m) {
1.1  mrg   mp_size um = MP_USED(m) * 2;
1.1  mrg
1.1  mrg   if (!s_pad(z, um)) return MP_MEMORY;
1.1  mrg
1.1  mrg   s_2expt(z, MP_DIGIT_BIT * um);
1.1  mrg   return mp_int_div(z, m, z, NULL);
1.1  mrg }
1.1  mrg
1.1  mrg static int s_reduce(mp_int x, mp_int m, mp_int mu, mp_int q1, mp_int q2) {
1.1  mrg   mp_size um = MP_USED(m), umb_p1, umb_m1;
1.1  mrg
1.1  mrg   umb_p1 = (um + 1) * MP_DIGIT_BIT;
1.1  mrg   umb_m1 = (um - 1) * MP_DIGIT_BIT;
1.1  mrg
1.1  mrg   if (mp_int_copy(x, q1) != MP_OK) return 0;
1.1  mrg
1.1  mrg   /* Compute q2 = floor((floor(x / b^(k-1)) * mu) / b^(k+1)) */
1.1  mrg   s_qdiv(q1, umb_m1);
1.1  mrg   UMUL(q1, mu, q2);
1.1  mrg   s_qdiv(q2, umb_p1);
1.1  mrg
1.1  mrg   /* Set x = x mod b^(k+1) */
1.1  mrg   s_qmod(x, umb_p1);
1.1  mrg
1.1  mrg   /* Now, q is a guess for the quotient a / m.
1.1  mrg      Compute x - q * m mod b^(k+1), replacing x.  This may be off
1.1  mrg      by a factor of 2m, but no more than that.
1.1  mrg    */
1.1  mrg   UMUL(q2, m, q1);
1.1  mrg   s_qmod(q1, umb_p1);
1.1  mrg   (void)mp_int_sub(x, q1, x); /* can't fail */
1.1  mrg
1.1  mrg   /* The result may be < 0; if it is, add b^(k+1) to pin it in the proper
1.1  mrg      range. */
1.1  mrg   if ((CMPZ(x) < 0) && !s_qsub(x, umb_p1)) return 0;
1.1  mrg
1.1  mrg   /* If x > m, we need to back it off until it is in range.  This will be
1.1  mrg      required at most twice.  */
1.1  mrg   if (mp_int_compare(x, m) >= 0) {
1.1  mrg     (void)mp_int_sub(x, m, x);
1.1  mrg     if (mp_int_compare(x, m) >= 0) {
1.1  mrg       (void)mp_int_sub(x, m, x);
1.1  mrg     }
1.1  mrg   }
1.1  mrg
1.1  mrg   /* At this point, x has been properly reduced. */
1.1  mrg   return 1;
1.1  mrg }
1.1  mrg
1.1  mrg /* Perform modular exponentiation using Barrett's method, where mu is the
1.1  mrg    reduction constant for m.  Assumes a < m, b > 0. */
1.1  mrg static mp_result s_embar(mp_int a, mp_int b, mp_int m, mp_int mu, mp_int c) {
1.1  mrg   mp_digit umu = MP_USED(mu);
1.1  mrg   mp_digit *db = MP_DIGITS(b);
1.1  mrg   mp_digit *dbt = db + MP_USED(b) - 1;
1.1  mrg
1.1  mrg   DECLARE_TEMP(3);
1.1  mrg   REQUIRE(GROW(TEMP(0), 4 * umu));
1.1  mrg   REQUIRE(GROW(TEMP(1), 4 * umu));
1.1  mrg   REQUIRE(GROW(TEMP(2), 4 * umu));
1.1  mrg   ZERO(TEMP(0)->digits, TEMP(0)->alloc);
1.1  mrg   ZERO(TEMP(1)->digits, TEMP(1)->alloc);
1.1  mrg   ZERO(TEMP(2)->digits, TEMP(2)->alloc);
1.1  mrg
1.1  mrg   (void)mp_int_set_value(c, 1);
1.1  mrg
1.1  mrg   /* Take care of low-order digits */
1.1  mrg   while (db < dbt) {
1.1  mrg     mp_digit d = *db;
1.1  mrg
1.1  mrg     for (int i = MP_DIGIT_BIT; i > 0; --i, d >>= 1) {
1.1  mrg       if (d & 1) {
1.1  mrg         /* The use of a second temporary avoids allocation */
1.1  mrg         UMUL(c, a, TEMP(0));
1.1  mrg         if (!s_reduce(TEMP(0), m, mu, TEMP(1), TEMP(2))) {
1.1  mrg           REQUIRE(MP_MEMORY);
1.1  mrg         }
1.1  mrg         mp_int_copy(TEMP(0), c);
1.1  mrg       }
1.1  mrg
1.1  mrg       USQR(a, TEMP(0));
1.1  mrg       assert(MP_SIGN(TEMP(0)) == MP_ZPOS);
1.1  mrg       if (!s_reduce(TEMP(0), m, mu, TEMP(1), TEMP(2))) {
1.1  mrg         REQUIRE(MP_MEMORY);
1.1  mrg       }
1.1  mrg       assert(MP_SIGN(TEMP(0)) == MP_ZPOS);
1.1  mrg       mp_int_copy(TEMP(0), a);
1.1  mrg     }
1.1  mrg
1.1  mrg     ++db;
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Take care of highest-order digit */
1.1  mrg   mp_digit d = *dbt;
1.1  mrg   for (;;) {
1.1  mrg     if (d & 1) {
1.1  mrg       UMUL(c, a, TEMP(0));
1.1  mrg       if (!s_reduce(TEMP(0), m, mu, TEMP(1), TEMP(2))) {
1.1  mrg         REQUIRE(MP_MEMORY);
1.1  mrg       }
1.1  mrg       mp_int_copy(TEMP(0), c);
1.1  mrg     }
1.1  mrg
1.1  mrg     d >>= 1;
1.1  mrg     if (!d) break;
1.1  mrg
1.1  mrg     USQR(a, TEMP(0));
1.1  mrg     if (!s_reduce(TEMP(0), m, mu, TEMP(1), TEMP(2))) {
1.1  mrg       REQUIRE(MP_MEMORY);
1.1  mrg     }
1.1  mrg     (void)mp_int_copy(TEMP(0), a);
1.1  mrg   }
1.1  mrg
1.1  mrg   CLEANUP_TEMP();
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg /* Division of nonnegative integers
1.1  mrg
1.1  mrg    This function implements division algorithm for unsigned multi-precision
1.1  mrg    integers. The algorithm is based on Algorithm D from Knuth's "The Art of
1.1  mrg    Computer Programming", 3rd ed. 1998, pg 272-273.
1.1  mrg
1.1  mrg    We diverge from Knuth's algorithm in that we do not perform the subtraction
1.1  mrg    from the remainder until we have determined that we have the correct
1.1  mrg    quotient digit. This makes our algorithm less efficient that Knuth because
1.1  mrg    we might have to perform multiple multiplication and comparison steps before
1.1  mrg    the subtraction. The advantage is that it is easy to implement and ensure
1.1  mrg    correctness without worrying about underflow from the subtraction.
1.1  mrg
1.1  mrg    inputs: u   a n+m digit integer in base b (b is 2^MP_DIGIT_BIT)
1.1  mrg            v   a n   digit integer in base b (b is 2^MP_DIGIT_BIT)
1.1  mrg            n >= 1
1.1  mrg            m >= 0
1.1  mrg   outputs: u / v stored in u
1.1  mrg            u % v stored in v
1.1  mrg  */
1.1  mrg static mp_result s_udiv_knuth(mp_int u, mp_int v) {
1.1  mrg   /* Force signs to positive */
1.1  mrg   u->sign = MP_ZPOS;
1.1  mrg   v->sign = MP_ZPOS;
1.1  mrg
1.1  mrg   /* Use simple division algorithm when v is only one digit long */
1.1  mrg   if (MP_USED(v) == 1) {
1.1  mrg     mp_digit d, rem;
1.1  mrg     d = v->digits[0];
1.1  mrg     rem = s_ddiv(u, d);
1.1  mrg     mp_int_set_value(v, rem);
1.1  mrg     return MP_OK;
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Algorithm D
1.1  mrg
1.1  mrg      The n and m variables are defined as used by Knuth.
1.1  mrg      u is an n digit number with digits u_{n-1}..u_0.
1.1  mrg      v is an n+m digit number with digits from v_{m+n-1}..v_0.
1.1  mrg      We require that n > 1 and m >= 0
1.1  mrg    */
1.1  mrg   mp_size n = MP_USED(v);
1.1  mrg   mp_size m = MP_USED(u) - n;
1.1  mrg   assert(n > 1);
1.1  mrg   /* assert(m >= 0) follows because m is unsigned. */
1.1  mrg
1.1  mrg   /* D1: Normalize.
1.1  mrg      The normalization step provides the necessary condition for Theorem B,
1.1  mrg      which states that the quotient estimate for q_j, call it qhat
1.1  mrg
1.1  mrg        qhat = u_{j+n}u_{j+n-1} / v_{n-1}
1.1  mrg
1.1  mrg      is bounded by
1.1  mrg
1.1  mrg       qhat - 2 <= q_j <= qhat.
1.1  mrg
1.1  mrg      That is, qhat is always greater than the actual quotient digit q,
1.1  mrg      and it is never more than two larger than the actual quotient digit.
1.1  mrg    */
1.1  mrg   int k = s_norm(u, v);
1.1  mrg
1.1  mrg   /* Extend size of u by one if needed.
1.1  mrg
1.1  mrg      The algorithm begins with a value of u that has one more digit of input.
1.1  mrg      The normalization step sets u_{m+n}..u_0 = 2^k * u_{m+n-1}..u_0. If the
1.1  mrg      multiplication did not increase the number of digits of u, we need to add
1.1  mrg      a leading zero here.
1.1  mrg    */
1.1  mrg   if (k == 0 || MP_USED(u) != m + n + 1) {
1.1  mrg     if (!s_pad(u, m + n + 1)) return MP_MEMORY;
1.1  mrg     u->digits[m + n] = 0;
1.1  mrg     u->used = m + n + 1;
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Add a leading 0 to v.
1.1  mrg
1.1  mrg      The multiplication in step D4 multiplies qhat * 0v_{n-1}..v_0.  We need to
1.1  mrg      add the leading zero to v here to ensure that the multiplication will
1.1  mrg      produce the full n+1 digit result.
1.1  mrg    */
1.1  mrg   if (!s_pad(v, n + 1)) return MP_MEMORY;
1.1  mrg   v->digits[n] = 0;
1.1  mrg
1.1  mrg   /* Initialize temporary variables q and t.
1.1  mrg      q allocates space for m+1 digits to store the quotient digits
1.1  mrg      t allocates space for n+1 digits to hold the result of q_j*v
1.1  mrg    */
1.1  mrg   DECLARE_TEMP(2);
1.1  mrg   REQUIRE(GROW(TEMP(0), m + 1));
1.1  mrg   REQUIRE(GROW(TEMP(1), n + 1));
1.1  mrg
1.1  mrg   /* D2: Initialize j */
1.1  mrg   int j = m;
1.1  mrg   mpz_t r;
1.1  mrg   r.digits = MP_DIGITS(u) + j; /* The contents of r are shared with u */
1.1  mrg   r.used = n + 1;
1.1  mrg   r.sign = MP_ZPOS;
1.1  mrg   r.alloc = MP_ALLOC(u);
1.1  mrg   ZERO(TEMP(1)->digits, TEMP(1)->alloc);
1.1  mrg
1.1  mrg   /* Calculate the m+1 digits of the quotient result */
1.1  mrg   for (; j >= 0; j--) {
1.1  mrg     /* D3: Calculate q' */
1.1  mrg     /* r->digits is aligned to position j of the number u */
1.1  mrg     mp_word pfx, qhat;
1.1  mrg     pfx = r.digits[n];
1.1  mrg     pfx <<= MP_DIGIT_BIT / 2;
1.1  mrg     pfx <<= MP_DIGIT_BIT / 2;
1.1  mrg     pfx |= r.digits[n - 1]; /* pfx = u_{j+n}{j+n-1} */
1.1  mrg
1.1  mrg     qhat = pfx / v->digits[n - 1];
1.1  mrg     /* Check to see if qhat > b, and decrease qhat if so.
1.1  mrg        Theorem B guarantess that qhat is at most 2 larger than the
1.1  mrg        actual value, so it is possible that qhat is greater than
1.1  mrg        the maximum value that will fit in a digit */
1.1  mrg     if (qhat > MP_DIGIT_MAX) qhat = MP_DIGIT_MAX;
1.1  mrg
1.1  mrg     /* D4,D5,D6: Multiply qhat * v and test for a correct value of q
1.1  mrg
1.1  mrg        We proceed a bit different than the way described by Knuth. This way is
1.1  mrg        simpler but less efficent. Instead of doing the multiply and subtract
1.1  mrg        then checking for underflow, we first do the multiply of qhat * v and
1.1  mrg        see if it is larger than the current remainder r. If it is larger, we
1.1  mrg        decrease qhat by one and try again. We may need to decrease qhat one
1.1  mrg        more time before we get a value that is smaller than r.
1.1  mrg
1.1  mrg        This way is less efficent than Knuth because we do more multiplies, but
1.1  mrg        we do not need to worry about underflow this way.
1.1  mrg      */
1.1  mrg     /* t = qhat * v */
1.1  mrg     s_dbmul(MP_DIGITS(v), (mp_digit)qhat, TEMP(1)->digits, n + 1);
1.1  mrg     TEMP(1)->used = n + 1;
1.1  mrg     CLAMP(TEMP(1));
1.1  mrg
1.1  mrg     /* Clamp r for the comparison. Comparisons do not like leading zeros. */
1.1  mrg     CLAMP(&r);
1.1  mrg     if (s_ucmp(TEMP(1), &r) > 0) { /* would the remainder be negative? */
1.1  mrg       qhat -= 1;                   /* try a smaller q */
1.1  mrg       s_dbmul(MP_DIGITS(v), (mp_digit)qhat, TEMP(1)->digits, n + 1);
1.1  mrg       TEMP(1)->used = n + 1;
1.1  mrg       CLAMP(TEMP(1));
1.1  mrg       if (s_ucmp(TEMP(1), &r) > 0) { /* would the remainder be negative? */
1.1  mrg         assert(qhat > 0);
1.1  mrg         qhat -= 1; /* try a smaller q */
1.1  mrg         s_dbmul(MP_DIGITS(v), (mp_digit)qhat, TEMP(1)->digits, n + 1);
1.1  mrg         TEMP(1)->used = n + 1;
1.1  mrg         CLAMP(TEMP(1));
1.1  mrg       }
1.1  mrg       assert(s_ucmp(TEMP(1), &r) <= 0 && "The mathematics failed us.");
1.1  mrg     }
1.1  mrg     /* Unclamp r. The D algorithm expects r = u_{j+n}..u_j to always be n+1
1.1  mrg        digits long. */
1.1  mrg     r.used = n + 1;
1.1  mrg
1.1  mrg     /* D4: Multiply and subtract
1.1  mrg
1.1  mrg        Note: The multiply was completed above so we only need to subtract here.
1.1  mrg      */
1.1  mrg     s_usub(r.digits, TEMP(1)->digits, r.digits, r.used, TEMP(1)->used);
1.1  mrg
1.1  mrg     /* D5: Test remainder
1.1  mrg
1.1  mrg        Note: Not needed because we always check that qhat is the correct value
1.1  mrg              before performing the subtract.  Value cast to mp_digit to prevent
1.1  mrg              warning, qhat has been clamped to MP_DIGIT_MAX
1.1  mrg      */
1.1  mrg     TEMP(0)->digits[j] = (mp_digit)qhat;
1.1  mrg
1.1  mrg     /* D6: Add back
1.1  mrg        Note: Not needed because we always check that qhat is the correct value
1.1  mrg              before performing the subtract.
1.1  mrg      */
1.1  mrg
1.1  mrg     /* D7: Loop on j */
1.1  mrg     r.digits--;
1.1  mrg     ZERO(TEMP(1)->digits, TEMP(1)->alloc);
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Get rid of leading zeros in q */
1.1  mrg   TEMP(0)->used = m + 1;
1.1  mrg   CLAMP(TEMP(0));
1.1  mrg
1.1  mrg   /* Denormalize the remainder */
1.1  mrg   CLAMP(u); /* use u here because the r.digits pointer is off-by-one */
1.1  mrg   if (k != 0) s_qdiv(u, k);
1.1  mrg
1.1  mrg   mp_int_copy(u, v);       /* ok:  0 <= r < v */
1.1  mrg   mp_int_copy(TEMP(0), u); /* ok:  q <= u     */
1.1  mrg
1.1  mrg   CLEANUP_TEMP();
1.1  mrg   return MP_OK;
1.1  mrg }
1.1  mrg
1.1  mrg static int s_outlen(mp_int z, mp_size r) {
1.1  mrg   assert(r >= MP_MIN_RADIX && r <= MP_MAX_RADIX);
1.1  mrg
1.1  mrg   mp_result bits = mp_int_count_bits(z);
1.1  mrg   double raw = (double)bits * s_log2[r];
1.1  mrg
1.1  mrg   return (int)(raw + 0.999999);
1.1  mrg }
1.1  mrg
1.1  mrg static mp_size s_inlen(int len, mp_size r) {
1.1  mrg   double raw = (double)len / s_log2[r];
1.1  mrg   mp_size bits = (mp_size)(raw + 0.5);
1.1  mrg
1.1  mrg   return (mp_size)((bits + (MP_DIGIT_BIT - 1)) / MP_DIGIT_BIT) + 1;
1.1  mrg }
1.1  mrg
1.1  mrg static int s_ch2val(char c, int r) {
1.1  mrg   int out;
1.1  mrg
1.1  mrg   /*
1.1  mrg    * In some locales, isalpha() accepts characters outside the range A-Z,
1.1  mrg    * producing out<0 or out>=36.  The "out >= r" check will always catch
1.1  mrg    * out>=36.  Though nothing explicitly catches out<0, our caller reacts the
1.1  mrg    * same way to every negative return value.
1.1  mrg    */
1.1  mrg   if (isdigit((unsigned char)c))
1.1  mrg     out = c - '0';
1.1  mrg   else if (r > 10 && isalpha((unsigned char)c))
1.1  mrg     out = toupper((unsigned char)c) - 'A' + 10;
1.1  mrg   else
1.1  mrg     return -1;
1.1  mrg
1.1  mrg   return (out >= r) ? -1 : out;
1.1  mrg }
1.1  mrg
1.1  mrg static char s_val2ch(int v, int caps) {
1.1  mrg   assert(v >= 0);
1.1  mrg
1.1  mrg   if (v < 10) {
1.1  mrg     return v + '0';
1.1  mrg   } else {
1.1  mrg     char out = (v - 10) + 'a';
1.1  mrg
1.1  mrg     if (caps) {
1.1  mrg       return toupper((unsigned char)out);
1.1  mrg     } else {
1.1  mrg       return out;
1.1  mrg     }
1.1  mrg   }
1.1  mrg }
1.1  mrg
1.1  mrg static void s_2comp(unsigned char *buf, int len) {
1.1  mrg   unsigned short s = 1;
1.1  mrg
1.1  mrg   for (int i = len - 1; i >= 0; --i) {
1.1  mrg     unsigned char c = ~buf[i];
1.1  mrg
1.1  mrg     s = c + s;
1.1  mrg     c = s & UCHAR_MAX;
1.1  mrg     s >>= CHAR_BIT;
1.1  mrg
1.1  mrg     buf[i] = c;
1.1  mrg   }
1.1  mrg
1.1  mrg   /* last carry out is ignored */
1.1  mrg }
1.1  mrg
1.1  mrg static mp_result s_tobin(mp_int z, unsigned char *buf, int *limpos, int pad) {
1.1  mrg   int pos = 0, limit = *limpos;
1.1  mrg   mp_size uz = MP_USED(z);
1.1  mrg   mp_digit *dz = MP_DIGITS(z);
1.1  mrg
1.1  mrg   while (uz > 0 && pos < limit) {
1.1  mrg     mp_digit d = *dz++;
1.1  mrg     int i;
1.1  mrg
1.1  mrg     for (i = sizeof(mp_digit); i > 0 && pos < limit; --i) {
1.1  mrg       buf[pos++] = (unsigned char)d;
1.1  mrg       d >>= CHAR_BIT;
1.1  mrg
1.1  mrg       /* Don't write leading zeroes */
1.1  mrg       if (d == 0 && uz == 1) i = 0; /* exit loop without signaling truncation */
1.1  mrg     }
1.1  mrg
1.1  mrg     /* Detect truncation (loop exited with pos >= limit) */
1.1  mrg     if (i > 0) break;
1.1  mrg
1.1  mrg     --uz;
1.1  mrg   }
1.1  mrg
1.1  mrg   if (pad != 0 && (buf[pos - 1] >> (CHAR_BIT - 1))) {
1.1  mrg     if (pos < limit) {
1.1  mrg       buf[pos++] = 0;
1.1  mrg     } else {
1.1  mrg       uz = 1;
1.1  mrg     }
1.1  mrg   }
1.1  mrg
1.1  mrg   /* Digits are in reverse order, fix that */
1.1  mrg   REV(buf, pos);
1.1  mrg
1.1  mrg   /* Return the number of bytes actually written */
1.1  mrg   *limpos = pos;
1.1  mrg
1.1  mrg   return (uz == 0) ? MP_OK : MP_TRUNC;
1.1  mrg }
1.1  mrg
1.1  mrg /* Here there be dragons */