avr/libf7/libf7-asm.sx

1.1.1.3  mrg ;; Copyright (C) 2019-2022 Free Software Foundation, Inc.
    1.1  mrg ;;
    1.1  mrg ;; This file is part of LIBF7, which is part of GCC.
    1.1  mrg ;;
    1.1  mrg ;; GCC is free software; you can redistribute it and/or modify it under
    1.1  mrg ;; the terms of the GNU General Public License as published by the Free
    1.1  mrg ;; Software Foundation; either version 3, or (at your option) any later
    1.1  mrg ;; version.
    1.1  mrg ;;
    1.1  mrg ;; GCC is distributed in the hope that it will be useful, but WITHOUT ANY
    1.1  mrg ;; WARRANTY; without even the implied warranty of MERCHANTABILITY or
    1.1  mrg ;; FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
    1.1  mrg ;; for more details.
    1.1  mrg ;;
    1.1  mrg ;; Under Section 7 of GPL version 3, you are granted additional
    1.1  mrg ;; permissions described in the GCC Runtime Library Exception, version
    1.1  mrg ;; 3.1, as published by the Free Software Foundation.
    1.1  mrg ;;
    1.1  mrg ;; You should have received a copy of the GNU General Public License and
    1.1  mrg ;; a copy of the GCC Runtime Library Exception along with this program;
    1.1  mrg ;; see the files COPYING3 and COPYING.RUNTIME respectively.  If not, see
    1.1  mrg ;; <http://www.gnu.org/licenses/>.  */
    1.1  mrg
    1.1  mrg #ifndef __AVR_TINY__
    1.1  mrg
    1.1  mrg #define ASM_DEFS_HAVE_DEFUN
    1.1  mrg
    1.1  mrg #include "asm-defs.h"
    1.1  mrg #include "libf7.h"
    1.1  mrg
    1.1  mrg #define ZERO __zero_reg__
    1.1  mrg #define TMP  __tmp_reg__
    1.1  mrg
    1.1  mrg #define F7(name)   F7_(name##_asm)
    1.1  mrg
    1.1  mrg .macro F7call name
    1.1  mrg     .global F7(\name\())
    1.1  mrg     XCALL   F7(\name\())
    1.1  mrg .endm
    1.1  mrg
    1.1  mrg .macro F7jmp name
    1.1  mrg     .global F7(\name\())
    1.1  mrg     XJMP    F7(\name\())
    1.1  mrg .endm
    1.1  mrg
    1.1  mrg ;; Just for visibility in disassembly.
    1.1  mrg .macro LLL name
    1.1  mrg     .global LLL.\name
    1.1  mrg     LLL.\name:
    1.1  mrg     nop
    1.1  mrg .endm
    1.1  mrg
    1.1  mrg .macro DEFUN name
    1.1  mrg     .section .text.libf7.asm.\name, "ax", @progbits
    1.1  mrg     .global F7(\name\())
    1.1  mrg     .func F7(\name\())
    1.1  mrg     F7(\name\()) :
    1.1  mrg .endm
    1.1  mrg
    1.1  mrg .macro ENDF name
    1.1  mrg     .size F7(\name\()), . - F7(\name\())
    1.1  mrg     .endfunc
    1.1  mrg .endm
    1.1  mrg
    1.1  mrg .macro LABEL name
    1.1  mrg     .global F7(\name\())
    1.1  mrg     F7(\name\()) :
    1.1  mrg .endm
    1.1  mrg
    1.1  mrg .macro _DEFUN name
    1.1  mrg     .section .text.libf7.asm.\name, "ax", @progbits
    1.1  mrg     .weak \name
    1.1  mrg     .type \name, @function
    1.1  mrg     \name :
    1.1  mrg .endm
    1.1  mrg
    1.1  mrg .macro _ENDF name
    1.1  mrg     .size \name, . - \name
    1.1  mrg .endm
    1.1  mrg
    1.1  mrg .macro _LABEL name
    1.1  mrg     .weak \name
    1.1  mrg     .type \name, @function
    1.1  mrg     \name :
    1.1  mrg .endm
    1.1  mrg
    1.1  mrg #define F7_NAME(X)   F7_(X)
    1.1  mrg
    1.1  mrg ;; Make a weak alias.
    1.1  mrg .macro  ALIAS  sym
    1.1  mrg     .weak \sym
    1.1  mrg     .type \sym, @function
    1.1  mrg     \sym:
    1.1  mrg .endm
    1.1  mrg
    1.1  mrg ;; Make a weak alias if double is 64 bits wide.
    1.1  mrg .macro  DALIAS  sym
    1.1  mrg #if defined (WITH_LIBF7_MATH_SYMBOLS) && __SIZEOF_DOUBLE__ == 8
    1.1  mrg ALIAS \sym
    1.1  mrg #endif
    1.1  mrg .endm
    1.1  mrg
    1.1  mrg ;; Make a weak alias if long double is 64 bits wide.
    1.1  mrg .macro  LALIAS  sym
    1.1  mrg #if defined (WITH_LIBF7_MATH_SYMBOLS) && __SIZEOF_LONG_DOUBLE__ == 8
    1.1  mrg ALIAS \sym
    1.1  mrg #endif
    1.1  mrg .endm
    1.1  mrg
    1.1  mrg #define     Off 1
    1.1  mrg #define     Expo (Off + F7_MANT_BYTES)
    1.1  mrg
    1.1  mrg #ifdef F7MOD_classify_
    1.1  mrg ;;  r24 = classify (*Z)
    1.1  mrg ;;  NaN  ->  F7_FLAG_nan
    1.1  mrg ;;  INF  ->  F7_FLAG_inf [ | F7_FLAG_sign ]
    1.1  mrg ;;  ==0  ->  F7_FLAG_zero
    1.1  mrg ;;  ...  ->  0 [ | F7_FLAG_sign ]
    1.1  mrg
    1.1  mrg ;; Clobbers:  None (no TMP, no T).
    1.1  mrg DEFUN classify
    1.1  mrg
    1.1  mrg     ld      r24,    Z
    1.1  mrg     lsr     r24
    1.1  mrg     brne .Lnan_or_inf
    1.1  mrg
    1.1  mrg     ldd     r24,    Z+6+Off
    1.1  mrg     tst     r24
    1.1  mrg     brpl 0f
    1.1  mrg     sbc     r24,    r24
    1.1  mrg     andi    r24,    F7_FLAG_sign
    1.1  mrg     ret
    1.1  mrg
    1.1  mrg 0:  ldi     r24,    F7_FLAG_zero
    1.1  mrg     ret
    1.1  mrg
    1.1  mrg .Lnan_or_inf:
    1.1  mrg     rol     r24
    1.1  mrg     ret
    1.1  mrg
    1.1  mrg ENDF classify
    1.1  mrg #endif /* F7MOD_classify_ */
    1.1  mrg
    1.1  mrg #ifdef F7MOD_clr_
    1.1  mrg DEFUN clr
    1.1  mrg     std     Z+0,     ZERO
    1.1  mrg     std     Z+0+Off, ZERO
    1.1  mrg     std     Z+1+Off, ZERO
    1.1  mrg     std     Z+2+Off, ZERO
    1.1  mrg     std     Z+3+Off, ZERO
    1.1  mrg     std     Z+4+Off, ZERO
    1.1  mrg     std     Z+5+Off, ZERO
    1.1  mrg     std     Z+6+Off, ZERO
    1.1  mrg     std     Z+0+Expo, ZERO
    1.1  mrg     std     Z+1+Expo, ZERO
    1.1  mrg     ret
    1.1  mrg ENDF clr
    1.1  mrg
    1.1  mrg #endif /* F7MOD_clr_ */
    1.1  mrg
    1.1  mrg #ifdef F7MOD_clz_
    1.1  mrg ;; The libcc CLZ implementations like __clzsi2 aka. __builtin_clzl are
    1.1  mrg ;; not very well suited for out purpose, so implement our own.
    1.1  mrg
    1.1  mrg #define ZBITS   r26
    1.1  mrg .macro  .test.byte  reg
    1.1  mrg     or      ZERO,   \reg
    1.1  mrg     brne    .Loop_bit
    1.1  mrg     subi    ZBITS, -8
    1.1  mrg .endm
    1.1  mrg
    1.1  mrg ;; R26 = CLZ (uint64_t R18);  CLZ (0) = 64.
    1.1  mrg ;; Unchanged: T
    1.1  mrg DEFUN clzdi2
    1.1  mrg     clr     ZBITS
    1.1  mrg     ;; Catch the common case of normalized .mant for speed-up.
    1.1  mrg     tst     r25
    1.1  mrg     brmi 9f
    1.1  mrg     .test.byte  r25
    1.1  mrg     .test.byte  r24
    1.1  mrg     .test.byte  r23
    1.1  mrg     .test.byte  r22
    1.1  mrg     .test.byte  r21
    1.1  mrg     .test.byte  r20
    1.1  mrg     .test.byte  r19
    1.1  mrg     .test.byte  r18
    1.1  mrg .Ldone:
    1.1  mrg     clr     ZERO
    1.1  mrg 9:  ret
    1.1  mrg
    1.1  mrg .Loop_bit:
    1.1  mrg     lsl     ZERO
    1.1  mrg     brcs .Ldone
    1.1  mrg     inc     ZBITS
    1.1  mrg     rjmp .Loop_bit
    1.1  mrg
    1.1  mrg ENDF clzdi2
    1.1  mrg #undef  ZBITS
    1.1  mrg #endif /* F7MOD_clz_ */
    1.1  mrg
    1.1  mrg #ifdef F7MOD_cmp_mant_
    1.1  mrg DEFUN cmp_mant
    1.1  mrg
    1.1  mrg     adiw    X,   6 + Off
    1.1  mrg     ld      r24, X      $ ldd   TMP, Z+6+Off    $ SUB   r24, TMP
    1.1  mrg     brne .Lunequal
    1.1  mrg
    1.1  mrg     sbiw    X,  6
    1.1  mrg     ld      r24, X+     $ ldd   TMP, Z+0+Off    $ SUB   r24, TMP
    1.1  mrg     ld      r24, X+     $ ldd   TMP, Z+1+Off    $ sbc   r24, TMP
    1.1  mrg     ld      r24, X+     $ ldd   TMP, Z+2+Off    $ sbc   r24, TMP
    1.1  mrg     ld      r24, X+     $ ldd   TMP, Z+3+Off    $ sbc   r24, TMP
    1.1  mrg     ld      r24, X+     $ ldd   TMP, Z+4+Off    $ sbc   r24, TMP
    1.1  mrg     ld      r24, X+     $ ldd   TMP, Z+5+Off    $ sbc   r24, TMP
    1.1  mrg     ;; MSBs are already known to be equal
    1.1  mrg     breq 9f
    1.1  mrg .Lunequal:
    1.1  mrg     sbc     r24,    r24
    1.1  mrg     sbci    r24,    -1
    1.1  mrg 9:  sbiw    X,      6 + Off
    1.1  mrg     ret
    1.1  mrg ENDF cmp_mant
    1.1  mrg #endif /* F7MOD_cmp_mant_ */
    1.1  mrg
    1.1  mrg #define     CA      18
    1.1  mrg #define     C0      CA+1
    1.1  mrg #define     C1      C0+1
    1.1  mrg #define     C2      C0+2
    1.1  mrg #define     C3      C0+3
    1.1  mrg #define     C4      C0+4
    1.1  mrg #define     C5      C0+5
    1.1  mrg #define     C6      C0+6
    1.1  mrg #define     Carry   r16
    1.1  mrg #define     Flags   18
    1.1  mrg
    1.1  mrg #ifdef F7MOD_store_
    1.1  mrg ;; Z->flags = CA.
    1.1  mrg ;; Z->mant  = C[7].
    1.1  mrg DEFUN store_mant.with_flags
    1.1  mrg     st      Z,      CA
    1.1  mrg
    1.1  mrg ;; Z->mant = C[7].
    1.1  mrg LABEL store_mant
    1.1  mrg     std     Z+0+Off, C0
    1.1  mrg     std     Z+1+Off, C1
    1.1  mrg     std     Z+2+Off, C2
    1.1  mrg     std     Z+3+Off, C3
    1.1  mrg     std     Z+4+Off, C4
    1.1  mrg     std     Z+5+Off, C5
    1.1  mrg     std     Z+6+Off, C6
    1.1  mrg     ret
    1.1  mrg ENDF store_mant.with_flags
    1.1  mrg #endif /* F7MOD_store_ */
    1.1  mrg
    1.1  mrg #ifdef F7MOD_load_
    1.1  mrg ;; CA   = Z->flags
    1.1  mrg ;; C[7] = Z->mant
    1.1  mrg DEFUN load_mant.with_flags
    1.1  mrg     ld      CA,     Z
    1.1  mrg     skipnext
    1.1  mrg
    1.1  mrg ;; CA   = 0
    1.1  mrg ;; C[7] = Z->mant
    1.1  mrg LABEL load_mant.clr_CA
    1.1  mrg LABEL load_mant.clr_flags
    1.1  mrg     clr     CA      ; May be skipped
    1.1  mrg
    1.1  mrg ;; C[7] = Z->mant
    1.1  mrg LABEL load_mant
    1.1  mrg     ldd     C0,     Z+0+Off
    1.1  mrg     ldd     C1,     Z+1+Off
    1.1  mrg     ldd     C2,     Z+2+Off
    1.1  mrg     ldd     C3,     Z+3+Off
    1.1  mrg     ldd     C4,     Z+4+Off
    1.1  mrg     ldd     C5,     Z+5+Off
    1.1  mrg     ldd     C6,     Z+6+Off
    1.1  mrg     ret
    1.1  mrg ENDF load_mant.with_flags
    1.1  mrg #endif /* F7MOD_load_ */
    1.1  mrg
    1.1  mrg #ifdef F7MOD_copy_
    1.1  mrg DEFUN copy
    1.1  mrg     cp      XL,     ZL
    1.1  mrg     cpc     XH,     ZH
    1.1  mrg     breq 9f
    1.1  mrg     adiw    XL,     10
    1.1  mrg     adiw    ZL,     10
    1.1  mrg     set
    1.1  mrg     bld     ZERO,   1
    1.1  mrg     bld     ZERO,   3   ; ZERO = 0b1010 = 10.
    1.1  mrg .Loop:
    1.1  mrg     ld      TMP,    -X
    1.1  mrg     st      -Z,     TMP
    1.1  mrg     dec     ZERO
    1.1  mrg     brne .Loop
    1.1  mrg 9:  ret
    1.1  mrg ENDF copy
    1.1  mrg #endif /* F7MOD_copy_ */
    1.1  mrg
    1.1  mrg #ifdef F7MOD_copy_P_
    1.1  mrg DEFUN copy_P
    1.1  mrg     set
    1.1  mrg     bld     ZERO,   1
    1.1  mrg     bld     ZERO,   3   ; ZERO = 0b1010 = 10.
    1.1  mrg .Loop:
    1.1  mrg #ifdef __AVR_HAVE_LPMX__
    1.1  mrg     lpm     TMP,    Z+
    1.1  mrg #else
    1.1  mrg     lpm
    1.1  mrg     adiw    Z,      1
    1.1  mrg #endif /* Have LPMx */
    1.1  mrg     st      X+,     TMP
    1.1  mrg     dec     ZERO
    1.1  mrg     brne .Loop
    1.1  mrg     sbiw    X,      10
    1.1  mrg     sbiw    Z,      10
    1.1  mrg     ret
    1.1  mrg ENDF copy_P
    1.1  mrg #endif /* F7MOD_copy_P_ */
    1.1  mrg
    1.1  mrg #ifdef F7MOD_copy_mant_
    1.1  mrg DEFUN copy_mant
    1.1  mrg     cp      XL,     ZL
    1.1  mrg     cpc     XH,     ZH
    1.1  mrg     breq 9f
    1.1  mrg     adiw    XL,     1
    1.1  mrg     adiw    ZL,     1
    1.1  mrg     set
    1.1  mrg     bld     ZERO,   3
    1.1  mrg     dec     ZERO        ; ZERO = 7
    1.1  mrg .Loop:
    1.1  mrg     ld      TMP,    X+
    1.1  mrg     st      Z+,     TMP
    1.1  mrg     dec     ZERO
    1.1  mrg     brne    .Loop
    1.1  mrg     sbiw    XL,     8
    1.1  mrg     sbiw    ZL,     8
    1.1  mrg 9:  ret
    1.1  mrg ENDF copy_mant
    1.1  mrg #endif /* F7MOD_copy_mant_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_clr_mant_lsbs_
    1.1  mrg DEFUN clr_mant_lsbs
    1.1  mrg     push    r16
    1.1  mrg     mov     r16,    r20
    1.1  mrg     wmov    XL,     r24
    1.1  mrg
    1.1  mrg     wmov    ZL,     r22
    1.1  mrg     F7call  load_mant
    1.1  mrg
    1.1  mrg     F7call  lshrdi3
    1.1  mrg
    1.1  mrg     clr     CA
    1.1  mrg
    1.1  mrg     F7call   ashldi3
    1.1  mrg
    1.1  mrg     pop     r16
    1.1  mrg
    1.1  mrg     wmov    ZL,     XL
    1.1  mrg     F7jmp  store_mant
    1.1  mrg
    1.1  mrg ENDF clr_mant_lsbs
    1.1  mrg #endif /* F7MOD_clr_mant_lsbs_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_normalize_with_carry_
    1.1  mrg ;; Z = &f7_t
    1.1  mrg ;; C[] = .mant may be not normalized
    1.1  mrg ;; Carry === r16 = Addend to Z->expo in [-64, 128).
    1.1  mrg ;; Normalize C[], set Flags, and adjust Z->expo.
    1.1  mrg ;; Return CA (after normalization) in TMP.
    1.1  mrg ;; Unchanged: T
    1.1  mrg #define Addend  r17
    1.1  mrg #define Zbits   r26
    1.1  mrg #define expL    r26
    1.1  mrg #define expH    r27
    1.1  mrg DEFUN normalize_with_carry
    1.1  mrg     mov     Addend, Carry
    1.1  mrg     tst     C6
    1.1  mrg     brmi .Lshift.0
    1.1  mrg     ;; r26 = CLZ (uint64_t R18)
    1.1  mrg     F7call  clzdi2
    1.1  mrg     cpi     Zbits,  64
    1.1  mrg     breq .Lclr
    1.1  mrg     sub     Addend, Zbits
    1.1  mrg     mov     r16,    Zbits
    1.1  mrg
    1.1  mrg     F7call  ashldi3
    1.1  mrg     ;; Assert (R25.7 == 1)
    1.1  mrg .Lshift.0:
    1.1  mrg     mov     TMP,    CA
    1.1  mrg     ld      Flags,  Z
    1.1  mrg
    1.1  mrg     ;; .expo += Addend
    1.1  mrg     ldd     expL,   Z+0+Expo
    1.1  mrg     ldd     expH,   Z+1+Expo
    1.1  mrg     ;; Sign-extend Addend
    1.1  mrg     clr     r16
    1.1  mrg     sbrc    Addend, 7
    1.1  mrg     com     r16
    1.1  mrg
    1.1  mrg     ;; exp += (int8_t) Addend, i.e. sign-extend Addend.
    1.1  mrg     add     expL,   Addend
    1.1  mrg     adc     expH,   r16
    1.1  mrg     brvc .Lnormal
    1.1  mrg     tst     r16
    1.1  mrg     brmi .Lclr
    1.1  mrg     ;; Overflow
    1.1  mrg #if F7_HAVE_Inf == 1
    1.1  mrg     ori     Flags,  F7_FLAG_inf
    1.1  mrg #else
    1.1  mrg     ldi     Flags,  F7_FLAG_nan
    1.1  mrg #endif /* Have Inf */
    1.1  mrg     ret
    1.1  mrg
    1.1  mrg .Lnormal:
    1.1  mrg     std     Z+0+Expo,   expL
    1.1  mrg     std     Z+1+Expo,   expH
    1.1  mrg     ret
    1.1  mrg
    1.1  mrg .Lclr:
    1.1  mrg     ;; Underflow or Zero.
    1.1  mrg     clr     TMP
    1.1  mrg     .global __clr_8
    1.1  mrg     XJMP    __clr_8
    1.1  mrg
    1.1  mrg LABEL normalize.store_with_flags
    1.1  mrg     ;; no rounding
    1.1  mrg     set
    1.1  mrg     skipnext
    1.1  mrg LABEL normalize.round.store_with_flags
    1.1  mrg     ;; with rounding
    1.1  mrg     clt     ; skipped ?
    1.1  mrg LABEL normalize.maybe_round.store_with_flags
    1.1  mrg     F7call  normalize_with_carry
    1.1  mrg     ;; We have:
    1.1  mrg     ;; Z   = &f7_t
    1.1  mrg     ;; X   = .expo
    1.1  mrg     ;; C[] = .mant
    1.1  mrg     ;; R18 = .flags
    1.1  mrg     ;; TMP = byte below .mant after normalization
    1.1  mrg     ;; T = 1  =>  no rounding.
    1.1  mrg     brts .Lstore
    1.1  mrg     lsl     TMP
    1.1  mrg     adc     C0,     ZERO
    1.1  mrg     brcc .Lstore
    1.1  mrg     adc     C1,     ZERO
    1.1  mrg     adc     C2,     ZERO
    1.1  mrg     adc     C3,     ZERO
    1.1  mrg     adc     C4,     ZERO
    1.1  mrg     adc     C5,     ZERO
    1.1  mrg     adc     C6,     ZERO
    1.1  mrg     brcc .Lstore
    1.1  mrg     ;; We only come here if C6 overflowed, i.e. C[] is 0 now.
    1.1  mrg     ;; .mant = 1.0 by restoring the MSbit.
    1.1  mrg     ror     C6
    1.1  mrg     ;; .expo += 1 and override the .expo stored during normalize.
    1.1  mrg     adiw    expL,   1
    1.1  mrg     std     Z+0+Expo,   expL
    1.1  mrg     std     Z+1+Expo,   expH
    1.1  mrg
    1.1  mrg .Lstore:
    1.1  mrg     F7call  store_mant.with_flags
    1.1  mrg
    1.1  mrg     ;; Return the byte below .mant after normalization.
    1.1  mrg     ;; This is only useful without rounding; the caller will know.
    1.1  mrg     mov     R24,    TMP
    1.1  mrg     ret
    1.1  mrg ENDF normalize_with_carry
    1.1  mrg #endif /* F7MOD_normalize_with_carry_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_normalize_
    1.1  mrg ;; Using above functionality from C.
    1.1  mrg ;; f7_t* normalize (f7_t *cc)
    1.1  mrg ;; Adjusts cc->expo
    1.1  mrg ;; Clears cc->flags
    1.1  mrg DEFUN normalize
    1.1  mrg     push    r17
    1.1  mrg     push    r16
    1.1  mrg     wmov    ZL,     r24
    1.1  mrg     F7call  load_mant.clr_CA
    1.1  mrg     clr     Carry
    1.1  mrg     st      Z,      ZERO
    1.1  mrg     F7call  normalize.store_with_flags
    1.1  mrg     wmov    r24,    Z
    1.1  mrg     pop     r16
    1.1  mrg     pop     r17
    1.1  mrg     ret
    1.1  mrg ENDF normalize
    1.1  mrg #endif /* F7MOD_normalize_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_store_expo_
    1.1  mrg #define Done    r24
    1.1  mrg #define expLO   r24
    1.1  mrg #define expHI   r25
    1.1  mrg ;; expo == INT16_MAX  =>  *Z = Inf,         return Done = true.
    1.1  mrg ;; expo == INT16_MIN  =>  *Z = 0x0,         return Done = true.
    1.1  mrg ;; else               =>  Z->expo = expo,   return Done = false.
    1.1  mrg DEFUN store_expo
    1.1  mrg     cpi     expHI,   0x80
    1.1  mrg     cpc     expLO,  ZERO
    1.1  mrg     breq .Ltiny
    1.1  mrg     adiw    expLO,  1
    1.1  mrg     brvs .Lhuge
    1.1  mrg     sbiw    expLO,  1
    1.1  mrg     std     Z+0+Expo,   expLO
    1.1  mrg     std     Z+1+Expo,   expHI
    1.1  mrg     ldi     Done,   0
    1.1  mrg     ret
    1.1  mrg
    1.1  mrg .Lhuge:
    1.1  mrg #if F7_HAVE_Inf == 1
    1.1  mrg     ld      Done,   Z
    1.1  mrg     andi    Done,   F7_FLAG_sign
    1.1  mrg     ori     Done,   F7_FLAG_inf
    1.1  mrg #else
    1.1  mrg     ldi     Done,   F7_FLAG_nan
    1.1  mrg #endif /* Have Inf */
    1.1  mrg     st      Z,      Done
    1.1  mrg     ldi     Done,   1
    1.1  mrg     ret
    1.1  mrg
    1.1  mrg .Ltiny:
    1.1  mrg     ldi     Done,   1
    1.1  mrg     F7jmp   clr
    1.1  mrg ENDF store_expo
    1.1  mrg #endif /* F7MOD_store_expo_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_set_u64_
    1.1  mrg DEFUN set_s64
    1.1  mrg     set
    1.1  mrg     skipnext
    1.1  mrg     ;; ...
    1.1  mrg LABEL set_u64
    1.1  mrg     clt     ; Skipped?
    1.1  mrg     wmov    Zl,     r16
    1.1  mrg     ;; TMP holds .flags.
    1.1  mrg     clr     TMP
    1.1  mrg     brtc .Lnot.negative
    1.1  mrg
    1.1  mrg     bst     C6,     7
    1.1  mrg     brtc .Lnot.negative
    1.1  mrg     bld     TMP,    F7_FLAGNO_sign
    1.1  mrg     .global __negdi2
    1.1  mrg     XCALL   __negdi2
    1.1  mrg
    1.1  mrg .Lnot.negative:
    1.1  mrg     st      Z,          TMP
    1.1  mrg     std     Z+0+Expo,   ZERO
    1.1  mrg     std     Z+1+Expo,   ZERO
    1.1  mrg     ldi     Carry,      63
    1.1  mrg     F7call  normalize.round.store_with_flags
    1.1  mrg     wmov    r24,        Z
    1.1  mrg     wmov    r16,        Z   ; Unclobber r16.
    1.1  mrg     ret
    1.1  mrg ENDF set_s64
    1.1  mrg #endif /* F7MOD_set_u64_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_to_integer_
    1.1  mrg #define Mask    r26
    1.1  mrg DEFUN to_integer
    1.1  mrg     wmov    ZL,     r24
    1.1  mrg     mov     Mask,   r22
    1.1  mrg
    1.1  mrg     F7call  load_mant.with_flags
    1.1  mrg
    1.1  mrg     sbrc    Flags, F7_FLAGNO_nan
    1.1  mrg     rjmp .Lset_0x8000
    1.1  mrg
    1.1  mrg     sbrc    Flags, F7_FLAGNO_inf
    1.1  mrg     rjmp .Lsaturate
    1.1  mrg
    1.1  mrg     sbrs    C6, 7
    1.1  mrg     rjmp .Lset_0x0000
    1.1  mrg
    1.1  mrg     bst     Flags, F7_FLAGNO_sign
    1.1  mrg     ldd     r27,    Z+0+Expo
    1.1  mrg     ;; Does .expo have bits outside Mask? ...
    1.1  mrg     mov     TMP,    Mask
    1.1  mrg     com     TMP
    1.1  mrg     and     TMP,    r27
    1.1  mrg     ldd     r27,    Z+1+Expo
    1.1  mrg     tst     r27
    1.1  mrg     brmi .Lset_0x0000       ; ...yes: .expo is < 0  =>  return 0
    1.1  mrg     or      TMP,    r27
    1.1  mrg     brne .Lsaturate.T       ; ...yes: .expo > Mask  =>  saturate
    1.1  mrg
    1.1  mrg     ;; ...no:  Shift right to meet .expo = 0.
    1.1  mrg     PUSH    r16
    1.1  mrg     ldd     r16,    Z+0+Expo
    1.1  mrg     eor     r16,    Mask
    1.1  mrg     and     r16,    Mask
    1.1  mrg     clr     CA
    1.1  mrg     F7call  lshrdi3
    1.1  mrg     POP     r16
    1.1  mrg     tst     C6
    1.1  mrg     brmi    .Lsaturate.T    ;   > INTxx_MAX  =>  saturate
    1.1  mrg
    1.1  mrg     brtc 9f                 ;   >= 0         =>  return
    1.1  mrg     sbrc    Mask,   5
    1.1  mrg     .global __negdi2
    1.1  mrg     XJMP    __negdi2
    1.1  mrg     sbrc    Mask,   4
    1.1  mrg     .global __negsi2
    1.1  mrg     XJMP    __negsi2
    1.1  mrg     neg     C6
    1.1  mrg     neg     C5
    1.1  mrg     sbci    C6,     0
    1.1  mrg 9:  ret
    1.1  mrg
    1.1  mrg .Lsaturate:
    1.1  mrg     bst     Flags, F7_FLAGNO_sign
    1.1  mrg .Lsaturate.T:
    1.1  mrg
    1.1  mrg #if F7_HAVE_Inf
    1.1  mrg     brtc .Lset_0x7fff
    1.1  mrg     ;; -Inf  =>  return 1 + INTxx_MIN
    1.1  mrg     mov     ZL,     Flags
    1.1  mrg     .global __clr_8
    1.1  mrg     XCALL   __clr_8
    1.1  mrg     ldi     C6,     0x80
    1.1  mrg
    1.1  mrg     ldi     CA+0,   0x01
    1.1  mrg
    1.1  mrg     sbrs    Mask,   5
    1.1  mrg     ldi     CA+4,   0x01
    1.1  mrg
    1.1  mrg     sbrs    Mask,   4
    1.1  mrg     ldi     CA+6,   0x01
    1.1  mrg     ret
    1.1  mrg
    1.1  mrg .Lset_0x7fff:
    1.1  mrg     ;; +Inf  =>  return INTxx_MAX
    1.1  mrg     sec
    1.1  mrg     .global __sbc_8
    1.1  mrg     XCALL   __sbc_8
    1.1  mrg     ldi     C6,     0x7f
    1.1  mrg     ret
    1.1  mrg #endif /* F7_HAVE_Inf */
    1.1  mrg
    1.1  mrg .Lset_0x8000:
    1.1  mrg     ;; NaN  =>  return INTxx_MIN
    1.1  mrg     .global __clr_8
    1.1  mrg     XCALL   __clr_8
    1.1  mrg     ldi     C6,     0x80
    1.1  mrg     ret
    1.1  mrg
    1.1  mrg .Lset_0x0000:
    1.1  mrg     ;; Small value  =>  return 0x0
    1.1  mrg     .global __clr_8
    1.1  mrg     XJMP    __clr_8
    1.1  mrg
    1.1  mrg ENDF to_integer
    1.1  mrg #endif /* F7MOD_to_integer_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_to_unsigned_
    1.1  mrg #define Mask    r26
    1.1  mrg DEFUN to_unsigned
    1.1  mrg     wmov    ZL,     r24
    1.1  mrg     mov     Mask,   r22
    1.1  mrg
    1.1  mrg     F7call  load_mant.with_flags
    1.1  mrg
    1.1  mrg     sbrc    Flags, F7_FLAGNO_nan
    1.1  mrg     rjmp .Lset_0xffff
    1.1  mrg
    1.1  mrg     sbrc    Flags, F7_FLAGNO_sign
    1.1  mrg     rjmp .Lset_0x0000
    1.1  mrg
    1.1  mrg     sbrc    Flags, F7_FLAGNO_inf
    1.1  mrg     rjmp .Lset_0xffff
    1.1  mrg
    1.1  mrg     sbrs    C6, 7
    1.1  mrg     rjmp .Lset_0x0000
    1.1  mrg
    1.1  mrg     ldd     r27,    Z+0+Expo
    1.1  mrg     ;; Does .expo have bits outside Mask? ...
    1.1  mrg     mov     TMP,    Mask
    1.1  mrg     com     TMP
    1.1  mrg     and     TMP,    r27
    1.1  mrg     ldd     r27,    Z+1+Expo
    1.1  mrg     tst     r27
    1.1  mrg     brmi .Lset_0x0000       ; ...yes: .expo is < 0  =>  return 0
    1.1  mrg     or      TMP,    r27
    1.1  mrg     brne .Lset_0xffff       ; ...yes: .expo > Mask  =>  saturate
    1.1  mrg
    1.1  mrg     ;; ...no:  Shift right to meet .expo = 0.
    1.1  mrg     PUSH    r16
    1.1  mrg     ldd     r16,    Z+0+Expo
    1.1  mrg     eor     r16,    Mask
    1.1  mrg     and     r16,    Mask
    1.1  mrg     clr     CA
    1.1  mrg     F7call  lshrdi3
    1.1  mrg     POP     r16
    1.1  mrg     ret
    1.1  mrg
    1.1  mrg .Lset_0xffff:
    1.1  mrg     ;; return UINTxx_MAX
    1.1  mrg     sec
    1.1  mrg     .global __sbc_8
    1.1  mrg     XJMP    __sbc_8
    1.1  mrg
    1.1  mrg .Lset_0x0000:
    1.1  mrg     ;; Small value  =>  return 0x0
    1.1  mrg     .global __clr_8
    1.1  mrg     XJMP    __clr_8
    1.1  mrg
    1.1  mrg ENDF to_unsigned
    1.1  mrg #endif /* F7MOD_to_unsigned_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_addsub_mant_scaled_
    1.1  mrg ;; int8_t f7_addsub_mant_scaled_asm (f7_t *r24, const f7_t *r22, const f7_t 20*,
    1.1  mrg ;;                                   uint8_t r18);
    1.1  mrg ;; R18.0 = 1 : ADD
    1.1  mrg ;; R18.0 = 0 : SUB
    1.1  mrg ;; R18[7..1] : Scale
    1.1  mrg ;; Compute *R24 = *R22 + *R20 >> R18[7..1].
    1.1  mrg
    1.1  mrg #define     BA      10
    1.1  mrg #define     B0      BA+1
    1.1  mrg #define     B1      B0+1
    1.1  mrg #define     B2      B0+2
    1.1  mrg #define     B3      B0+3
    1.1  mrg #define     B4      B0+4
    1.1  mrg #define     B5      B0+5
    1.1  mrg #define     B6      B0+6
    1.1  mrg
    1.1  mrg DEFUN addsub_mant_scaled
    1.1  mrg     do_prologue_saves  10
    1.1  mrg
    1.1  mrg     bst     r18,    0  ;; ADD ?
    1.1  mrg     lsr     r18
    1.1  mrg     mov     r16,    r18
    1.1  mrg
    1.1  mrg     wmov    ZL,     r20
    1.1  mrg     wmov    YL,     r22
    1.1  mrg     ;; C[] = bb >> shift
    1.1  mrg     wmov    XL,     r24
    1.1  mrg
    1.1  mrg     F7call  load_mant.clr_CA
    1.1  mrg     F7call  lshrdi3
    1.1  mrg
    1.1  mrg     wmov    BA,     CA
    1.1  mrg     wmov    B1,     C1
    1.1  mrg     wmov    B3,     C3
    1.1  mrg     wmov    B5,     C5
    1.1  mrg     wmov    ZL,     YL
    1.1  mrg     F7call  load_mant.clr_CA
    1.1  mrg
    1.1  mrg     wmov    ZL,     XL
    1.1  mrg
    1.1  mrg     brts .Ladd
    1.1  mrg
    1.1  mrg     .global __subdi3
    1.1  mrg     XCALL   __subdi3
    1.1  mrg
    1.1  mrg     breq .Lzero
    1.1  mrg     brcc .Lround
    1.1  mrg     ;; C = 1: Can underflow happen at all ?
    1.1  mrg .Lzero:
    1.1  mrg     F7call  clr
    1.1  mrg     rjmp .Lepilogue
    1.1  mrg
    1.1  mrg .Ladd:
    1.1  mrg     .global __adddi3
    1.1  mrg     XCALL   __adddi3
    1.1  mrg     brcc .Lround
    1.1  mrg     ldi     Carry,  1
    1.1  mrg     .global __lshrdi3
    1.1  mrg     XCALL   __lshrdi3
    1.1  mrg     ori     C6, 1 << 7
    1.1  mrg     skipnext
    1.1  mrg .Lround:
    1.1  mrg     clr     Carry   ; skipped?
    1.1  mrg     F7call  normalize.round.store_with_flags
    1.1  mrg
    1.1  mrg .Lepilogue:
    1.1  mrg     do_epilogue_restores 10
    1.1  mrg
    1.1  mrg ENDF addsub_mant_scaled
    1.1  mrg
    1.1  mrg #if !defined (__AVR_HAVE_MOVW__) || !defined (__AVR_HAVE_JMP_CALL__)
    1.1  mrg DEFUN lshrdi3
    1.1  mrg     .global __lshrdi3
    1.1  mrg     XJMP    __lshrdi3
    1.1  mrg ENDF lshrdi3
    1.1  mrg DEFUN ashldi3
    1.1  mrg     .global __ashldi3
    1.1  mrg     XJMP    __ashldi3
    1.1  mrg ENDF ashldi3
    1.1  mrg #else
    1.1  mrg
    1.1  mrg # Basically just a wrapper around libgcc's __lshrdi3.
    1.1  mrg DEFUN lshrdi3
    1.1  mrg     ;; Handle bit 5 of shift offset.
    1.1  mrg     sbrs    r16,    5
    1.1  mrg     rjmp 4f
    1.1  mrg     wmov    CA,     C3
    1.1  mrg     wmov    C1,     C5
    1.1  mrg     clr     C6          $   clr     C5  $   wmov    C3, C5
    1.1  mrg 4:
    1.1  mrg     ;; Handle bit 4 of shift offset.
    1.1  mrg     sbrs    r16,    4
    1.1  mrg     rjmp 3f
    1.1  mrg     wmov CA, C1
    1.1  mrg     wmov C1, C3
    1.1  mrg     wmov C3, C5
    1.1  mrg     clr     C6          $   clr     C5
    1.1  mrg 3:
    1.1  mrg     ;; Handle bits 3...0 of shift offset.
    1.1  mrg     push    r16
    1.1  mrg     andi    r16,    0xf
    1.1  mrg     breq 0f
    1.1  mrg
    1.1  mrg     .global __lshrdi3
    1.1  mrg     XCALL   __lshrdi3
    1.1  mrg 0:
    1.1  mrg     pop     r16
    1.1  mrg     ret
    1.1  mrg ENDF lshrdi3
    1.1  mrg
    1.1  mrg # Basically just a wrapper around libgcc's __ashldi3.
    1.1  mrg DEFUN ashldi3
    1.1  mrg     ;; Handle bit 5 of shift offset.
    1.1  mrg     sbrs    r16,    5
    1.1  mrg     rjmp 4f
    1.1  mrg     wmov    C5,     C1
    1.1  mrg     wmov    C3,     CA
    1.1  mrg     clr     C2          $   clr     C1  $   wmov    CA, C1
    1.1  mrg 4:
    1.1  mrg     ;; Handle bit 4 of shift offset.
    1.1  mrg     sbrs    r16,    4
    1.1  mrg     rjmp 3f
    1.1  mrg     wmov C5, C3
    1.1  mrg     wmov C3, C1
    1.1  mrg     wmov C1, CA
    1.1  mrg     clr     CA          $   clr     C0
    1.1  mrg 3:
    1.1  mrg     ;; Handle bits 3...0 of shift offset.
    1.1  mrg     push    r16
    1.1  mrg     andi    r16,    0xf
    1.1  mrg     breq 0f
    1.1  mrg
    1.1  mrg     .global __ashldi3
    1.1  mrg     XCALL   __ashldi3
    1.1  mrg 0:
    1.1  mrg     pop     r16
    1.1  mrg     ret
    1.1  mrg ENDF ashldi3
    1.1  mrg #endif /* Small device */
    1.1  mrg
    1.1  mrg #endif /* F7MOD_addsub_mant_scaled_ */
    1.1  mrg
    1.1  mrg #if defined F7MOD_mul_mant_ && defined (__AVR_HAVE_MUL__)
    1.1  mrg     #define     A0      11
    1.1  mrg     #define     A1      A0+1
    1.1  mrg     #define     A2      A0+2
    1.1  mrg     #define     A3      A0+3
    1.1  mrg     #define     A4      A0+4
    1.1  mrg     #define     A5      A0+5
    1.1  mrg     #define     A6      A0+6
    1.1  mrg
    1.1  mrg     #define     TT0     26
    1.1  mrg     #define     TT1     TT0+1
    1.1  mrg     #define     TT2     28
    1.1  mrg     #define     TT3     TT2+1
    1.1  mrg
    1.1  mrg     #define     BB      10
    1.1  mrg
    1.1  mrg ;; R18.0 = 1: No rounding.
    1.1  mrg
    1.1  mrg DEFUN mul_mant
    1.1  mrg     do_prologue_saves 10
    1.1  mrg     bst     r18,    0
    1.1  mrg     push    r25
    1.1  mrg     push    r24
    1.1  mrg     movw    ZL,     r22
    1.1  mrg     LDD     A0,     Z+0+Off
    1.1  mrg     LDD     A1,     Z+1+Off
    1.1  mrg     LDD     A2,     Z+2+Off
    1.1  mrg     LDD     A3,     Z+3+Off
    1.1  mrg     LDD     A4,     Z+4+Off
    1.1  mrg     LDD     A5,     Z+5+Off
    1.1  mrg     LDD     A6,     Z+6+Off
    1.1  mrg     movw    ZL,     r20
    1.1  mrg
    1.1  mrg     ;; 6 * 6 -> 6:5
    1.1  mrg     ;; 4 * 6 -> 4:3
    1.1  mrg     ;; 2 * 6 -> 2:1
    1.1  mrg     ;; 0 * 6 -> 0:a
    1.1  mrg     ldd     BB, Z+6+Off
    1.1  mrg     mul     A6, BB      $   movw    C5, r0
    1.1  mrg     mul     A4, BB      $   movw    C3, r0
    1.1  mrg     mul     A2, BB      $   movw    C1, r0
    1.1  mrg     mul     A0, BB      $   movw    CA, r0
    1.1  mrg
    1.1  mrg     ;; 5 * 6 -> 5:4
    1.1  mrg     ;; 3 * 6 -> 3:2
    1.1  mrg     ;; 1 * 6 -> 1:0
    1.1  mrg     mul     A5, BB      $   movw    TT2, r0
    1.1  mrg     mul     A3, BB      $   movw    TT0, r0
    1.1  mrg     mul     A1, BB
    1.1  mrg     ADD     C0, r0      $   adc     C1, r1
    1.1  mrg     adc     C2, TT0     $   adc     C3, TT1
    1.1  mrg     adc     C4, TT2     $   adc     C5, TT3     $   clr ZERO
    1.1  mrg     adc     C6, ZERO
    1.1  mrg     ;; Done B6
    1.1  mrg
    1.1  mrg     ;; 3 * 3 -> 0:a
    1.1  mrg     ;; 4 * 4 -> 2:1
    1.1  mrg     ;; 5 * 5 -> 4:3
    1.1  mrg     ldd     BB, Z+3+Off $   mul     A3, BB      $   movw    TT0, r0
    1.1  mrg     ldd     BB, Z+4+Off $   mul     A4, BB      $   movw    TT2, r0
    1.1  mrg     ldd     BB, Z+5+Off $   mul     A5, BB
    1.1  mrg
    1.1  mrg     ADD     CA, TT0     $   adc     C0, TT1
    1.1  mrg     adc     C1, TT2     $   adc     C2, TT3
    1.1  mrg     adc     C3, r0      $   adc     C4, r1
    1.1  mrg     brcc .+2
    1.1  mrg     adiw    C5, 1
    1.1  mrg
    1.1  mrg     ;; 6 * 5 -> 5:4
    1.1  mrg     ;; 4 * 5 -> 3:2
    1.1  mrg     ;; 2 * 5 -> 1:0
    1.1  mrg     ;; 0 * 5 -> a:-
    1.1  mrg     mul     A0, BB
    1.1  mrg     ;; A0 done
    1.1  mrg #define Atmp A0
    1.1  mrg
    1.1  mrg     mov     Atmp, r1
    1.1  mrg     mul     A6, BB      $   movw    TT2, r0
    1.1  mrg     mul     A4, BB      $   movw    TT0, r0
    1.1  mrg     mul     A2, BB
    1.1  mrg
    1.1  mrg     ADD     CA, Atmp
    1.1  mrg     adc     C0, r0      $   adc     C1, r1
    1.1  mrg     adc     C2, TT0     $   adc     C3, TT1
    1.1  mrg     adc     C4, TT2     $   adc     C5, TT3     $   clr ZERO
    1.1  mrg     adc     C6, ZERO
    1.1  mrg
    1.1  mrg     ;; 1 * 5 -> 0:a
    1.1  mrg     ;; 3 * 5 -> 2:1
    1.1  mrg     ;; 6 * 4 -> 4:3
    1.1  mrg     mul     A1, BB      $   movw    TT0, r0
    1.1  mrg     mul     A3, BB      $   movw    TT2, r0
    1.1  mrg     ldd     BB, Z+4+Off
    1.1  mrg     mul     A6, BB
    1.1  mrg
    1.1  mrg     ADD     CA, TT0     $   adc     C0, TT1
    1.1  mrg     adc     C1, TT2     $   adc     C2, TT3
    1.1  mrg     adc     C3, r0      $   adc     C4, r1      $   clr ZERO
    1.1  mrg     adc     C5, ZERO    $   adc     C6, ZERO
    1.1  mrg     ;; B5 done
    1.1  mrg
    1.1  mrg     ;; 6 * 3 -> 3:2
    1.1  mrg     ;; 6 * 1 -> 1:0
    1.1  mrg     ;; 4 * 1 -> a:-
    1.1  mrg     mov     TT0, A6     $   ldd TMP,  Z+3+Off
    1.1  mrg     mov     BB,  A4     $   ldd Atmp, Z+1+Off
    1.1  mrg     rcall   .Lmul.help.3
    1.1  mrg
    1.1  mrg     ;; 5 * 4 -> 3:2
    1.1  mrg     ;; 5 * 2 -> 1:0
    1.1  mrg     ;; 3 * 2 -> a:-
    1.1  mrg     mov     TT0, A5     $   ldd TMP,  Z+4+Off
    1.1  mrg     mov     BB,  A3     $   ldd Atmp, Z+2+Off
    1.1  mrg     rcall   .Lmul.help.3
    1.1  mrg
    1.1  mrg     ;; 4 *   -> 3:2 (=0)
    1.1  mrg     ;; 4 * 3 -> 1:0
    1.1  mrg     ;; 2 * 3 -> a:-
    1.1  mrg     mov     TT0, A4     $   clr TMP
    1.1  mrg     mov     BB,  A2     $   ldd Atmp, Z+3+Off
    1.1  mrg     rcall   .Lmul.help.3
    1.1  mrg
    1.1  mrg     ;; 3 * . -> 3:2 (=0)
    1.1  mrg     ;; 3 * 4 -> 1:0
    1.1  mrg     ;; 1 * 4 -> a:-
    1.1  mrg     mov     TT0, A3     $   clr TMP
    1.1  mrg     mov     BB,  A1     $   ldd Atmp, Z+4+Off
    1.1  mrg     rcall   .Lmul.help.3
    1.1  mrg
    1.1  mrg     ;; . * ? -> 3:2 (=0)
    1.1  mrg     ;; . * 0 -> 1:0 (=0)
    1.1  mrg     ;; 5 * 0 -> a:-
    1.1  mrg     clr     TT0
    1.1  mrg     mov     BB,  A5     $   ldd Atmp, Z+0+Off
    1.1  mrg     rcall   .Lmul.help.3
    1.1  mrg
    1.1  mrg     clr TT3  ;; Asserted by .Lmul.help.2
    1.1  mrg     ;; 6 * 2 -> 2:1
    1.1  mrg     ;; 6 * 0 -> 0:a
    1.1  mrg                         $   ldd TMP,  Z+2+Off
    1.1  mrg     mov     BB, A6     ;$   ldd Atmp, Z+0+Off
    1.1  mrg     rcall   .Lmul.help.2
    1.1  mrg
    1.1  mrg     ;; 5 * 3 -> 2:1
    1.1  mrg     ;; 5 * 1 -> 0:a
    1.1  mrg                         $   ldd TMP,  Z+3+Off
    1.1  mrg     mov     BB, A5      $   ldd Atmp, Z+1+Off
    1.1  mrg     rcall   .Lmul.help.2
    1.1  mrg
    1.1  mrg     ;; 4 * . -> 2:1 (=0)
    1.1  mrg     ;; 4 * 2 -> 0:a
    1.1  mrg                         $   clr TMP
    1.1  mrg     mov     BB, A4      $   ldd Atmp, Z+2+Off
    1.1  mrg     rcall   .Lmul.help.2
    1.1  mrg
    1.1  mrg     ;; 2 * . -> 2:1 (=0)
    1.1  mrg     ;; 2 * 4 -> 0:a
    1.1  mrg                         $   clr TMP
    1.1  mrg     mov     BB, A2      $   ldd Atmp, Z+4+Off
    1.1  mrg     rcall   .Lmul.help.2
    1.1  mrg
    1.1  mrg     ;; Finally...
    1.1  mrg
    1.1  mrg     pop     ZL
    1.1  mrg     pop     ZH
    1.1  mrg     ;; The high byte is at least 0x40 and at most 0xfe.
    1.1  mrg     ;; The result has to be left-shifted by one in order to scale it
    1.1  mrg     ;; correctly.
    1.1  mrg
    1.1  mrg     ldi     Carry,  1
    1.1  mrg     F7call  normalize.maybe_round.store_with_flags
    1.1  mrg
    1.1  mrg     do_epilogue_restores 10
    1.1  mrg
    1.1  mrg ;; TT0 * Tmp  -> 3:2
    1.1  mrg ;; TT0 * Atmp -> 1:0
    1.1  mrg ;; BB  * Atmp -> a:-
    1.1  mrg ;;
    1.1  mrg ;; Clobbers : TMP, TT0...TT3.
    1.1  mrg ;; Sets     : ZERO = 0.
    1.1  mrg .Lmul.help.3:
    1.1  mrg     mul     TT0, TMP    $   movw    TT2, r0
    1.1  mrg     mul     TT0, Atmp   $   movw    TT0, r0
    1.1  mrg     mul     BB,  Atmp
    1.1  mrg
    1.1  mrg     ADD     CA, r1
    1.1  mrg     adc     C0, TT0     $   adc     C1, TT1
    1.1  mrg     adc     C2, TT2
    1.1  mrg .Lmul.help.3.C3:        $   adc     C3, TT3     $ clr ZERO
    1.1  mrg     adc     C4, ZERO    $   adc     C5, ZERO
    1.1  mrg     adc     C6, ZERO
    1.1  mrg     ret
    1.1  mrg
    1.1  mrg ;; BB * TMP  -> 2:1
    1.1  mrg ;; BB * Atmp -> 0:a
    1.1  mrg ;;
    1.1  mrg ;; Asserts  : TT3 = 0
    1.1  mrg ;; Clobbers : TMP, TT0, TT1.
    1.1  mrg ;; Sets     : ZERO = 0.
    1.1  mrg .Lmul.help.2:
    1.1  mrg     mul     BB, TMP     $   movw    TT0, r0
    1.1  mrg     mul     BB, Atmp
    1.1  mrg     ADD     CA, r0      $   adc     C0, r1
    1.1  mrg     adc     C1, TT0     $   adc     C2, TT1
    1.1  mrg     rjmp .Lmul.help.3.C3
    1.1  mrg
    1.1  mrg ENDF mul_mant
    1.1  mrg #endif /* F7MOD_mul_mant_ && MUL */
    1.1  mrg
    1.1  mrg
    1.1  mrg #if defined (F7MOD_div_)
    1.1  mrg
    1.1  mrg ;; Dividend is C[]
    1.1  mrg
    1.1  mrg ;; Divisor
    1.1  mrg #define A0       9
    1.1  mrg #define A1      10
    1.1  mrg #define A2      11
    1.1  mrg #define A3      12
    1.1  mrg #define A4      13
    1.1  mrg #define A5      14
    1.1  mrg #define A6      15
    1.1  mrg
    1.1  mrg ;; Quotient
    1.1  mrg #define Q0      0       /* === TMP  */
    1.1  mrg #define Q1      Q0+1    /* === ZERO */
    1.1  mrg #define Q2      26
    1.1  mrg #define Q3      Q2+1
    1.1  mrg #define Q4      28
    1.1  mrg #define Q5      Q4+1
    1.1  mrg #define Q6      16
    1.1  mrg #define Q7      Q6+1
    1.1  mrg
    1.1  mrg #define Cnt     CA
    1.1  mrg #define QBits   r8
    1.1  mrg
    1.1  mrg DEFUN div
    1.1  mrg     do_prologue_saves 12
    1.1  mrg
    1.1  mrg     ;; Number of bits requested for the quotient.
    1.1  mrg     ;; This is usually 2 + F7_MANT_BITS.
    1.1  mrg     mov     QBits,  r20
    1.1  mrg     wmov    ZL,     r22
    1.1  mrg     LDD     A0,     Z+0+Off
    1.1  mrg     LDD     A1,     Z+1+Off
    1.1  mrg     LDD     A2,     Z+2+Off
    1.1  mrg     LDD     A3,     Z+3+Off
    1.1  mrg     LDD     A4,     Z+4+Off
    1.1  mrg     LDD     A5,     Z+5+Off
    1.1  mrg     LDD     A6,     Z+6+Off
    1.1  mrg     wmov    ZL,     r24
    1.1  mrg     F7call  load_mant
    1.1  mrg
    1.1  mrg     ;; Clear quotient Q[].
    1.1  mrg     clr     Q0      ; === TMP
    1.1  mrg     ;clr    Q1      ; === ZERO
    1.1  mrg     wmov    Q2,     Q0
    1.1  mrg     wmov    Q4,     Q0
    1.1  mrg     wmov    Q6,     Q0
    1.1  mrg
    1.1  mrg     ;; C[] and A[] are valid mantissae, i.e. their MSBit is set.  Therefore,
    1.1  mrg     ;; quotient Q[] will be in  [0x0.ff..., 0x0.40...]  and to adjust Q[] we
    1.1  mrg     ;; need at most 1 left-shift.  Compute F7_MANT_BITS + 2 bits of the
    1.1  mrg     ;; quotient:  One bit is used for rounding, and one bit might be consumed
    1.1  mrg     ;; by the mentioned left-shift.
    1.1  mrg     mov     Cnt,    QBits
    1.1  mrg     rjmp .Loop_start
    1.1  mrg
    1.1  mrg .Loop:
    1.1  mrg     ;; Shift dividend.
    1.1  mrg     LSL     C0
    1.1  mrg     rol     C1
    1.1  mrg     rol     C2
    1.1  mrg     rol     C3
    1.1  mrg     rol     C4
    1.1  mrg     rol     C5
    1.1  mrg     rol     C6
    1.1  mrg     brcs .Lfits
    1.1  mrg     ;; Compare dividend against divisor.
    1.1  mrg .Loop_start:
    1.1  mrg     CP      C0,     A0
    1.1  mrg     cpc     C1,     A1
    1.1  mrg     cpc     C2,     A2
    1.1  mrg     cpc     C3,     A3
    1.1  mrg     cpc     C4,     A4
    1.1  mrg     cpc     C5,     A5
    1.1  mrg     cpc     C6,     A6
    1.1  mrg     ;; Shift 0 into quotient.
    1.1  mrg     brlo 1f
    1.1  mrg .Lfits:
    1.1  mrg     ;; Divisor fits into dividend.
    1.1  mrg     SUB     C0,     A0
    1.1  mrg     sbc     C1,     A1
    1.1  mrg     sbc     C2,     A2
    1.1  mrg     sbc     C3,     A3
    1.1  mrg     sbc     C4,     A4
    1.1  mrg     sbc     C5,     A5
    1.1  mrg     sbc     C6,     A6
    1.1  mrg     ;; Shift 1 into quotient.
    1.1  mrg     sec
    1.1  mrg     rol     Q0
    1.1  mrg     skipnext
    1.1  mrg 1:  lsl     Q0
    1.1  mrg     rol     Q1
    1.1  mrg     rol     Q2
    1.1  mrg     rol     Q3
    1.1  mrg     rol     Q4
    1.1  mrg     rol     Q5
    1.1  mrg     rol     Q6
    1.1  mrg     rol     Q7
    1.1  mrg     dec     Cnt
    1.1  mrg     brne .Loop
    1.1  mrg
    1.1  mrg     wmov    CA,     Q0
    1.1  mrg     wmov    C1,     Q2
    1.1  mrg     wmov    C3,     Q4
    1.1  mrg     wmov    C5,     Q6
    1.1  mrg     clr     ZERO
    1.1  mrg
    1.1  mrg     ldi     Carry,  64
    1.1  mrg     sub     Carry,  QBits
    1.1  mrg     F7call  normalize.round.store_with_flags
    1.1  mrg
    1.1  mrg     do_epilogue_restores 12
    1.1  mrg ENDF div
    1.1  mrg
    1.1  mrg #endif /* F7MOD_div_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #if defined (F7MOD_sqrt16_) && defined (__AVR_HAVE_MUL__)
    1.1  mrg
    1.1  mrg #define     Mask    C6
    1.1  mrg #define     Q0      C3      /*  = R22  */
    1.1  mrg #define     Q1      C4      /*  = R23  */
    1.1  mrg
    1.1  mrg ;; uint16_t R24 = sqrt16_XXX (uint16_t R24);
    1.1  mrg ;; Clobbers:   R22, R23, TMP.
    1.1  mrg ;;
    1.1  mrg ;; XXX = floor:  Return integral part of square-root of R25:R24 with R25 = 0.
    1.1  mrg ;;               Error is in [0, -1 LSB).
    1.1  mrg ;; XXX = round:  Return quare-root of R25:R24 rounded to nearest integer.
    1.1  mrg ;;               R25 = (Q[] >= 65281) = (Q > 0xff00),  i.e. if Q[] is not
    1.1  mrg ;;               bigger than 0xff00, then the result fits in 8 bits.
    1.1  mrg ;;               Return C = 0 if the result is the same as for XXX = floor,
    1.1  mrg ;;               error in [0, -1/2 LSB)
    1.1  mrg ;;               Return C = 1 if the result is one higher than for XXX = floor,
    1.1  mrg ;;               error in [1/2 LSB, 0).
    1.1  mrg DEFUN sqrt16_round
    1.1  mrg     set
    1.1  mrg     skipnext
    1.1  mrg     ;; ...
    1.1  mrg LABEL sqrt16_floor
    1.1  mrg     clt ; Skipped?
    1.1  mrg     movw    Q0,     r24
    1.1  mrg     clr     C5
    1.1  mrg     ldi     Mask,   1 << 7
    1.1  mrg
    1.1  mrg .Loop_mask:
    1.1  mrg     add     C5,     Mask
    1.1  mrg     mul     C5,     C5
    1.1  mrg     cp      Q0,     R0
    1.1  mrg     cpc     Q1,     R1
    1.1  mrg     brsh 1f
    1.1  mrg     sub     C5,     Mask
    1.1  mrg 1:  lsr     Mask
    1.1  mrg     brne .Loop_mask
    1.1  mrg
    1.1  mrg     brtc .Ldone             ; No rounding  =>  C6 will be 0.
    1.1  mrg
    1.1  mrg     ;; Rounding:  (X + 1/2)^2  =  X^2 + X + 1/4,  thus probing
    1.1  mrg     ;; for bit -1 is testing Q[] against  C5^2 + C5.
    1.1  mrg     mul     C5,     C5
    1.1  mrg     add     R0,     C5
    1.1  mrg     adc     R1,     C6      ; Exploit C6 === Mask = 0.
    1.1  mrg     cp      R0,     Q0
    1.1  mrg     cpc     R1,     Q1
    1.1  mrg     brcc .Ldone
    1.1  mrg     ;; If  C5^2 + C5 + 1/4  fits into Q[], then round up and C = 1.
    1.1  mrg     adiw    C5,     1       ; Exploit C6 === Mask = 0.
    1.1  mrg     sec
    1.1  mrg
    1.1  mrg .Ldone:
    1.1  mrg     clr     __zero_reg__
    1.1  mrg     ret
    1.1  mrg ENDF sqrt16_round
    1.1  mrg #undef Mask
    1.1  mrg #undef Q0
    1.1  mrg #undef Q1
    1.1  mrg #endif /* F7MOD_sqrt16_ && MUL */
    1.1  mrg
    1.1  mrg #ifdef F7MOD_sqrt_approx_
    1.1  mrg DEFUN sqrt_approx
    1.1  mrg     push    r17
    1.1  mrg     push    r16
    1.1  mrg     wmov    XL,     r24
    1.1  mrg     wmov    ZL,     r22
    1.1  mrg
    1.1  mrg     ;; C[] = 0.
    1.1  mrg     .global __clr_8
    1.1  mrg     XCALL   __clr_8
    1.1  mrg
    1.1  mrg     ldd     C5,     Z+5+Off
    1.1  mrg     ldd     C6,     Z+6+Off
    1.1  mrg
    1.1  mrg     ldd     Carry,  Z+0+Expo
    1.1  mrg     ldd     TMP,    Z+1+Expo
    1.1  mrg     wmov    ZL,     XL
    1.1  mrg
    1.1  mrg     st      Z,      ZERO
    1.1  mrg
    1.1  mrg     asr     TMP
    1.1  mrg     ror     Carry
    1.1  mrg     std     Z+1+Expo,   TMP
    1.1  mrg     std     Z+0+Expo,   Carry
    1.1  mrg
    1.1  mrg     ;; Re-interpreting our Q-format 1.xx mantissa as Q2.yy, we have to shift
    1.1  mrg     ;; the mantissa to the right by 1.  As we need an even exponent, multiply
    1.1  mrg     ;; the mantissa by 2 for odd exponents, i.e. only right-shift if .expo
    1.1  mrg     ;; is even.
    1.1  mrg
    1.1  mrg     brcs 1f
    1.1  mrg     lsr     C6
    1.1  mrg     ror     C5
    1.1  mrg
    1.1  mrg 1:
    1.1  mrg     F7call  sqrt16_round
    1.1  mrg
    1.1  mrg     ;; sqrt16_round() returns:   C = 0:  error in [0, -1/2 LSB).
    1.1  mrg     ;;                           C = 1:  error in [1/2 LSB, 0)
    1.1  mrg
    1.1  mrg     brcc 2f
    1.1  mrg     ;; Undo the round-up from sqrt16_round(); this will transform to
    1.1  mrg     ;; error in [-1/2 LSB, -1 LSB).
    1.1  mrg     sbiw    C5,     1
    1.1  mrg     ;; Together with the correct bit C4.7, the error is in  [0, -1/2 LSB).
    1.1  mrg     ori     C4,     1 << 7
    1.1  mrg
    1.1  mrg 2:  ;; Setting C4.6 adds 1/4 LSB and the error is now in [1/4 LSB, -1/4 LSB)
    1.1  mrg     ;; in either case.
    1.1  mrg     ori     C4,     1 << 6
    1.1  mrg
    1.1  mrg     ;; ????????????
    1.1  mrg     ;; sqrt16_round() runs on integers which means that it computes the
    1.1  mrg     ;; square root of  mant * 2^14  if we regard  mant as Q-format 2.yy,
    1.1  mrg     ;; i.e. 2 integral bits.  The result is  sqrt(mant) * 2^7,
    1.1  mrg     ;; and in order to get the same scaling like the input, .expo has to
    1.1  mrg     ;; be adjusted by 7. ???????????????
    1.1  mrg
    1.1  mrg     ldi     Carry,  8
    1.1  mrg     F7call  normalize.store_with_flags
    1.1  mrg
    1.1  mrg     pop     r16
    1.1  mrg     pop     r17
    1.1  mrg     ret
    1.1  mrg
    1.1  mrg ENDF sqrt_approx
    1.1  mrg #endif /* F7MOD_sqrt_approx_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #undef CA
    1.1  mrg #undef C0
    1.1  mrg #undef C1
    1.1  mrg #undef C2
    1.1  mrg #undef C3
    1.1  mrg #undef C4
    1.1  mrg #undef C5
    1.1  mrg #undef C6
    1.1  mrg #undef Carry
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_D_fabs_
    1.1  mrg _DEFUN __fabs
    1.1  mrg     DALIAS fabs
    1.1  mrg     LALIAS fabsl
    1.1  mrg     andi    R25,    0b01111111
    1.1  mrg     ret
    1.1  mrg _ENDF __fabs
    1.1  mrg #endif /* F7MOD_D_fabs_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_D_neg_
    1.1  mrg _DEFUN __neg
    1.1  mrg _LABEL __negdf2
    1.1  mrg     subi    R25,    0b10000000
    1.1  mrg     ret
    1.1  mrg _ENDF __neg
    1.1  mrg #endif /* F7MOD_D_neg_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_D_signbit_
    1.1  mrg _DEFUN __signbit
    1.1  mrg     DALIAS signbit
    1.1  mrg     LALIAS signbitl
    1.1  mrg     bst     R25,    7
    1.1  mrg     clr     R25
    1.1  mrg     clr     R24
    1.1  mrg     bld     R24,    0
    1.1  mrg     ret
    1.1  mrg _ENDF __signbit
    1.1  mrg #endif /* F7MOD_D_signbit_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_D_copysign_
    1.1  mrg _DEFUN __copysign
    1.1  mrg     DALIAS copysign
    1.1  mrg     LALIAS copysignl
    1.1  mrg     bst     R17,    7
    1.1  mrg     bld     R25,    7
    1.1  mrg     ret
    1.1  mrg _ENDF __copysign
    1.1  mrg #endif /* F7MOD_D_copysign_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_D_isinf_
    1.1  mrg _DEFUN __isinf
    1.1  mrg     DALIAS isinf
    1.1  mrg     LALIAS isinfl
    1.1  mrg     F7call  class_D
    1.1  mrg     ;; Inf: T = Z = 1.
    1.1  mrg     brtc 0f
    1.1  mrg     ldi     R24,    1
    1.1  mrg     breq 1f
    1.1  mrg 0:
    1.1  mrg     clr     R24
    1.1  mrg 1:
    1.1  mrg     clr     R25
    1.1  mrg     ret
    1.1  mrg _ENDF __isinf
    1.1  mrg #endif /* F7MOD_D_isinf_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_D_isnan_
    1.1  mrg _DEFUN __isnan
    1.1  mrg     DALIAS isnan
    1.1  mrg     LALIAS isnanl
    1.1  mrg     F7call  class_D
    1.1  mrg     ;; NaN: T = 1, Z = 0.
    1.1  mrg     brtc 0f
    1.1  mrg     ldi     R24,    1
    1.1  mrg     brne 1f
    1.1  mrg 0:
    1.1  mrg     clr     R24
    1.1  mrg 1:
    1.1  mrg     clr     R25
    1.1  mrg     ret
    1.1  mrg _ENDF __isnan
    1.1  mrg #endif /* F7MOD_D_isnan_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_D_isfinite_
    1.1  mrg _DEFUN __isfinite
    1.1  mrg     DALIAS isfinite
    1.1  mrg     LALIAS isfinitel
    1.1  mrg     F7call  class_D
    1.1  mrg     ;; Number <=> T = 0.
    1.1  mrg     bld     R24,    0
    1.1  mrg     com     R24
    1.1  mrg     andi    R24,    1
    1.1  mrg     clr     R25
    1.1  mrg     ret
    1.1  mrg _ENDF __isfinite
    1.1  mrg #endif /* F7MOD_D_isfinite_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_D_class_
    1.1  mrg ;; The encoded exponent has 11 Bits.
    1.1  mrg #define MAX_BIASED_EXPO 0b0111111111110000
    1.1  mrg
    1.1  mrg ;; Classify a double in R18[]
    1.1  mrg ;; Number: T-Flag = 0.
    1.1  mrg ;; +-Inf : T-Flag = 1, Z-Flag = 1.
    1.1  mrg ;; NaN   : T-Flag = 1, Z-Flag = 0.
    1.1  mrg DEFUN class_D
    1.1  mrg     wmov    R26,    R24
    1.1  mrg     andi    R26,    lo8 (MAX_BIASED_EXPO)
    1.1  mrg     andi    R27,    hi8 (MAX_BIASED_EXPO)
    1.1  mrg     subi    R26,    lo8 (MAX_BIASED_EXPO)
    1.1  mrg     sbci    R27,    hi8 (MAX_BIASED_EXPO)
    1.1  mrg     clt
    1.1  mrg     brne .L.number
    1.1  mrg     set
    1.1  mrg     ;; Set sign and expo to 0.
    1.1  mrg     clr     R25
    1.1  mrg     andi    R24,    lo8 (~MAX_BIASED_EXPO)
    1.1  mrg     ;; What remains is the mantissa.
    1.1  mrg     ;; Mantissa == 0  =>  +/-Inf.
    1.1  mrg     ;; Mantissa != 0  =>  NaN.
    1.1  mrg     ;; Compare R18[] against sign_extend(R26) with R26 = 0.
    1.1  mrg     .global __cmpdi2_s8
    1.1  mrg     XJMP    __cmpdi2_s8
    1.1  mrg .L.number:
    1.1  mrg     ret
    1.1  mrg
    1.1  mrg ENDF class_D
    1.1  mrg #endif /* F7MOD_D_class_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_call_dd_
    1.1  mrg
    1.1  mrg ;; Provide double wrappers for functions that operate on f7_t and get f7_t*.
    1.1  mrg ;;
    1.1  mrg ;; We set up a frame of sizeof(f7_t), convert the input double in R18[] to
    1.1  mrg ;; f7_t in that frame location, then call *Z and finally convert the result f7_t
    1.1  mrg ;; to double R18[] if that's requested.
    1.1  mrg ;;
    1.1  mrg ;; call_dd:     double func (double A)
    1.1  mrg ;;              void (*Z) (f7_t *aa, const f7_t *aa)
    1.1  mrg ;;
    1.1  mrg ;; call_dx:     double func (type_t A)  , sizeof(type_t) <= 4
    1.1  mrg ;;              void (*Z) (f7_t *aa, type_t)
    1.1  mrg ;;
    1.1  mrg ;; call_xd:     type_t func (double A)
    1.1  mrg ;;              type_t (*Z) (const f7_t *aa)
    1.1  mrg ;;
    1.1  mrg ;; call_ddx:    double func (double A, word_t)  , sizeof (word_t) <= 2
    1.1  mrg ;;              void (*Z) (f7_t *aa, const f7_t *aa, word_t)
    1.1  mrg
    1.1  mrg #define WHAT    R13
    1.1  mrg
    1.1  mrg DEFUN call_dd   ; WHAT = R13 = 3
    1.1  mrg     inc     ZERO
    1.1  mrg LABEL call_xd   ; WHAT = R13 = 2
    1.1  mrg     inc     ZERO
    1.1  mrg LABEL call_ddx  ; WHAT = R13 = 1
    1.1  mrg     inc     ZERO
    1.1  mrg LABEL call_dx   ; WHAT = R13 = 0
    1.1  mrg     push    WHAT
    1.1  mrg     mov     WHAT,   ZERO
    1.1  mrg     clr     ZERO
    1.1  mrg     ;; R14/R15 hold Z, the address of the f7_worker function, until we need it.
    1.1  mrg     push    r14
    1.1  mrg     push    r15
    1.1  mrg     wmov    r14,     Z
    1.1  mrg
    1.1  mrg #define n_pushed    4
    1.1  mrg #define n_frame     10
    1.1  mrg
    1.1  mrg     do_prologue_saves n_pushed, n_frame
    1.1  mrg     ;; Y = FramePointer + 1
    1.1  mrg     adiw    Y,      1
    1.1  mrg     dec     WHAT
    1.1  mrg     brmi .Ldx                   ; WHAT was initially 0.
    1.1  mrg     ;; FP + 1 = (f7_t) arg1
    1.1  mrg     wmov    r16,    Y
    1.1  mrg     ;; The double argument is in R18[].
    1.1  mrg     XCALL   F7_NAME (set_double_impl)
    1.1  mrg     tst     WHAT
    1.1  mrg     brne .Lno.ddx               ; WHAT was initially != 1.
    1.1  mrg     ;; call_ddx: Set R20/21 to the 2-byte scalar / pointer argument.
    1.1  mrg     ;; Fetch it from where prologue_saves put it.
    1.1  mrg     ldd     r20,    Y + n_frame + 3     ; Saved R16
    1.1  mrg     ldd     r21,    Y + n_frame + 2     ; Saved R17
    1.1  mrg .Lno.ddx:
    1.1  mrg     wmov    r22,    Y           ; &arg1 (input)
    1.1  mrg .Ldo.dx:
    1.1  mrg     wmov    r24,    Y           ; &arg1 (output)
    1.1  mrg     wmov    Z,      r14
    1.1  mrg     XICALL
    1.1  mrg     dec     WHAT
    1.1  mrg     breq .Lepilogue             ; WHAT was initially 2: Return non-double.
    1.1  mrg     wmov    r24,    Y           ; &arg1
    1.1  mrg     XCALL   F7_NAME (get_double)
    1.1  mrg .Lepilogue:
    1.1  mrg     ;; + 3 to account for R13...R15 pushed prior to do_prologue_saves.
    1.1  mrg     do_epilogue_restores n_pushed + 3, n_frame
    1.1  mrg
    1.1  mrg .Ldx:
    1.1  mrg     ;; call_dx: Copy the 4-byte input scalar from R22[4] to R20[4].
    1.1  mrg     wmov    r20,    r22
    1.1  mrg     wmov    r22,    r24
    1.1  mrg     rjmp .Ldo.dx
    1.1  mrg
    1.1  mrg ENDF call_dd
    1.1  mrg #endif /* F7MOD_call_dd_ */
    1.1  mrg
    1.1  mrg
    1.1  mrg #ifdef F7MOD_call_ddd_
    1.1  mrg
    1.1  mrg ;; Provide double wrappers for functions that operate on f7_t and get f7_t*.
    1.1  mrg ;;
    1.1  mrg ;; We set up a frame of 2 * sizeof(f7_t), convert the input doubles in R18[]
    1.1  mrg ;; and R10[] to f7_t in these frame locations, then call *Z and finally
    1.1  mrg ;; convert the result f7_t to double R18[] if that's requested.
    1.1  mrg ;;
    1.1  mrg ;; call_ddd:    double func (double A, double B)
    1.1  mrg ;;              void (*Z) (f7_t *aa, const f7_t *aa, const f7_t *bb)
    1.1  mrg ;;
    1.1  mrg ;; call_xdd:    type_t func (double A, double B)
    1.1  mrg ;;              type_t (*Z) (const f7_t *aa, const f7_t *bb)
    1.1  mrg
    1.1  mrg DEFUN call_ddd
    1.1  mrg     inc     ZERO
    1.1  mrg LABEL call_xdd
    1.1  mrg     ;; R8/R9 hold Z, the address of the f7_worker function, until we need it.
    1.1  mrg     push    r9
    1.1  mrg     push    r8
    1.1  mrg     wmov    r8,     Z
    1.1  mrg     ;; This is an argument to call.2 and will be accessed by the arg pointer.
    1.1  mrg     push    ZERO
    1.1  mrg     clr     ZERO
    1.1  mrg     rcall   call.2
    1.1  mrg     pop     TMP
    1.1  mrg     pop     r8
    1.1  mrg     pop     r9
    1.1  mrg     ret
    1.1  mrg
    1.1  mrg #define n_pushed    4
    1.1  mrg #define n_frame     20
    1.1  mrg
    1.1  mrg call.2:
    1.1  mrg     do_prologue_saves n_pushed, n_frame
    1.1  mrg     ;; Y = FramePointer + 1
    1.1  mrg     adiw    Y,      1
    1.1  mrg     ;; FP + 1 = (f7_t) arg1
    1.1  mrg     wmov    r16,    Y
    1.1  mrg     ;; First double argument is already in R18[].
    1.1  mrg     XCALL   F7_NAME (set_double_impl)
    1.1  mrg     ;; FP + 11 = (f7_t) arg2
    1.1  mrg     wmov    r16,    Y
    1.1  mrg     subi    r16,    lo8 (-10)
    1.1  mrg     sbci    r17,    hi8 (-10)
    1.1  mrg     ;; Move second double argument to R18[].
    1.1  mrg     wmov    r18,    r10
    1.1  mrg     wmov    r20,    r12
    1.1  mrg     wmov    r22,    r14
    1.1  mrg     ;; Get high word of arg2 from where prologue_saves put it.
    1.1  mrg     ldd     r24,    Y + n_frame + 3     ; Saved R16
    1.1  mrg     ldd     r25,    Y + n_frame + 2     ; Saved R17
    1.1  mrg     XCALL   F7_NAME (set_double_impl)
    1.1  mrg     ;; Z (f7_t *arg1, const f7_t *arg1, const f7_t *arg2)
    1.1  mrg     wmov    Z,      r8
    1.1  mrg     wmov    r24,    Y                   ; &arg1
    1.1  mrg     ;; WHAT == 0  =>  call_xdd
    1.1  mrg     ;; WHAT != 0  =>  call_ddd
    1.1  mrg     ldd     TMP,    Y + n_frame + n_pushed + PC_SIZE
    1.1  mrg     tst     TMP
    1.1  mrg     breq .Lxdd
    1.1  mrg     wmov    r22,    Y                   ; &arg1
    1.1  mrg     wmov    r20,    r16                 ; &arg2
    1.1  mrg     XICALL
    1.1  mrg     wmov    r24,    Y                   ; &arg1
    1.1  mrg     XCALL   F7_NAME (get_double)
    1.1  mrg .Lepilogue:
    1.1  mrg     do_epilogue_restores n_pushed, n_frame
    1.1  mrg .Lxdd:
    1.1  mrg     wmov    r22,    r16                 ; &arg2
    1.1  mrg     XICALL
    1.1  mrg     rjmp .Lepilogue
    1.1  mrg ENDF call_ddd
    1.1  mrg #endif /* F7MOD_call_ddd_ */
    1.1  mrg
    1.1  mrg #include "f7-wraps.h"
    1.1  mrg
    1.1  mrg #endif /* !AVR_TINY */