config/avr/lib1funcs.S

1.1  mrg /*  -*- Mode: Asm -*-  */
1.1  mrg /* Copyright (C) 1998-2013 Free Software Foundation, Inc.
1.1  mrg    Contributed by Denis Chertykov <chertykov (at) gmail.com>
1.1  mrg
1.1  mrg This file is free software; you can redistribute it and/or modify it
1.1  mrg under the terms of the GNU General Public License as published by the
1.1  mrg Free Software Foundation; either version 3, or (at your option) any
1.1  mrg later version.
1.1  mrg
1.1  mrg This file is distributed in the hope that it will be useful, but
1.1  mrg WITHOUT ANY WARRANTY; without even the implied warranty of
1.1  mrg MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
1.1  mrg General Public License for more details.
1.1  mrg
1.1  mrg Under Section 7 of GPL version 3, you are granted additional
1.1  mrg permissions described in the GCC Runtime Library Exception, version
1.1  mrg 3.1, as published by the Free Software Foundation.
1.1  mrg
1.1  mrg You should have received a copy of the GNU General Public License and
1.1  mrg a copy of the GCC Runtime Library Exception along with this program;
1.1  mrg see the files COPYING3 and COPYING.RUNTIME respectively.  If not, see
1.1  mrg <http://www.gnu.org/licenses/>.  */
1.1  mrg
1.1  mrg #define __zero_reg__ r1
1.1  mrg #define __tmp_reg__ r0
1.1  mrg #define __SREG__ 0x3f
1.1  mrg #if defined (__AVR_HAVE_SPH__)
1.1  mrg #define __SP_H__ 0x3e
1.1  mrg #endif
1.1  mrg #define __SP_L__ 0x3d
1.1  mrg #define __RAMPZ__ 0x3B
1.1  mrg #define __EIND__  0x3C
1.1  mrg
1.1  mrg /* Most of the functions here are called directly from avr.md
1.1  mrg    patterns, instead of using the standard libcall mechanisms.
1.1  mrg    This can make better code because GCC knows exactly which
1.1  mrg    of the call-used registers (not all of them) are clobbered.  */
1.1  mrg
1.1  mrg /* FIXME:  At present, there is no SORT directive in the linker
1.1  mrg            script so that we must not assume that different modules
1.1  mrg            in the same input section like .libgcc.text.mul will be
1.1  mrg            located close together.  Therefore, we cannot use
1.1  mrg            RCALL/RJMP to call a function like __udivmodhi4 from
1.1  mrg            __divmodhi4 and have to use lengthy XCALL/XJMP even
1.1  mrg            though they are in the same input section and all same
1.1  mrg            input sections together are small enough to reach every
1.1  mrg            location with a RCALL/RJMP instruction.  */
1.1  mrg
1.1  mrg 	.macro	mov_l  r_dest, r_src
1.1  mrg #if defined (__AVR_HAVE_MOVW__)
1.1  mrg 	movw	\r_dest, \r_src
1.1  mrg #else
1.1  mrg 	mov	\r_dest, \r_src
1.1  mrg #endif
1.1  mrg 	.endm
1.1  mrg
1.1  mrg 	.macro	mov_h  r_dest, r_src
1.1  mrg #if defined (__AVR_HAVE_MOVW__)
1.1  mrg 	; empty
1.1  mrg #else
1.1  mrg 	mov	\r_dest, \r_src
1.1  mrg #endif
1.1  mrg 	.endm
1.1  mrg
1.1  mrg .macro	wmov  r_dest, r_src
1.1  mrg #if defined (__AVR_HAVE_MOVW__)
1.1  mrg     movw \r_dest,   \r_src
1.1  mrg #else
1.1  mrg     mov \r_dest,    \r_src
1.1  mrg     mov \r_dest+1,  \r_src+1
1.1  mrg #endif
1.1  mrg .endm
1.1  mrg
1.1  mrg #if defined (__AVR_HAVE_JMP_CALL__)
1.1  mrg #define XCALL call
1.1  mrg #define XJMP  jmp
1.1  mrg #else
1.1  mrg #define XCALL rcall
1.1  mrg #define XJMP  rjmp
1.1  mrg #endif
1.1  mrg
1.1  mrg ;; Prologue stuff
1.1  mrg
1.1  mrg .macro do_prologue_saves n_pushed n_frame=0
1.1  mrg     ldi r26, lo8(\n_frame)
1.1  mrg     ldi r27, hi8(\n_frame)
1.1  mrg     ldi r30, lo8(gs(.L_prologue_saves.\@))
1.1  mrg     ldi r31, hi8(gs(.L_prologue_saves.\@))
1.1  mrg     XJMP __prologue_saves__ + ((18 - (\n_pushed)) * 2)
1.1  mrg .L_prologue_saves.\@:
1.1  mrg .endm
1.1  mrg
1.1  mrg ;; Epilogue stuff
1.1  mrg
1.1  mrg .macro do_epilogue_restores n_pushed n_frame=0
1.1  mrg     in      r28, __SP_L__
1.1  mrg #ifdef __AVR_HAVE_SPH__
1.1  mrg     in      r29, __SP_H__
1.1  mrg .if \n_frame > 63
1.1  mrg     subi    r28, lo8(-\n_frame)
1.1  mrg     sbci    r29, hi8(-\n_frame)
1.1  mrg .elseif \n_frame > 0
1.1  mrg     adiw    r28, \n_frame
1.1  mrg .endif
1.1  mrg #else
1.1  mrg     clr     r29
1.1  mrg .if \n_frame > 0
1.1  mrg     subi    r28, lo8(-\n_frame)
1.1  mrg .endif
1.1  mrg #endif /* HAVE SPH */
1.1  mrg     ldi     r30, \n_pushed
1.1  mrg     XJMP __epilogue_restores__ + ((18 - (\n_pushed)) * 2)
1.1  mrg .endm
1.1  mrg
1.1  mrg ;; Support function entry and exit for convenience
1.1  mrg
1.1  mrg .macro DEFUN name
1.1  mrg .global \name
1.1  mrg .func \name
1.1  mrg \name:
1.1  mrg .endm
1.1  mrg
1.1  mrg .macro ENDF name
1.1  mrg .size \name, .-\name
1.1  mrg .endfunc
1.1  mrg .endm
1.1  mrg
1.1  mrg .macro FALIAS name
1.1  mrg .global \name
1.1  mrg .func \name
1.1  mrg \name:
1.1  mrg .size \name, .-\name
1.1  mrg .endfunc
1.1  mrg .endm
1.1  mrg
1.1  mrg ;; Skip next instruction, typically a jump target
1.1  mrg #define skip cpse 0,0
1.1  mrg
1.1  mrg ;; Negate a 2-byte value held in consecutive registers
1.1  mrg .macro NEG2  reg
1.1  mrg     com     \reg+1
1.1  mrg     neg     \reg
1.1  mrg     sbci    \reg+1, -1
1.1  mrg .endm
1.1  mrg
1.1  mrg ;; Negate a 4-byte value held in consecutive registers
1.1  mrg ;; Sets the V flag for signed overflow tests if REG >= 16
1.1  mrg .macro NEG4  reg
1.1  mrg     com     \reg+3
1.1  mrg     com     \reg+2
1.1  mrg     com     \reg+1
1.1  mrg .if \reg >= 16
1.1  mrg     neg     \reg
1.1  mrg     sbci    \reg+1, -1
1.1  mrg     sbci    \reg+2, -1
1.1  mrg     sbci    \reg+3, -1
1.1  mrg .else
1.1  mrg     com     \reg
1.1  mrg     adc     \reg,   __zero_reg__
1.1  mrg     adc     \reg+1, __zero_reg__
1.1  mrg     adc     \reg+2, __zero_reg__
1.1  mrg     adc     \reg+3, __zero_reg__
1.1  mrg .endif
1.1  mrg .endm
1.1  mrg
1.1  mrg #define exp_lo(N)  hlo8 ((N) << 23)
1.1  mrg #define exp_hi(N)  hhi8 ((N) << 23)
1.1  mrg
1.1  mrg
1.1  mrg .section .text.libgcc.mul, "ax", @progbits
1.1  mrg
1.1  mrg ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
1.1  mrg /* Note: mulqi3, mulhi3 are open-coded on the enhanced core.  */
1.1  mrg #if !defined (__AVR_HAVE_MUL__)
1.1  mrg /*******************************************************
1.1  mrg     Multiplication  8 x 8  without MUL
1.1  mrg *******************************************************/
1.1  mrg #if defined (L_mulqi3)
1.1  mrg
1.1  mrg #define	r_arg2	r22		/* multiplicand */
1.1  mrg #define	r_arg1 	r24		/* multiplier */
1.1  mrg #define r_res	__tmp_reg__	/* result */
1.1  mrg
1.1  mrg DEFUN __mulqi3
1.1  mrg 	clr	r_res		; clear result
1.1  mrg __mulqi3_loop:
1.1  mrg 	sbrc	r_arg1,0
1.1  mrg 	add	r_res,r_arg2
1.1  mrg 	add	r_arg2,r_arg2	; shift multiplicand
1.1  mrg 	breq	__mulqi3_exit	; while multiplicand != 0
1.1  mrg 	lsr	r_arg1		;
1.1  mrg 	brne	__mulqi3_loop	; exit if multiplier = 0
1.1  mrg __mulqi3_exit:
1.1  mrg 	mov	r_arg1,r_res	; result to return register
1.1  mrg 	ret
1.1  mrg ENDF __mulqi3
1.1  mrg
1.1  mrg #undef r_arg2
1.1  mrg #undef r_arg1
1.1  mrg #undef r_res
1.1  mrg
1.1  mrg #endif 	/* defined (L_mulqi3) */
1.1  mrg
1.1  mrg
1.1  mrg /*******************************************************
1.1  mrg     Widening Multiplication  16 = 8 x 8  without MUL
1.1  mrg     Multiplication  16 x 16  without MUL
1.1  mrg *******************************************************/
1.1  mrg
1.1  mrg #define A0  r22
1.1  mrg #define A1  r23
1.1  mrg #define B0  r24
1.1  mrg #define BB0 r20
1.1  mrg #define B1  r25
1.1  mrg ;; Output overlaps input, thus expand result in CC0/1
1.1  mrg #define C0  r24
1.1  mrg #define C1  r25
1.1  mrg #define CC0  __tmp_reg__
1.1  mrg #define CC1  R21
1.1  mrg
1.1  mrg #if defined (L_umulqihi3)
1.1  mrg ;;; R25:R24 = (unsigned int) R22 * (unsigned int) R24
1.1  mrg ;;; (C1:C0) = (unsigned int) A0  * (unsigned int) B0
1.1  mrg ;;; Clobbers: __tmp_reg__, R21..R23
1.1  mrg DEFUN __umulqihi3
1.1  mrg     clr     A1
1.1  mrg     clr     B1
1.1  mrg     XJMP    __mulhi3
1.1  mrg ENDF __umulqihi3
1.1  mrg #endif /* L_umulqihi3 */
1.1  mrg
1.1  mrg #if defined (L_mulqihi3)
1.1  mrg ;;; R25:R24 = (signed int) R22 * (signed int) R24
1.1  mrg ;;; (C1:C0) = (signed int) A0  * (signed int) B0
1.1  mrg ;;; Clobbers: __tmp_reg__, R20..R23
1.1  mrg DEFUN __mulqihi3
1.1  mrg     ;; Sign-extend B0
1.1  mrg     clr     B1
1.1  mrg     sbrc    B0, 7
1.1  mrg     com     B1
1.1  mrg     ;; The multiplication runs twice as fast if A1 is zero, thus:
1.1  mrg     ;; Zero-extend A0
1.1  mrg     clr     A1
1.1  mrg #ifdef __AVR_HAVE_JMP_CALL__
1.1  mrg     ;; Store  B0 * sign of A
1.1  mrg     clr     BB0
1.1  mrg     sbrc    A0, 7
1.1  mrg     mov     BB0, B0
1.1  mrg     call    __mulhi3
1.1  mrg #else /* have no CALL */
1.1  mrg     ;; Skip sign-extension of A if A >= 0
1.1  mrg     ;; Same size as with the first alternative but avoids errata skip
1.1  mrg     ;; and is faster if A >= 0
1.1  mrg     sbrs    A0, 7
1.1  mrg     rjmp    __mulhi3
1.1  mrg     ;; If  A < 0  store B
1.1  mrg     mov     BB0, B0
1.1  mrg     rcall   __mulhi3
1.1  mrg #endif /* HAVE_JMP_CALL */
1.1  mrg     ;; 1-extend A after the multiplication
1.1  mrg     sub     C1, BB0
1.1  mrg     ret
1.1  mrg ENDF __mulqihi3
1.1  mrg #endif /* L_mulqihi3 */
1.1  mrg
1.1  mrg #if defined (L_mulhi3)
1.1  mrg ;;; R25:R24 = R23:R22 * R25:R24
1.1  mrg ;;; (C1:C0) = (A1:A0) * (B1:B0)
1.1  mrg ;;; Clobbers: __tmp_reg__, R21..R23
1.1  mrg DEFUN __mulhi3
1.1  mrg
1.1  mrg     ;; Clear result
1.1  mrg     clr     CC0
1.1  mrg     clr     CC1
1.1  mrg     rjmp 3f
1.1  mrg 1:
1.1  mrg     ;; Bit n of A is 1  -->  C += B << n
1.1  mrg     add     CC0, B0
1.1  mrg     adc     CC1, B1
1.1  mrg 2:
1.1  mrg     lsl     B0
1.1  mrg     rol     B1
1.1  mrg 3:
1.1  mrg     ;; If B == 0 we are ready
1.1  mrg     sbiw    B0, 0
1.1  mrg     breq 9f
1.1  mrg
1.1  mrg     ;; Carry = n-th bit of A
1.1  mrg     lsr     A1
1.1  mrg     ror     A0
1.1  mrg     ;; If bit n of A is set, then go add  B * 2^n  to  C
1.1  mrg     brcs 1b
1.1  mrg
1.1  mrg     ;; Carry = 0  -->  The ROR above acts like  CP A0, 0
1.1  mrg     ;; Thus, it is sufficient to CPC the high part to test A against 0
1.1  mrg     cpc     A1, __zero_reg__
1.1  mrg     ;; Only proceed if A != 0
1.1  mrg     brne    2b
1.1  mrg 9:
1.1  mrg     ;; Move Result into place
1.1  mrg     mov     C0, CC0
1.1  mrg     mov     C1, CC1
1.1  mrg     ret
1.1  mrg ENDF  __mulhi3
1.1  mrg #endif /* L_mulhi3 */
1.1  mrg
1.1  mrg #undef A0
1.1  mrg #undef A1
1.1  mrg #undef B0
1.1  mrg #undef BB0
1.1  mrg #undef B1
1.1  mrg #undef C0
1.1  mrg #undef C1
1.1  mrg #undef CC0
1.1  mrg #undef CC1
1.1  mrg
1.1  mrg
1.1  mrg #define A0 22
1.1  mrg #define A1 A0+1
1.1  mrg #define A2 A0+2
1.1  mrg #define A3 A0+3
1.1  mrg
1.1  mrg #define B0 18
1.1  mrg #define B1 B0+1
1.1  mrg #define B2 B0+2
1.1  mrg #define B3 B0+3
1.1  mrg
1.1  mrg #define CC0 26
1.1  mrg #define CC1 CC0+1
1.1  mrg #define CC2 30
1.1  mrg #define CC3 CC2+1
1.1  mrg
1.1  mrg #define C0 22
1.1  mrg #define C1 C0+1
1.1  mrg #define C2 C0+2
1.1  mrg #define C3 C0+3
1.1  mrg
1.1  mrg /*******************************************************
1.1  mrg     Widening Multiplication  32 = 16 x 16  without MUL
1.1  mrg *******************************************************/
1.1  mrg
1.1  mrg #if defined (L_umulhisi3)
1.1  mrg DEFUN __umulhisi3
1.1  mrg     wmov    B0, 24
1.1  mrg     ;; Zero-extend B
1.1  mrg     clr     B2
1.1  mrg     clr     B3
1.1  mrg     ;; Zero-extend A
1.1  mrg     wmov    A2, B2
1.1  mrg     XJMP    __mulsi3
1.1  mrg ENDF __umulhisi3
1.1  mrg #endif /* L_umulhisi3 */
1.1  mrg
1.1  mrg #if defined (L_mulhisi3)
1.1  mrg DEFUN __mulhisi3
1.1  mrg     wmov    B0, 24
1.1  mrg     ;; Sign-extend B
1.1  mrg     lsl     r25
1.1  mrg     sbc     B2, B2
1.1  mrg     mov     B3, B2
1.1  mrg #ifdef __AVR_ERRATA_SKIP_JMP_CALL__
1.1  mrg     ;; Sign-extend A
1.1  mrg     clr     A2
1.1  mrg     sbrc    A1, 7
1.1  mrg     com     A2
1.1  mrg     mov     A3, A2
1.1  mrg     XJMP __mulsi3
1.1  mrg #else /*  no __AVR_ERRATA_SKIP_JMP_CALL__ */
1.1  mrg     ;; Zero-extend A and __mulsi3 will run at least twice as fast
1.1  mrg     ;; compared to a sign-extended A.
1.1  mrg     clr     A2
1.1  mrg     clr     A3
1.1  mrg     sbrs    A1, 7
1.1  mrg     XJMP __mulsi3
1.1  mrg     ;; If  A < 0  then perform the  B * 0xffff.... before the
1.1  mrg     ;; very multiplication by initializing the high part of the
1.1  mrg     ;; result CC with -B.
1.1  mrg     wmov    CC2, A2
1.1  mrg     sub     CC2, B0
1.1  mrg     sbc     CC3, B1
1.1  mrg     XJMP __mulsi3_helper
1.1  mrg #endif /*  __AVR_ERRATA_SKIP_JMP_CALL__ */
1.1  mrg ENDF __mulhisi3
1.1  mrg #endif /* L_mulhisi3 */
1.1  mrg
1.1  mrg
1.1  mrg /*******************************************************
1.1  mrg     Multiplication  32 x 32  without MUL
1.1  mrg *******************************************************/
1.1  mrg
1.1  mrg #if defined (L_mulsi3)
1.1  mrg DEFUN __mulsi3
1.1  mrg     ;; Clear result
1.1  mrg     clr     CC2
1.1  mrg     clr     CC3
1.1  mrg     ;; FALLTHRU
1.1  mrg ENDF  __mulsi3
1.1  mrg
1.1  mrg DEFUN __mulsi3_helper
1.1  mrg     clr     CC0
1.1  mrg     clr     CC1
1.1  mrg     rjmp 3f
1.1  mrg
1.1  mrg 1:  ;; If bit n of A is set, then add  B * 2^n  to the result in CC
1.1  mrg     ;; CC += B
1.1  mrg     add  CC0,B0  $  adc  CC1,B1  $  adc  CC2,B2  $  adc  CC3,B3
1.1  mrg
1.1  mrg 2:  ;; B <<= 1
1.1  mrg     lsl  B0      $  rol  B1      $  rol  B2      $  rol  B3
1.1  mrg
1.1  mrg 3:  ;; A >>= 1:  Carry = n-th bit of A
1.1  mrg     lsr  A3      $  ror  A2      $  ror  A1      $  ror  A0
1.1  mrg
1.1  mrg     brcs 1b
1.1  mrg     ;; Only continue if  A != 0
1.1  mrg     sbci    A1, 0
1.1  mrg     brne 2b
1.1  mrg     sbiw    A2, 0
1.1  mrg     brne 2b
1.1  mrg
1.1  mrg     ;; All bits of A are consumed:  Copy result to return register C
1.1  mrg     wmov    C0, CC0
1.1  mrg     wmov    C2, CC2
1.1  mrg     ret
1.1  mrg ENDF __mulsi3_helper
1.1  mrg #endif /* L_mulsi3 */
1.1  mrg
1.1  mrg #undef A0
1.1  mrg #undef A1
1.1  mrg #undef A2
1.1  mrg #undef A3
1.1  mrg #undef B0
1.1  mrg #undef B1
1.1  mrg #undef B2
1.1  mrg #undef B3
1.1  mrg #undef C0
1.1  mrg #undef C1
1.1  mrg #undef C2
1.1  mrg #undef C3
1.1  mrg #undef CC0
1.1  mrg #undef CC1
1.1  mrg #undef CC2
1.1  mrg #undef CC3
1.1  mrg
1.1  mrg #endif /* !defined (__AVR_HAVE_MUL__) */
1.1  mrg ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
1.1  mrg
1.1  mrg ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
1.1  mrg #if defined (__AVR_HAVE_MUL__)
1.1  mrg #define A0 26
1.1  mrg #define B0 18
1.1  mrg #define C0 22
1.1  mrg
1.1  mrg #define A1 A0+1
1.1  mrg
1.1  mrg #define B1 B0+1
1.1  mrg #define B2 B0+2
1.1  mrg #define B3 B0+3
1.1  mrg
1.1  mrg #define C1 C0+1
1.1  mrg #define C2 C0+2
1.1  mrg #define C3 C0+3
1.1  mrg
1.1  mrg /*******************************************************
1.1  mrg     Widening Multiplication  32 = 16 x 16  with MUL
1.1  mrg *******************************************************/
1.1  mrg
1.1  mrg #if defined (L_mulhisi3)
1.1  mrg ;;; R25:R22 = (signed long) R27:R26 * (signed long) R19:R18
1.1  mrg ;;; C3:C0   = (signed long) A1:A0   * (signed long) B1:B0
1.1  mrg ;;; Clobbers: __tmp_reg__
1.1  mrg DEFUN __mulhisi3
1.1  mrg     XCALL   __umulhisi3
1.1  mrg     ;; Sign-extend B
1.1  mrg     tst     B1
1.1  mrg     brpl    1f
1.1  mrg     sub     C2, A0
1.1  mrg     sbc     C3, A1
1.1  mrg 1:  ;; Sign-extend A
1.1  mrg     XJMP __usmulhisi3_tail
1.1  mrg ENDF __mulhisi3
1.1  mrg #endif /* L_mulhisi3 */
1.1  mrg
1.1  mrg #if defined (L_usmulhisi3)
1.1  mrg ;;; R25:R22 = (signed long) R27:R26 * (unsigned long) R19:R18
1.1  mrg ;;; C3:C0   = (signed long) A1:A0   * (unsigned long) B1:B0
1.1  mrg ;;; Clobbers: __tmp_reg__
1.1  mrg DEFUN __usmulhisi3
1.1  mrg     XCALL   __umulhisi3
1.1  mrg     ;; FALLTHRU
1.1  mrg ENDF __usmulhisi3
1.1  mrg
1.1  mrg DEFUN __usmulhisi3_tail
1.1  mrg     ;; Sign-extend A
1.1  mrg     sbrs    A1, 7
1.1  mrg     ret
1.1  mrg     sub     C2, B0
1.1  mrg     sbc     C3, B1
1.1  mrg     ret
1.1  mrg ENDF __usmulhisi3_tail
1.1  mrg #endif /* L_usmulhisi3 */
1.1  mrg
1.1  mrg #if defined (L_umulhisi3)
1.1  mrg ;;; R25:R22 = (unsigned long) R27:R26 * (unsigned long) R19:R18
1.1  mrg ;;; C3:C0   = (unsigned long) A1:A0   * (unsigned long) B1:B0
1.1  mrg ;;; Clobbers: __tmp_reg__
1.1  mrg DEFUN __umulhisi3
1.1  mrg     mul     A0, B0
1.1  mrg     movw    C0, r0
1.1  mrg     mul     A1, B1
1.1  mrg     movw    C2, r0
1.1  mrg     mul     A0, B1
1.1  mrg #ifdef __AVR_HAVE_JMP_CALL__
1.1  mrg     ;; This function is used by many other routines, often multiple times.
1.1  mrg     ;; Therefore, if the flash size is not too limited, avoid the RCALL
1.1  mrg     ;; and inverst 6 Bytes to speed things up.
1.1  mrg     add     C1, r0
1.1  mrg     adc     C2, r1
1.1  mrg     clr     __zero_reg__
1.1  mrg     adc     C3, __zero_reg__
1.1  mrg #else
1.1  mrg     rcall   1f
1.1  mrg #endif
1.1  mrg     mul     A1, B0
1.1  mrg 1:  add     C1, r0
1.1  mrg     adc     C2, r1
1.1  mrg     clr     __zero_reg__
1.1  mrg     adc     C3, __zero_reg__
1.1  mrg     ret
1.1  mrg ENDF __umulhisi3
1.1  mrg #endif /* L_umulhisi3 */
1.1  mrg
1.1  mrg /*******************************************************
1.1  mrg     Widening Multiplication  32 = 16 x 32  with MUL
1.1  mrg *******************************************************/
1.1  mrg
1.1  mrg #if defined (L_mulshisi3)
1.1  mrg ;;; R25:R22 = (signed long) R27:R26 * R21:R18
1.1  mrg ;;; (C3:C0) = (signed long) A1:A0   * B3:B0
1.1  mrg ;;; Clobbers: __tmp_reg__
1.1  mrg DEFUN __mulshisi3
1.1  mrg #ifdef __AVR_ERRATA_SKIP_JMP_CALL__
1.1  mrg     ;; Some cores have problem skipping 2-word instruction
1.1  mrg     tst     A1
1.1  mrg     brmi    __mulohisi3
1.1  mrg #else
1.1  mrg     sbrs    A1, 7
1.1  mrg #endif /* __AVR_HAVE_JMP_CALL__ */
1.1  mrg     XJMP    __muluhisi3
1.1  mrg     ;; FALLTHRU
1.1  mrg ENDF __mulshisi3
1.1  mrg
1.1  mrg ;;; R25:R22 = (one-extended long) R27:R26 * R21:R18
1.1  mrg ;;; (C3:C0) = (one-extended long) A1:A0   * B3:B0
1.1  mrg ;;; Clobbers: __tmp_reg__
1.1  mrg DEFUN __mulohisi3
1.1  mrg     XCALL   __muluhisi3
1.1  mrg     ;; One-extend R27:R26 (A1:A0)
1.1  mrg     sub     C2, B0
1.1  mrg     sbc     C3, B1
1.1  mrg     ret
1.1  mrg ENDF __mulohisi3
1.1  mrg #endif /* L_mulshisi3 */
1.1  mrg
1.1  mrg #if defined (L_muluhisi3)
1.1  mrg ;;; R25:R22 = (unsigned long) R27:R26 * R21:R18
1.1  mrg ;;; (C3:C0) = (unsigned long) A1:A0   * B3:B0
1.1  mrg ;;; Clobbers: __tmp_reg__
1.1  mrg DEFUN __muluhisi3
1.1  mrg     XCALL   __umulhisi3
1.1  mrg     mul     A0, B3
1.1  mrg     add     C3, r0
1.1  mrg     mul     A1, B2
1.1  mrg     add     C3, r0
1.1  mrg     mul     A0, B2
1.1  mrg     add     C2, r0
1.1  mrg     adc     C3, r1
1.1  mrg     clr     __zero_reg__
1.1  mrg     ret
1.1  mrg ENDF __muluhisi3
1.1  mrg #endif /* L_muluhisi3 */
1.1  mrg
1.1  mrg /*******************************************************
1.1  mrg     Multiplication  32 x 32  with MUL
1.1  mrg *******************************************************/
1.1  mrg
1.1  mrg #if defined (L_mulsi3)
1.1  mrg ;;; R25:R22 = R25:R22 * R21:R18
1.1  mrg ;;; (C3:C0) = C3:C0   * B3:B0
1.1  mrg ;;; Clobbers: R26, R27, __tmp_reg__
1.1  mrg DEFUN __mulsi3
1.1  mrg     movw    A0, C0
1.1  mrg     push    C2
1.1  mrg     push    C3
1.1  mrg     XCALL   __muluhisi3
1.1  mrg     pop     A1
1.1  mrg     pop     A0
1.1  mrg     ;; A1:A0 now contains the high word of A
1.1  mrg     mul     A0, B0
1.1  mrg     add     C2, r0
1.1  mrg     adc     C3, r1
1.1  mrg     mul     A0, B1
1.1  mrg     add     C3, r0
1.1  mrg     mul     A1, B0
1.1  mrg     add     C3, r0
1.1  mrg     clr     __zero_reg__
1.1  mrg     ret
1.1  mrg ENDF __mulsi3
1.1  mrg #endif /* L_mulsi3 */
1.1  mrg
1.1  mrg #undef A0
1.1  mrg #undef A1
1.1  mrg
1.1  mrg #undef B0
1.1  mrg #undef B1
1.1  mrg #undef B2
1.1  mrg #undef B3
1.1  mrg
1.1  mrg #undef C0
1.1  mrg #undef C1
1.1  mrg #undef C2
1.1  mrg #undef C3
1.1  mrg
1.1  mrg #endif /* __AVR_HAVE_MUL__ */
1.1  mrg
1.1  mrg /*******************************************************
1.1  mrg        Multiplication 24 x 24 with MUL
1.1  mrg *******************************************************/
1.1  mrg
1.1  mrg #if defined (L_mulpsi3)
1.1  mrg
1.1  mrg ;; A[0..2]: In: Multiplicand; Out: Product
1.1  mrg #define A0  22
1.1  mrg #define A1  A0+1
1.1  mrg #define A2  A0+2
1.1  mrg
1.1  mrg ;; B[0..2]: In: Multiplier
1.1  mrg #define B0  18
1.1  mrg #define B1  B0+1
1.1  mrg #define B2  B0+2
1.1  mrg
1.1  mrg #if defined (__AVR_HAVE_MUL__)
1.1  mrg
1.1  mrg ;; C[0..2]: Expand Result
1.1  mrg #define C0  22
1.1  mrg #define C1  C0+1
1.1  mrg #define C2  C0+2
1.1  mrg
1.1  mrg ;; R24:R22 *= R20:R18
1.1  mrg ;; Clobbers: r21, r25, r26, r27, __tmp_reg__
1.1  mrg
1.1  mrg #define AA0 26
1.1  mrg #define AA2 21
1.1  mrg
1.1  mrg DEFUN __mulpsi3
1.1  mrg     wmov    AA0, A0
1.1  mrg     mov     AA2, A2
1.1  mrg     XCALL   __umulhisi3
1.1  mrg     mul     AA2, B0     $  add  C2, r0
1.1  mrg     mul     AA0, B2     $  add  C2, r0
1.1  mrg     clr     __zero_reg__
1.1  mrg     ret
1.1  mrg ENDF __mulpsi3
1.1  mrg
1.1  mrg #undef AA2
1.1  mrg #undef AA0
1.1  mrg
1.1  mrg #undef C2
1.1  mrg #undef C1
1.1  mrg #undef C0
1.1  mrg
1.1  mrg #else /* !HAVE_MUL */
1.1  mrg
1.1  mrg ;; C[0..2]: Expand Result
1.1  mrg #define C0  0
1.1  mrg #define C1  C0+1
1.1  mrg #define C2  21
1.1  mrg
1.1  mrg ;; R24:R22 *= R20:R18
1.1  mrg ;; Clobbers: __tmp_reg__, R18, R19, R20, R21
1.1  mrg
1.1  mrg DEFUN __mulpsi3
1.1  mrg
1.1  mrg     ;; C[] = 0
1.1  mrg     clr     __tmp_reg__
1.1  mrg     clr     C2
1.1  mrg
1.1  mrg 0:  ;; Shift N-th Bit of B[] into Carry.  N = 24 - Loop
1.1  mrg     LSR  B2     $  ror  B1     $  ror  B0
1.1  mrg
1.1  mrg     ;; If the N-th Bit of B[] was set...
1.1  mrg     brcc    1f
1.1  mrg
1.1  mrg     ;; ...then add A[] * 2^N to the Result C[]
1.1  mrg     ADD  C0,A0  $  adc  C1,A1  $  adc  C2,A2
1.1  mrg
1.1  mrg 1:  ;; Multiply A[] by 2
1.1  mrg     LSL  A0     $  rol  A1     $  rol  A2
1.1  mrg
1.1  mrg     ;; Loop until B[] is 0
1.1  mrg     subi B0,0   $  sbci B1,0   $  sbci B2,0
1.1  mrg     brne    0b
1.1  mrg
1.1  mrg     ;; Copy C[] to the return Register A[]
1.1  mrg     wmov    A0, C0
1.1  mrg     mov     A2, C2
1.1  mrg
1.1  mrg     clr     __zero_reg__
1.1  mrg     ret
1.1  mrg ENDF __mulpsi3
1.1  mrg
1.1  mrg #undef C2
1.1  mrg #undef C1
1.1  mrg #undef C0
1.1  mrg
1.1  mrg #endif /* HAVE_MUL */
1.1  mrg
1.1  mrg #undef B2
1.1  mrg #undef B1
1.1  mrg #undef B0
1.1  mrg
1.1  mrg #undef A2
1.1  mrg #undef A1
1.1  mrg #undef A0
1.1  mrg
1.1  mrg #endif /* L_mulpsi3 */
1.1  mrg
1.1  mrg #if defined (L_mulsqipsi3) && defined (__AVR_HAVE_MUL__)
1.1  mrg
1.1  mrg ;; A[0..2]: In: Multiplicand
1.1  mrg #define A0  22
1.1  mrg #define A1  A0+1
1.1  mrg #define A2  A0+2
1.1  mrg
1.1  mrg ;; BB: In: Multiplier
1.1  mrg #define BB  25
1.1  mrg
1.1  mrg ;; C[0..2]: Result
1.1  mrg #define C0  18
1.1  mrg #define C1  C0+1
1.1  mrg #define C2  C0+2
1.1  mrg
1.1  mrg ;; C[] = A[] * sign_extend (BB)
1.1  mrg DEFUN __mulsqipsi3
1.1  mrg     mul     A0, BB
1.1  mrg     movw    C0, r0
1.1  mrg     mul     A2, BB
1.1  mrg     mov     C2, r0
1.1  mrg     mul     A1, BB
1.1  mrg     add     C1, r0
1.1  mrg     adc     C2, r1
1.1  mrg     clr     __zero_reg__
1.1  mrg     sbrs    BB, 7
1.1  mrg     ret
1.1  mrg     ;; One-extend BB
1.1  mrg     sub     C1, A0
1.1  mrg     sbc     C2, A1
1.1  mrg     ret
1.1  mrg ENDF __mulsqipsi3
1.1  mrg
1.1  mrg #undef C2
1.1  mrg #undef C1
1.1  mrg #undef C0
1.1  mrg
1.1  mrg #undef BB
1.1  mrg
1.1  mrg #undef A2
1.1  mrg #undef A1
1.1  mrg #undef A0
1.1  mrg
1.1  mrg #endif /* L_mulsqipsi3  &&  HAVE_MUL */
1.1  mrg
1.1  mrg /*******************************************************
1.1  mrg        Multiplication 64 x 64
1.1  mrg *******************************************************/
1.1  mrg
1.1  mrg ;; A[] = A[] * B[]
1.1  mrg
1.1  mrg ;; A[0..7]: In: Multiplicand
1.1  mrg ;; Out: Product
1.1  mrg #define A0  18
1.1  mrg #define A1  A0+1
1.1  mrg #define A2  A0+2
1.1  mrg #define A3  A0+3
1.1  mrg #define A4  A0+4
1.1  mrg #define A5  A0+5
1.1  mrg #define A6  A0+6
1.1  mrg #define A7  A0+7
1.1  mrg
1.1  mrg ;; B[0..7]: In: Multiplier
1.1  mrg #define B0  10
1.1  mrg #define B1  B0+1
1.1  mrg #define B2  B0+2
1.1  mrg #define B3  B0+3
1.1  mrg #define B4  B0+4
1.1  mrg #define B5  B0+5
1.1  mrg #define B6  B0+6
1.1  mrg #define B7  B0+7
1.1  mrg
1.1  mrg #if defined (__AVR_HAVE_MUL__)
1.1  mrg
1.1  mrg ;; Define C[] for convenience
1.1  mrg ;; Notice that parts of C[] overlap A[] respective B[]
1.1  mrg #define C0  16
1.1  mrg #define C1  C0+1
1.1  mrg #define C2  20
1.1  mrg #define C3  C2+1
1.1  mrg #define C4  28
1.1  mrg #define C5  C4+1
1.1  mrg #define C6  C4+2
1.1  mrg #define C7  C4+3
1.1  mrg
1.1  mrg #if defined (L_muldi3)
1.1  mrg
1.1  mrg ;; A[]     *= B[]
1.1  mrg ;; R25:R18 *= R17:R10
1.1  mrg ;; Ordinary ABI-Function
1.1  mrg
1.1  mrg DEFUN __muldi3
1.1  mrg     push    r29
1.1  mrg     push    r28
1.1  mrg     push    r17
1.1  mrg     push    r16
1.1  mrg
1.1  mrg     ;; Counting in Words, we have to perform a 4 * 4 Multiplication
1.1  mrg
1.1  mrg     ;; 3 * 0  +  0 * 3
1.1  mrg     mul  A7,B0  $             $  mov C7,r0
1.1  mrg     mul  A0,B7  $             $  add C7,r0
1.1  mrg     mul  A6,B1  $             $  add C7,r0
1.1  mrg     mul  A6,B0  $  mov C6,r0  $  add C7,r1
1.1  mrg     mul  B6,A1  $             $  add C7,r0
1.1  mrg     mul  B6,A0  $  add C6,r0  $  adc C7,r1
1.1  mrg
1.1  mrg     ;; 1 * 2
1.1  mrg     mul  A2,B4  $  add C6,r0  $  adc C7,r1
1.1  mrg     mul  A3,B4  $             $  add C7,r0
1.1  mrg     mul  A2,B5  $             $  add C7,r0
1.1  mrg
1.1  mrg     push    A5
1.1  mrg     push    A4
1.1  mrg     push    B1
1.1  mrg     push    B0
1.1  mrg     push    A3
1.1  mrg     push    A2
1.1  mrg
1.1  mrg     ;; 0 * 0
1.1  mrg     wmov    26, B0
1.1  mrg     XCALL   __umulhisi3
1.1  mrg     wmov    C0, 22
1.1  mrg     wmov    C2, 24
1.1  mrg
1.1  mrg     ;; 0 * 2
1.1  mrg     wmov    26, B4
1.1  mrg     XCALL   __umulhisi3  $  wmov C4,22            $ add C6,24 $ adc C7,25
1.1  mrg
1.1  mrg     wmov    26, B2
1.1  mrg     ;; 0 * 1
1.1  mrg     XCALL   __muldi3_6
1.1  mrg
1.1  mrg     pop     A0
1.1  mrg     pop     A1
1.1  mrg     ;; 1 * 1
1.1  mrg     wmov    26, B2
1.1  mrg     XCALL   __umulhisi3  $  add C4,22 $ adc C5,23 $ adc C6,24 $ adc C7,25
1.1  mrg
1.1  mrg     pop     r26
1.1  mrg     pop     r27
1.1  mrg     ;; 1 * 0
1.1  mrg     XCALL   __muldi3_6
1.1  mrg
1.1  mrg     pop     A0
1.1  mrg     pop     A1
1.1  mrg     ;; 2 * 0
1.1  mrg     XCALL   __umulhisi3  $  add C4,22 $ adc C5,23 $ adc C6,24 $ adc C7,25
1.1  mrg
1.1  mrg     ;; 2 * 1
1.1  mrg     wmov    26, B2
1.1  mrg     XCALL   __umulhisi3  $            $           $ add C6,22 $ adc C7,23
1.1  mrg
1.1  mrg     ;; A[] = C[]
1.1  mrg     wmov    A0, C0
1.1  mrg     ;; A2 = C2 already
1.1  mrg     wmov    A4, C4
1.1  mrg     wmov    A6, C6
1.1  mrg
1.1  mrg     clr     __zero_reg__
1.1  mrg     pop     r16
1.1  mrg     pop     r17
1.1  mrg     pop     r28
1.1  mrg     pop     r29
1.1  mrg     ret
1.1  mrg ENDF __muldi3
1.1  mrg #endif /* L_muldi3 */
1.1  mrg
1.1  mrg #if defined (L_muldi3_6)
1.1  mrg ;; A helper for some 64-bit multiplications with MUL available
1.1  mrg DEFUN __muldi3_6
1.1  mrg __muldi3_6:
1.1  mrg     XCALL   __umulhisi3
1.1  mrg     add     C2, 22
1.1  mrg     adc     C3, 23
1.1  mrg     adc     C4, 24
1.1  mrg     adc     C5, 25
1.1  mrg     brcc    0f
1.1  mrg     adiw    C6, 1
1.1  mrg 0:  ret
1.1  mrg ENDF __muldi3_6
1.1  mrg #endif /* L_muldi3_6 */
1.1  mrg
1.1  mrg #undef C7
1.1  mrg #undef C6
1.1  mrg #undef C5
1.1  mrg #undef C4
1.1  mrg #undef C3
1.1  mrg #undef C2
1.1  mrg #undef C1
1.1  mrg #undef C0
1.1  mrg
1.1  mrg #else /* !HAVE_MUL */
1.1  mrg
1.1  mrg #if defined (L_muldi3)
1.1  mrg
1.1  mrg #define C0  26
1.1  mrg #define C1  C0+1
1.1  mrg #define C2  C0+2
1.1  mrg #define C3  C0+3
1.1  mrg #define C4  C0+4
1.1  mrg #define C5  C0+5
1.1  mrg #define C6  0
1.1  mrg #define C7  C6+1
1.1  mrg
1.1  mrg #define Loop 9
1.1  mrg
1.1  mrg ;; A[]     *= B[]
1.1  mrg ;; R25:R18 *= R17:R10
1.1  mrg ;; Ordinary ABI-Function
1.1  mrg
1.1  mrg DEFUN __muldi3
1.1  mrg     push    r29
1.1  mrg     push    r28
1.1  mrg     push    Loop
1.1  mrg
1.1  mrg     ldi     C0, 64
1.1  mrg     mov     Loop, C0
1.1  mrg
1.1  mrg     ;; C[] = 0
1.1  mrg     clr     __tmp_reg__
1.1  mrg     wmov    C0, 0
1.1  mrg     wmov    C2, 0
1.1  mrg     wmov    C4, 0
1.1  mrg
1.1  mrg 0:  ;; Rotate B[] right by 1 and set Carry to the N-th Bit of B[]
1.1  mrg     ;; where N = 64 - Loop.
1.1  mrg     ;; Notice that B[] = B[] >>> 64 so after this Routine has finished,
1.1  mrg     ;; B[] will have its initial Value again.
1.1  mrg     LSR  B7     $  ror  B6     $  ror  B5     $  ror  B4
1.1  mrg     ror  B3     $  ror  B2     $  ror  B1     $  ror  B0
1.1  mrg
1.1  mrg     ;; If the N-th Bit of B[] was set then...
1.1  mrg     brcc    1f
1.1  mrg     ;; ...finish Rotation...
1.1  mrg     ori     B7, 1 << 7
1.1  mrg
1.1  mrg     ;; ...and add A[] * 2^N to the Result C[]
1.1  mrg     ADD  C0,A0  $  adc  C1,A1  $  adc  C2,A2  $  adc  C3,A3
1.1  mrg     adc  C4,A4  $  adc  C5,A5  $  adc  C6,A6  $  adc  C7,A7
1.1  mrg
1.1  mrg 1:  ;; Multiply A[] by 2
1.1  mrg     LSL  A0     $  rol  A1     $  rol  A2     $  rol  A3
1.1  mrg     rol  A4     $  rol  A5     $  rol  A6     $  rol  A7
1.1  mrg
1.1  mrg     dec     Loop
1.1  mrg     brne    0b
1.1  mrg
1.1  mrg     ;; We expanded the Result in C[]
1.1  mrg     ;; Copy Result to the Return Register A[]
1.1  mrg     wmov    A0, C0
1.1  mrg     wmov    A2, C2
1.1  mrg     wmov    A4, C4
1.1  mrg     wmov    A6, C6
1.1  mrg
1.1  mrg     clr     __zero_reg__
1.1  mrg     pop     Loop
1.1  mrg     pop     r28
1.1  mrg     pop     r29
1.1  mrg     ret
1.1  mrg ENDF __muldi3
1.1  mrg
1.1  mrg #undef Loop
1.1  mrg
1.1  mrg #undef C7
1.1  mrg #undef C6
1.1  mrg #undef C5
1.1  mrg #undef C4
1.1  mrg #undef C3
1.1  mrg #undef C2
1.1  mrg #undef C1
1.1  mrg #undef C0
1.1  mrg
1.1  mrg #endif /* L_muldi3 */
1.1  mrg #endif /* HAVE_MUL */
1.1  mrg
1.1  mrg #undef B7
1.1  mrg #undef B6
1.1  mrg #undef B5
1.1  mrg #undef B4
1.1  mrg #undef B3
1.1  mrg #undef B2
1.1  mrg #undef B1
1.1  mrg #undef B0
1.1  mrg
1.1  mrg #undef A7
1.1  mrg #undef A6
1.1  mrg #undef A5
1.1  mrg #undef A4
1.1  mrg #undef A3
1.1  mrg #undef A2
1.1  mrg #undef A1
1.1  mrg #undef A0
1.1  mrg
1.1  mrg /*******************************************************
1.1  mrg    Widening Multiplication 64 = 32 x 32  with  MUL
1.1  mrg *******************************************************/
1.1  mrg
1.1  mrg #if defined (__AVR_HAVE_MUL__)
1.1  mrg #define A0 r22
1.1  mrg #define A1 r23
1.1  mrg #define A2 r24
1.1  mrg #define A3 r25
1.1  mrg
1.1  mrg #define B0 r18
1.1  mrg #define B1 r19
1.1  mrg #define B2 r20
1.1  mrg #define B3 r21
1.1  mrg
1.1  mrg #define C0  18
1.1  mrg #define C1  C0+1
1.1  mrg #define C2  20
1.1  mrg #define C3  C2+1
1.1  mrg #define C4  28
1.1  mrg #define C5  C4+1
1.1  mrg #define C6  C4+2
1.1  mrg #define C7  C4+3
1.1  mrg
1.1  mrg #if defined (L_umulsidi3)
1.1  mrg
1.1  mrg ;; Unsigned widening 64 = 32 * 32 Multiplication with MUL
1.1  mrg
1.1  mrg ;; R18[8] = R22[4] * R18[4]
1.1  mrg ;;
1.1  mrg ;; Ordinary ABI Function, but additionally sets
1.1  mrg ;; X = R20[2] = B2[2]
1.1  mrg ;; Z = R22[2] = A0[2]
1.1  mrg DEFUN __umulsidi3
1.1  mrg     clt
1.1  mrg     ;; FALLTHRU
1.1  mrg ENDF  __umulsidi3
1.1  mrg     ;; T = sign (A)
1.1  mrg DEFUN __umulsidi3_helper
1.1  mrg     push    29  $  push    28 ; Y
1.1  mrg     wmov    30, A2
1.1  mrg     ;; Counting in Words, we have to perform 4 Multiplications
1.1  mrg     ;; 0 * 0
1.1  mrg     wmov    26, A0
1.1  mrg     XCALL __umulhisi3
1.1  mrg     push    23  $  push    22 ; C0
1.1  mrg     wmov    28, B0
1.1  mrg     wmov    18, B2
1.1  mrg     wmov    C2, 24
1.1  mrg     push    27  $  push    26 ; A0
1.1  mrg     push    19  $  push    18 ; B2
1.1  mrg     ;;
1.1  mrg     ;;  18  20  22  24  26  28  30  |  B2, B3, A0, A1, C0, C1, Y
1.1  mrg     ;;  B2  C2  --  --  --  B0  A2
1.1  mrg     ;; 1 * 1
1.1  mrg     wmov    26, 30      ; A2
1.1  mrg     XCALL __umulhisi3
1.1  mrg     ;; Sign-extend A.  T holds the sign of A
1.1  mrg     brtc    0f
1.1  mrg     ;; Subtract B from the high part of the result
1.1  mrg     sub     22, 28
1.1  mrg     sbc     23, 29
1.1  mrg     sbc     24, 18
1.1  mrg     sbc     25, 19
1.1  mrg 0:  wmov    18, 28      ;; B0
1.1  mrg     wmov    C4, 22
1.1  mrg     wmov    C6, 24
1.1  mrg     ;;
1.1  mrg     ;;  18  20  22  24  26  28  30  |  B2, B3, A0, A1, C0, C1, Y
1.1  mrg     ;;  B0  C2  --  --  A2  C4  C6
1.1  mrg     ;;
1.1  mrg     ;; 1 * 0
1.1  mrg     XCALL __muldi3_6
1.1  mrg     ;; 0 * 1
1.1  mrg     pop     26  $   pop 27  ;; B2
1.1  mrg     pop     18  $   pop 19  ;; A0
1.1  mrg     XCALL __muldi3_6
1.1  mrg
1.1  mrg     ;; Move result C into place and save A0 in Z
1.1  mrg     wmov    22, C4
1.1  mrg     wmov    24, C6
1.1  mrg     wmov    30, 18 ; A0
1.1  mrg     pop     C0  $   pop C1
1.1  mrg
1.1  mrg     ;; Epilogue
1.1  mrg     pop     28  $   pop 29  ;; Y
1.1  mrg     ret
1.1  mrg ENDF __umulsidi3_helper
1.1  mrg #endif /* L_umulsidi3 */
1.1  mrg
1.1  mrg
1.1  mrg #if defined (L_mulsidi3)
1.1  mrg
1.1  mrg ;; Signed widening 64 = 32 * 32 Multiplication
1.1  mrg ;;
1.1  mrg ;; R18[8] = R22[4] * R18[4]
1.1  mrg ;; Ordinary ABI Function
1.1  mrg DEFUN __mulsidi3
1.1  mrg     bst     A3, 7
1.1  mrg     sbrs    B3, 7           ; Enhanced core has no skip bug
1.1  mrg     XJMP __umulsidi3_helper
1.1  mrg
1.1  mrg     ;; B needs sign-extension
1.1  mrg     push    A3
1.1  mrg     push    A2
1.1  mrg     XCALL __umulsidi3_helper
1.1  mrg     ;; A0 survived in Z
1.1  mrg     sub     r22, r30
1.1  mrg     sbc     r23, r31
1.1  mrg     pop     r26
1.1  mrg     pop     r27
1.1  mrg     sbc     r24, r26
1.1  mrg     sbc     r25, r27
1.1  mrg     ret
1.1  mrg ENDF __mulsidi3
1.1  mrg #endif /* L_mulsidi3 */
1.1  mrg
1.1  mrg #undef A0
1.1  mrg #undef A1
1.1  mrg #undef A2
1.1  mrg #undef A3
1.1  mrg #undef B0
1.1  mrg #undef B1
1.1  mrg #undef B2
1.1  mrg #undef B3
1.1  mrg #undef C0
1.1  mrg #undef C1
1.1  mrg #undef C2
1.1  mrg #undef C3
1.1  mrg #undef C4
1.1  mrg #undef C5
1.1  mrg #undef C6
1.1  mrg #undef C7
1.1  mrg #endif /* HAVE_MUL */
1.1  mrg
1.1  mrg /**********************************************************
1.1  mrg     Widening Multiplication 64 = 32 x 32  without  MUL
1.1  mrg **********************************************************/
1.1  mrg
1.1  mrg #if defined (L_mulsidi3) && !defined (__AVR_HAVE_MUL__)
1.1  mrg #define A0 18
1.1  mrg #define A1 A0+1
1.1  mrg #define A2 A0+2
1.1  mrg #define A3 A0+3
1.1  mrg #define A4 A0+4
1.1  mrg #define A5 A0+5
1.1  mrg #define A6 A0+6
1.1  mrg #define A7 A0+7
1.1  mrg
1.1  mrg #define B0 10
1.1  mrg #define B1 B0+1
1.1  mrg #define B2 B0+2
1.1  mrg #define B3 B0+3
1.1  mrg #define B4 B0+4
1.1  mrg #define B5 B0+5
1.1  mrg #define B6 B0+6
1.1  mrg #define B7 B0+7
1.1  mrg
1.1  mrg #define AA0 22
1.1  mrg #define AA1 AA0+1
1.1  mrg #define AA2 AA0+2
1.1  mrg #define AA3 AA0+3
1.1  mrg
1.1  mrg #define BB0 18
1.1  mrg #define BB1 BB0+1
1.1  mrg #define BB2 BB0+2
1.1  mrg #define BB3 BB0+3
1.1  mrg
1.1  mrg #define Mask r30
1.1  mrg
1.1  mrg ;; Signed / Unsigned widening 64 = 32 * 32 Multiplication without MUL
1.1  mrg ;;
1.1  mrg ;; R18[8] = R22[4] * R18[4]
1.1  mrg ;; Ordinary ABI Function
1.1  mrg DEFUN __mulsidi3
1.1  mrg     set
1.1  mrg     skip
1.1  mrg     ;; FALLTHRU
1.1  mrg ENDF  __mulsidi3
1.1  mrg
1.1  mrg DEFUN __umulsidi3
1.1  mrg     clt     ; skipped
1.1  mrg     ;; Save 10 Registers: R10..R17, R28, R29
1.1  mrg     do_prologue_saves 10
1.1  mrg     ldi     Mask, 0xff
1.1  mrg     bld     Mask, 7
1.1  mrg     ;; Move B into place...
1.1  mrg     wmov    B0, BB0
1.1  mrg     wmov    B2, BB2
1.1  mrg     ;; ...and extend it
1.1  mrg     and     BB3, Mask
1.1  mrg     lsl     BB3
1.1  mrg     sbc     B4, B4
1.1  mrg     mov     B5, B4
1.1  mrg     wmov    B6, B4
1.1  mrg     ;; Move A into place...
1.1  mrg     wmov    A0, AA0
1.1  mrg     wmov    A2, AA2
1.1  mrg     ;; ...and extend it
1.1  mrg     and     AA3, Mask
1.1  mrg     lsl     AA3
1.1  mrg     sbc     A4, A4
1.1  mrg     mov     A5, A4
1.1  mrg     wmov    A6, A4
1.1  mrg     XCALL   __muldi3
1.1  mrg     do_epilogue_restores 10
1.1  mrg ENDF __umulsidi3
1.1  mrg
1.1  mrg #undef A0
1.1  mrg #undef A1
1.1  mrg #undef A2
1.1  mrg #undef A3
1.1  mrg #undef A4
1.1  mrg #undef A5
1.1  mrg #undef A6
1.1  mrg #undef A7
1.1  mrg #undef B0
1.1  mrg #undef B1
1.1  mrg #undef B2
1.1  mrg #undef B3
1.1  mrg #undef B4
1.1  mrg #undef B5
1.1  mrg #undef B6
1.1  mrg #undef B7
1.1  mrg #undef AA0
1.1  mrg #undef AA1
1.1  mrg #undef AA2
1.1  mrg #undef AA3
1.1  mrg #undef BB0
1.1  mrg #undef BB1
1.1  mrg #undef BB2
1.1  mrg #undef BB3
1.1  mrg #undef Mask
1.1  mrg #endif /* L_mulsidi3 && !HAVE_MUL */
1.1  mrg
1.1  mrg ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
1.1  mrg
1.1  mrg
1.1  mrg .section .text.libgcc.div, "ax", @progbits
1.1  mrg
1.1  mrg /*******************************************************
1.1  mrg        Division 8 / 8 => (result + remainder)
1.1  mrg *******************************************************/
1.1  mrg #define	r_rem	r25	/* remainder */
1.1  mrg #define	r_arg1	r24	/* dividend, quotient */
1.1  mrg #define	r_arg2	r22	/* divisor */
1.1  mrg #define	r_cnt	r23	/* loop count */
1.1  mrg
1.1  mrg #if defined (L_udivmodqi4)
1.1  mrg DEFUN __udivmodqi4
1.1  mrg 	sub	r_rem,r_rem	; clear remainder and carry
1.1  mrg 	ldi	r_cnt,9		; init loop counter
1.1  mrg 	rjmp	__udivmodqi4_ep	; jump to entry point
1.1  mrg __udivmodqi4_loop:
1.1  mrg 	rol	r_rem		; shift dividend into remainder
1.1  mrg 	cp	r_rem,r_arg2	; compare remainder & divisor
1.1  mrg 	brcs	__udivmodqi4_ep	; remainder <= divisor
1.1  mrg 	sub	r_rem,r_arg2	; restore remainder
1.1  mrg __udivmodqi4_ep:
1.1  mrg 	rol	r_arg1		; shift dividend (with CARRY)
1.1  mrg 	dec	r_cnt		; decrement loop counter
1.1  mrg 	brne	__udivmodqi4_loop
1.1  mrg 	com	r_arg1		; complement result
1.1  mrg 				; because C flag was complemented in loop
1.1  mrg 	ret
1.1  mrg ENDF __udivmodqi4
1.1  mrg #endif /* defined (L_udivmodqi4) */
1.1  mrg
1.1  mrg #if defined (L_divmodqi4)
1.1  mrg DEFUN __divmodqi4
1.1  mrg         bst     r_arg1,7	; store sign of dividend
1.1  mrg         mov     __tmp_reg__,r_arg1
1.1  mrg         eor     __tmp_reg__,r_arg2; r0.7 is sign of result
1.1  mrg         sbrc	r_arg1,7
1.1  mrg 	neg     r_arg1		; dividend negative : negate
1.1  mrg         sbrc	r_arg2,7
1.1  mrg 	neg     r_arg2		; divisor negative : negate
1.1  mrg 	XCALL	__udivmodqi4	; do the unsigned div/mod
1.1  mrg 	brtc	__divmodqi4_1
1.1  mrg 	neg	r_rem		; correct remainder sign
1.1  mrg __divmodqi4_1:
1.1  mrg 	sbrc	__tmp_reg__,7
1.1  mrg 	neg	r_arg1		; correct result sign
1.1  mrg __divmodqi4_exit:
1.1  mrg 	ret
1.1  mrg ENDF __divmodqi4
1.1  mrg #endif /* defined (L_divmodqi4) */
1.1  mrg
1.1  mrg #undef r_rem
1.1  mrg #undef r_arg1
1.1  mrg #undef r_arg2
1.1  mrg #undef r_cnt
1.1  mrg
1.1  mrg
1.1  mrg /*******************************************************
1.1  mrg        Division 16 / 16 => (result + remainder)
1.1  mrg *******************************************************/
1.1  mrg #define	r_remL	r26	/* remainder Low */
1.1  mrg #define	r_remH	r27	/* remainder High */
1.1  mrg
1.1  mrg /* return: remainder */
1.1  mrg #define	r_arg1L	r24	/* dividend Low */
1.1  mrg #define	r_arg1H	r25	/* dividend High */
1.1  mrg
1.1  mrg /* return: quotient */
1.1  mrg #define	r_arg2L	r22	/* divisor Low */
1.1  mrg #define	r_arg2H	r23	/* divisor High */
1.1  mrg
1.1  mrg #define	r_cnt	r21	/* loop count */
1.1  mrg
1.1  mrg #if defined (L_udivmodhi4)
1.1  mrg DEFUN __udivmodhi4
1.1  mrg 	sub	r_remL,r_remL
1.1  mrg 	sub	r_remH,r_remH	; clear remainder and carry
1.1  mrg 	ldi	r_cnt,17	; init loop counter
1.1  mrg 	rjmp	__udivmodhi4_ep	; jump to entry point
1.1  mrg __udivmodhi4_loop:
1.1  mrg         rol	r_remL		; shift dividend into remainder
1.1  mrg 	rol	r_remH
1.1  mrg         cp	r_remL,r_arg2L	; compare remainder & divisor
1.1  mrg 	cpc	r_remH,r_arg2H
1.1  mrg         brcs	__udivmodhi4_ep	; remainder < divisor
1.1  mrg         sub	r_remL,r_arg2L	; restore remainder
1.1  mrg         sbc	r_remH,r_arg2H
1.1  mrg __udivmodhi4_ep:
1.1  mrg         rol	r_arg1L		; shift dividend (with CARRY)
1.1  mrg         rol	r_arg1H
1.1  mrg         dec	r_cnt		; decrement loop counter
1.1  mrg         brne	__udivmodhi4_loop
1.1  mrg 	com	r_arg1L
1.1  mrg 	com	r_arg1H
1.1  mrg ; div/mod results to return registers, as for the div() function
1.1  mrg 	mov_l	r_arg2L, r_arg1L	; quotient
1.1  mrg 	mov_h	r_arg2H, r_arg1H
1.1  mrg 	mov_l	r_arg1L, r_remL		; remainder
1.1  mrg 	mov_h	r_arg1H, r_remH
1.1  mrg 	ret
1.1  mrg ENDF __udivmodhi4
1.1  mrg #endif /* defined (L_udivmodhi4) */
1.1  mrg
1.1  mrg #if defined (L_divmodhi4)
1.1  mrg DEFUN __divmodhi4
1.1  mrg     .global _div
1.1  mrg _div:
1.1  mrg     bst     r_arg1H,7           ; store sign of dividend
1.1  mrg     mov     __tmp_reg__,r_arg2H
1.1  mrg     brtc    0f
1.1  mrg     com     __tmp_reg__         ; r0.7 is sign of result
1.1  mrg     rcall   __divmodhi4_neg1    ; dividend negative: negate
1.1  mrg 0:
1.1  mrg     sbrc    r_arg2H,7
1.1  mrg     rcall   __divmodhi4_neg2    ; divisor negative: negate
1.1  mrg     XCALL   __udivmodhi4        ; do the unsigned div/mod
1.1  mrg     sbrc    __tmp_reg__,7
1.1  mrg     rcall   __divmodhi4_neg2    ; correct remainder sign
1.1  mrg     brtc    __divmodhi4_exit
1.1  mrg __divmodhi4_neg1:
1.1  mrg     ;; correct dividend/remainder sign
1.1  mrg     com     r_arg1H
1.1  mrg     neg     r_arg1L
1.1  mrg     sbci    r_arg1H,0xff
1.1  mrg     ret
1.1  mrg __divmodhi4_neg2:
1.1  mrg     ;; correct divisor/result sign
1.1  mrg     com     r_arg2H
1.1  mrg     neg     r_arg2L
1.1  mrg     sbci    r_arg2H,0xff
1.1  mrg __divmodhi4_exit:
1.1  mrg     ret
1.1  mrg ENDF __divmodhi4
1.1  mrg #endif /* defined (L_divmodhi4) */
1.1  mrg
1.1  mrg #undef r_remH
1.1  mrg #undef r_remL
1.1  mrg
1.1  mrg #undef r_arg1H
1.1  mrg #undef r_arg1L
1.1  mrg
1.1  mrg #undef r_arg2H
1.1  mrg #undef r_arg2L
1.1  mrg
1.1  mrg #undef r_cnt
1.1  mrg
1.1  mrg /*******************************************************
1.1  mrg        Division 24 / 24 => (result + remainder)
1.1  mrg *******************************************************/
1.1  mrg
1.1  mrg ;; A[0..2]: In: Dividend; Out: Quotient
1.1  mrg #define A0  22
1.1  mrg #define A1  A0+1
1.1  mrg #define A2  A0+2
1.1  mrg
1.1  mrg ;; B[0..2]: In: Divisor;   Out: Remainder
1.1  mrg #define B0  18
1.1  mrg #define B1  B0+1
1.1  mrg #define B2  B0+2
1.1  mrg
1.1  mrg ;; C[0..2]: Expand remainder
1.1  mrg #define C0  __zero_reg__
1.1  mrg #define C1  26
1.1  mrg #define C2  25
1.1  mrg
1.1  mrg ;; Loop counter
1.1  mrg #define r_cnt   21
1.1  mrg
1.1  mrg #if defined (L_udivmodpsi4)
1.1  mrg ;; R24:R22 = R24:R22  udiv  R20:R18
1.1  mrg ;; R20:R18 = R24:R22  umod  R20:R18
1.1  mrg ;; Clobbers: R21, R25, R26
1.1  mrg
1.1  mrg DEFUN __udivmodpsi4
1.1  mrg     ; init loop counter
1.1  mrg     ldi     r_cnt, 24+1
1.1  mrg     ; Clear remainder and carry.  C0 is already 0
1.1  mrg     clr     C1
1.1  mrg     sub     C2, C2
1.1  mrg     ; jump to entry point
1.1  mrg     rjmp    __udivmodpsi4_start
1.1  mrg __udivmodpsi4_loop:
1.1  mrg     ; shift dividend into remainder
1.1  mrg     rol     C0
1.1  mrg     rol     C1
1.1  mrg     rol     C2
1.1  mrg     ; compare remainder & divisor
1.1  mrg     cp      C0, B0
1.1  mrg     cpc     C1, B1
1.1  mrg     cpc     C2, B2
1.1  mrg     brcs    __udivmodpsi4_start ; remainder <= divisor
1.1  mrg     sub     C0, B0              ; restore remainder
1.1  mrg     sbc     C1, B1
1.1  mrg     sbc     C2, B2
1.1  mrg __udivmodpsi4_start:
1.1  mrg     ; shift dividend (with CARRY)
1.1  mrg     rol     A0
1.1  mrg     rol     A1
1.1  mrg     rol     A2
1.1  mrg     ; decrement loop counter
1.1  mrg     dec     r_cnt
1.1  mrg     brne    __udivmodpsi4_loop
1.1  mrg     com     A0
1.1  mrg     com     A1
1.1  mrg     com     A2
1.1  mrg     ; div/mod results to return registers
1.1  mrg     ; remainder
1.1  mrg     mov     B0, C0
1.1  mrg     mov     B1, C1
1.1  mrg     mov     B2, C2
1.1  mrg     clr     __zero_reg__ ; C0
1.1  mrg     ret
1.1  mrg ENDF __udivmodpsi4
1.1  mrg #endif /* defined (L_udivmodpsi4) */
1.1  mrg
1.1  mrg #if defined (L_divmodpsi4)
1.1  mrg ;; R24:R22 = R24:R22  div  R20:R18
1.1  mrg ;; R20:R18 = R24:R22  mod  R20:R18
1.1  mrg ;; Clobbers: T, __tmp_reg__, R21, R25, R26
1.1  mrg
1.1  mrg DEFUN __divmodpsi4
1.1  mrg     ; R0.7 will contain the sign of the result:
1.1  mrg     ; R0.7 = A.sign ^ B.sign
1.1  mrg     mov __tmp_reg__, B2
1.1  mrg     ; T-flag = sign of dividend
1.1  mrg     bst     A2, 7
1.1  mrg     brtc    0f
1.1  mrg     com     __tmp_reg__
1.1  mrg     ; Adjust dividend's sign
1.1  mrg     rcall   __divmodpsi4_negA
1.1  mrg 0:
1.1  mrg     ; Adjust divisor's sign
1.1  mrg     sbrc    B2, 7
1.1  mrg     rcall   __divmodpsi4_negB
1.1  mrg
1.1  mrg     ; Do the unsigned div/mod
1.1  mrg     XCALL   __udivmodpsi4
1.1  mrg
1.1  mrg     ; Adjust quotient's sign
1.1  mrg     sbrc    __tmp_reg__, 7
1.1  mrg     rcall   __divmodpsi4_negA
1.1  mrg
1.1  mrg     ; Adjust remainder's sign
1.1  mrg     brtc    __divmodpsi4_end
1.1  mrg
1.1  mrg __divmodpsi4_negB:
1.1  mrg     ; Correct divisor/remainder sign
1.1  mrg     com     B2
1.1  mrg     com     B1
1.1  mrg     neg     B0
1.1  mrg     sbci    B1, -1
1.1  mrg     sbci    B2, -1
1.1  mrg     ret
1.1  mrg
1.1  mrg     ; Correct dividend/quotient sign
1.1  mrg __divmodpsi4_negA:
1.1  mrg     com     A2
1.1  mrg     com     A1
1.1  mrg     neg     A0
1.1  mrg     sbci    A1, -1
1.1  mrg     sbci    A2, -1
1.1  mrg __divmodpsi4_end:
1.1  mrg     ret
1.1  mrg
1.1  mrg ENDF __divmodpsi4
1.1  mrg #endif /* defined (L_divmodpsi4) */
1.1  mrg
1.1  mrg #undef A0
1.1  mrg #undef A1
1.1  mrg #undef A2
1.1  mrg
1.1  mrg #undef B0
1.1  mrg #undef B1
1.1  mrg #undef B2
1.1  mrg
1.1  mrg #undef C0
1.1  mrg #undef C1
1.1  mrg #undef C2
1.1  mrg
1.1  mrg #undef r_cnt
1.1  mrg
1.1  mrg /*******************************************************
1.1  mrg        Division 32 / 32 => (result + remainder)
1.1  mrg *******************************************************/
1.1  mrg #define	r_remHH	r31	/* remainder High */
1.1  mrg #define	r_remHL	r30
1.1  mrg #define	r_remH	r27
1.1  mrg #define	r_remL	r26	/* remainder Low */
1.1  mrg
1.1  mrg /* return: remainder */
1.1  mrg #define	r_arg1HH r25	/* dividend High */
1.1  mrg #define	r_arg1HL r24
1.1  mrg #define	r_arg1H  r23
1.1  mrg #define	r_arg1L  r22	/* dividend Low */
1.1  mrg
1.1  mrg /* return: quotient */
1.1  mrg #define	r_arg2HH r21	/* divisor High */
1.1  mrg #define	r_arg2HL r20
1.1  mrg #define	r_arg2H  r19
1.1  mrg #define	r_arg2L  r18	/* divisor Low */
1.1  mrg
1.1  mrg #define	r_cnt __zero_reg__  /* loop count (0 after the loop!) */
1.1  mrg
1.1  mrg #if defined (L_udivmodsi4)
1.1  mrg DEFUN __udivmodsi4
1.1  mrg 	ldi	r_remL, 33	; init loop counter
1.1  mrg 	mov	r_cnt, r_remL
1.1  mrg 	sub	r_remL,r_remL
1.1  mrg 	sub	r_remH,r_remH	; clear remainder and carry
1.1  mrg 	mov_l	r_remHL, r_remL
1.1  mrg 	mov_h	r_remHH, r_remH
1.1  mrg 	rjmp	__udivmodsi4_ep	; jump to entry point
1.1  mrg __udivmodsi4_loop:
1.1  mrg         rol	r_remL		; shift dividend into remainder
1.1  mrg 	rol	r_remH
1.1  mrg 	rol	r_remHL
1.1  mrg 	rol	r_remHH
1.1  mrg         cp	r_remL,r_arg2L	; compare remainder & divisor
1.1  mrg 	cpc	r_remH,r_arg2H
1.1  mrg 	cpc	r_remHL,r_arg2HL
1.1  mrg 	cpc	r_remHH,r_arg2HH
1.1  mrg 	brcs	__udivmodsi4_ep	; remainder <= divisor
1.1  mrg         sub	r_remL,r_arg2L	; restore remainder
1.1  mrg         sbc	r_remH,r_arg2H
1.1  mrg         sbc	r_remHL,r_arg2HL
1.1  mrg         sbc	r_remHH,r_arg2HH
1.1  mrg __udivmodsi4_ep:
1.1  mrg         rol	r_arg1L		; shift dividend (with CARRY)
1.1  mrg         rol	r_arg1H
1.1  mrg         rol	r_arg1HL
1.1  mrg         rol	r_arg1HH
1.1  mrg         dec	r_cnt		; decrement loop counter
1.1  mrg         brne	__udivmodsi4_loop
1.1  mrg 				; __zero_reg__ now restored (r_cnt == 0)
1.1  mrg 	com	r_arg1L
1.1  mrg 	com	r_arg1H
1.1  mrg 	com	r_arg1HL
1.1  mrg 	com	r_arg1HH
1.1  mrg ; div/mod results to return registers, as for the ldiv() function
1.1  mrg 	mov_l	r_arg2L,  r_arg1L	; quotient
1.1  mrg 	mov_h	r_arg2H,  r_arg1H
1.1  mrg 	mov_l	r_arg2HL, r_arg1HL
1.1  mrg 	mov_h	r_arg2HH, r_arg1HH
1.1  mrg 	mov_l	r_arg1L,  r_remL	; remainder
1.1  mrg 	mov_h	r_arg1H,  r_remH
1.1  mrg 	mov_l	r_arg1HL, r_remHL
1.1  mrg 	mov_h	r_arg1HH, r_remHH
1.1  mrg 	ret
1.1  mrg ENDF __udivmodsi4
1.1  mrg #endif /* defined (L_udivmodsi4) */
1.1  mrg
1.1  mrg #if defined (L_divmodsi4)
1.1  mrg DEFUN __divmodsi4
1.1  mrg     mov     __tmp_reg__,r_arg2HH
1.1  mrg     bst     r_arg1HH,7          ; store sign of dividend
1.1  mrg     brtc    0f
1.1  mrg     com     __tmp_reg__         ; r0.7 is sign of result
1.1  mrg     XCALL   __negsi2            ; dividend negative: negate
1.1  mrg 0:
1.1  mrg     sbrc    r_arg2HH,7
1.1  mrg     rcall   __divmodsi4_neg2    ; divisor negative: negate
1.1  mrg     XCALL   __udivmodsi4        ; do the unsigned div/mod
1.1  mrg     sbrc    __tmp_reg__, 7      ; correct quotient sign
1.1  mrg     rcall   __divmodsi4_neg2
1.1  mrg     brtc    __divmodsi4_exit    ; correct remainder sign
1.1  mrg     XJMP    __negsi2
1.1  mrg __divmodsi4_neg2:
1.1  mrg     ;; correct divisor/quotient sign
1.1  mrg     com     r_arg2HH
1.1  mrg     com     r_arg2HL
1.1  mrg     com     r_arg2H
1.1  mrg     neg     r_arg2L
1.1  mrg     sbci    r_arg2H,0xff
1.1  mrg     sbci    r_arg2HL,0xff
1.1  mrg     sbci    r_arg2HH,0xff
1.1  mrg __divmodsi4_exit:
1.1  mrg     ret
1.1  mrg ENDF __divmodsi4
1.1  mrg #endif /* defined (L_divmodsi4) */
1.1  mrg
1.1  mrg #if defined (L_negsi2)
1.1  mrg ;; (set (reg:SI 22)
1.1  mrg ;;      (neg:SI (reg:SI 22)))
1.1  mrg ;; Sets the V flag for signed overflow tests
1.1  mrg DEFUN __negsi2
1.1  mrg     NEG4    22
1.1  mrg     ret
1.1  mrg ENDF __negsi2
1.1  mrg #endif /* L_negsi2 */
1.1  mrg
1.1  mrg #undef r_remHH
1.1  mrg #undef r_remHL
1.1  mrg #undef r_remH
1.1  mrg #undef r_remL
1.1  mrg #undef r_arg1HH
1.1  mrg #undef r_arg1HL
1.1  mrg #undef r_arg1H
1.1  mrg #undef r_arg1L
1.1  mrg #undef r_arg2HH
1.1  mrg #undef r_arg2HL
1.1  mrg #undef r_arg2H
1.1  mrg #undef r_arg2L
1.1  mrg #undef r_cnt
1.1  mrg
1.1  mrg /*******************************************************
1.1  mrg        Division 64 / 64
1.1  mrg        Modulo   64 % 64
1.1  mrg *******************************************************/
1.1  mrg
1.1  mrg ;; Use Speed-optimized Version on "big" Devices, i.e. Devices with
1.1  mrg ;; at least 16k of Program Memory.  For smaller Devices, depend
1.1  mrg ;; on MOVW and SP Size.  There is a Connexion between SP Size and
1.1  mrg ;; Flash Size so that SP Size can be used to test for Flash Size.
1.1  mrg
1.1  mrg #if defined (__AVR_HAVE_JMP_CALL__)
1.1  mrg #   define SPEED_DIV 8
1.1  mrg #elif defined (__AVR_HAVE_MOVW__) && defined (__AVR_HAVE_SPH__)
1.1  mrg #   define SPEED_DIV 16
1.1  mrg #else
1.1  mrg #   define SPEED_DIV 0
1.1  mrg #endif
1.1  mrg
1.1  mrg ;; A[0..7]: In: Dividend;
1.1  mrg ;; Out: Quotient  (T = 0)
1.1  mrg ;; Out: Remainder (T = 1)
1.1  mrg #define A0  18
1.1  mrg #define A1  A0+1
1.1  mrg #define A2  A0+2
1.1  mrg #define A3  A0+3
1.1  mrg #define A4  A0+4
1.1  mrg #define A5  A0+5
1.1  mrg #define A6  A0+6
1.1  mrg #define A7  A0+7
1.1  mrg
1.1  mrg ;; B[0..7]: In: Divisor;   Out: Clobber
1.1  mrg #define B0  10
1.1  mrg #define B1  B0+1
1.1  mrg #define B2  B0+2
1.1  mrg #define B3  B0+3
1.1  mrg #define B4  B0+4
1.1  mrg #define B5  B0+5
1.1  mrg #define B6  B0+6
1.1  mrg #define B7  B0+7
1.1  mrg
1.1  mrg ;; C[0..7]: Expand remainder;  Out: Remainder (unused)
1.1  mrg #define C0  8
1.1  mrg #define C1  C0+1
1.1  mrg #define C2  30
1.1  mrg #define C3  C2+1
1.1  mrg #define C4  28
1.1  mrg #define C5  C4+1
1.1  mrg #define C6  26
1.1  mrg #define C7  C6+1
1.1  mrg
1.1  mrg ;; Holds Signs during Division Routine
1.1  mrg #define SS      __tmp_reg__
1.1  mrg
1.1  mrg ;; Bit-Counter in Division Routine
1.1  mrg #define R_cnt   __zero_reg__
1.1  mrg
1.1  mrg ;; Scratch Register for Negation
1.1  mrg #define NN      r31
1.1  mrg
1.1  mrg #if defined (L_udivdi3)
1.1  mrg
1.1  mrg ;; R25:R18 = R24:R18  umod  R17:R10
1.1  mrg ;; Ordinary ABI-Function
1.1  mrg
1.1  mrg DEFUN __umoddi3
1.1  mrg     set
1.1  mrg     rjmp __udivdi3_umoddi3
1.1  mrg ENDF __umoddi3
1.1  mrg
1.1  mrg ;; R25:R18 = R24:R18  udiv  R17:R10
1.1  mrg ;; Ordinary ABI-Function
1.1  mrg
1.1  mrg DEFUN __udivdi3
1.1  mrg     clt
1.1  mrg ENDF __udivdi3
1.1  mrg
1.1  mrg DEFUN __udivdi3_umoddi3
1.1  mrg     push    C0
1.1  mrg     push    C1
1.1  mrg     push    C4
1.1  mrg     push    C5
1.1  mrg     XCALL   __udivmod64
1.1  mrg     pop     C5
1.1  mrg     pop     C4
1.1  mrg     pop     C1
1.1  mrg     pop     C0
1.1  mrg     ret
1.1  mrg ENDF __udivdi3_umoddi3
1.1  mrg #endif /* L_udivdi3 */
1.1  mrg
1.1  mrg #if defined (L_udivmod64)
1.1  mrg
1.1  mrg ;; Worker Routine for 64-Bit unsigned Quotient and Remainder Computation
1.1  mrg ;; No Registers saved/restored; the Callers will take Care.
1.1  mrg ;; Preserves B[] and T-flag
1.1  mrg ;; T = 0: Compute Quotient  in A[]
1.1  mrg ;; T = 1: Compute Remainder in A[] and shift SS one Bit left
1.1  mrg
1.1  mrg DEFUN __udivmod64
1.1  mrg
1.1  mrg     ;; Clear Remainder (C6, C7 will follow)
1.1  mrg     clr     C0
1.1  mrg     clr     C1
1.1  mrg     wmov    C2, C0
1.1  mrg     wmov    C4, C0
1.1  mrg     ldi     C7, 64
1.1  mrg
1.1  mrg #if SPEED_DIV == 0 || SPEED_DIV == 16
1.1  mrg     ;; Initialize Loop-Counter
1.1  mrg     mov     R_cnt, C7
1.1  mrg     wmov    C6, C0
1.1  mrg #endif /* SPEED_DIV */
1.1  mrg
1.1  mrg #if SPEED_DIV == 8
1.1  mrg
1.1  mrg     push    A7
1.1  mrg     clr     C6
1.1  mrg
1.1  mrg 1:  ;; Compare shifted Devidend against Divisor
1.1  mrg     ;; If -- even after Shifting -- it is smaller...
1.1  mrg     CP  A7,B0  $  cpc C0,B1  $  cpc C1,B2  $  cpc C2,B3
1.1  mrg     cpc C3,B4  $  cpc C4,B5  $  cpc C5,B6  $  cpc C6,B7
1.1  mrg     brcc    2f
1.1  mrg
1.1  mrg     ;; ...then we can subtract it.  Thus, it is legal to shift left
1.1  mrg                $  mov C6,C5  $  mov C5,C4  $  mov C4,C3
1.1  mrg     mov C3,C2  $  mov C2,C1  $  mov C1,C0  $  mov C0,A7
1.1  mrg     mov A7,A6  $  mov A6,A5  $  mov A5,A4  $  mov A4,A3
1.1  mrg     mov A3,A2  $  mov A2,A1  $  mov A1,A0  $  clr A0
1.1  mrg
1.1  mrg     ;; 8 Bits are done
1.1  mrg     subi    C7, 8
1.1  mrg     brne    1b
1.1  mrg
1.1  mrg     ;; Shifted 64 Bits:  A7 has traveled to C7
1.1  mrg     pop     C7
1.1  mrg     ;; Divisor is greater than Dividend. We have:
1.1  mrg     ;; A[] % B[] = A[]
1.1  mrg     ;; A[] / B[] = 0
1.1  mrg     ;; Thus, we can return immediately
1.1  mrg     rjmp    5f
1.1  mrg
1.1  mrg 2:  ;; Initialze Bit-Counter with Number of Bits still to be performed
1.1  mrg     mov     R_cnt, C7
1.1  mrg
1.1  mrg     ;; Push of A7 is not needed because C7 is still 0
1.1  mrg     pop     C7
1.1  mrg     clr     C7
1.1  mrg
1.1  mrg #elif  SPEED_DIV == 16
1.1  mrg
1.1  mrg     ;; Compare shifted Dividend against Divisor
1.1  mrg     cp      A7, B3
1.1  mrg     cpc     C0, B4
1.1  mrg     cpc     C1, B5
1.1  mrg     cpc     C2, B6
1.1  mrg     cpc     C3, B7
1.1  mrg     brcc    2f
1.1  mrg
1.1  mrg     ;; Divisor is greater than shifted Dividen: We can shift the Dividend
1.1  mrg     ;; and it is still smaller than the Divisor --> Shift one 32-Bit Chunk
1.1  mrg     wmov  C2,A6  $  wmov C0,A4
1.1  mrg     wmov  A6,A2  $  wmov A4,A0
1.1  mrg     wmov  A2,C6  $  wmov A0,C4
1.1  mrg
1.1  mrg     ;; Set Bit Counter to 32
1.1  mrg     lsr     R_cnt
1.1  mrg 2:
1.1  mrg #elif SPEED_DIV
1.1  mrg #error SPEED_DIV = ?
1.1  mrg #endif /* SPEED_DIV */
1.1  mrg
1.1  mrg ;; The very Division + Remainder Routine
1.1  mrg
1.1  mrg 3:  ;; Left-shift Dividend...
1.1  mrg     lsl A0     $  rol A1     $  rol A2     $  rol A3
1.1  mrg     rol A4     $  rol A5     $  rol A6     $  rol A7
1.1  mrg
1.1  mrg     ;; ...into Remainder
1.1  mrg     rol C0     $  rol C1     $  rol C2     $  rol C3
1.1  mrg     rol C4     $  rol C5     $  rol C6     $  rol C7
1.1  mrg
1.1  mrg     ;; Compare Remainder and Divisor
1.1  mrg     CP  C0,B0  $  cpc C1,B1  $  cpc C2,B2  $  cpc C3,B3
1.1  mrg     cpc C4,B4  $  cpc C5,B5  $  cpc C6,B6  $  cpc C7,B7
1.1  mrg
1.1  mrg     brcs 4f
1.1  mrg
1.1  mrg     ;; Divisor fits into Remainder:  Subtract it from Remainder...
1.1  mrg     SUB C0,B0  $  sbc C1,B1  $  sbc C2,B2  $  sbc C3,B3
1.1  mrg     sbc C4,B4  $  sbc C5,B5  $  sbc C6,B6  $  sbc C7,B7
1.1  mrg
1.1  mrg     ;; ...and set according Bit in the upcoming Quotient
1.1  mrg     ;; The Bit will travel to its final Position
1.1  mrg     ori A0, 1
1.1  mrg
1.1  mrg 4:  ;; This Bit is done
1.1  mrg     dec     R_cnt
1.1  mrg     brne    3b
1.1  mrg     ;; __zero_reg__ is 0 again
1.1  mrg
1.1  mrg     ;; T = 0: We are fine with the Quotient in A[]
1.1  mrg     ;; T = 1: Copy Remainder to A[]
1.1  mrg 5:  brtc    6f
1.1  mrg     wmov    A0, C0
1.1  mrg     wmov    A2, C2
1.1  mrg     wmov    A4, C4
1.1  mrg     wmov    A6, C6
1.1  mrg     ;; Move the Sign of the Result to SS.7
1.1  mrg     lsl     SS
1.1  mrg
1.1  mrg 6:  ret
1.1  mrg
1.1  mrg ENDF __udivmod64
1.1  mrg #endif /* L_udivmod64 */
1.1  mrg
1.1  mrg
1.1  mrg #if defined (L_divdi3)
1.1  mrg
1.1  mrg ;; R25:R18 = R24:R18  mod  R17:R10
1.1  mrg ;; Ordinary ABI-Function
1.1  mrg
1.1  mrg DEFUN __moddi3
1.1  mrg     set
1.1  mrg     rjmp    __divdi3_moddi3
1.1  mrg ENDF __moddi3
1.1  mrg
1.1  mrg ;; R25:R18 = R24:R18  div  R17:R10
1.1  mrg ;; Ordinary ABI-Function
1.1  mrg
1.1  mrg DEFUN __divdi3
1.1  mrg     clt
1.1  mrg ENDF __divdi3
1.1  mrg
1.1  mrg DEFUN  __divdi3_moddi3
1.1  mrg #if SPEED_DIV
1.1  mrg     mov     r31, A7
1.1  mrg     or      r31, B7
1.1  mrg     brmi    0f
1.1  mrg     ;; Both Signs are 0:  the following Complexitiy is not needed
1.1  mrg     XJMP    __udivdi3_umoddi3
1.1  mrg #endif /* SPEED_DIV */
1.1  mrg
1.1  mrg 0:  ;; The Prologue
1.1  mrg     ;; Save 12 Registers:  Y, 17...8
1.1  mrg     ;; No Frame needed
1.1  mrg     do_prologue_saves 12
1.1  mrg
1.1  mrg     ;; SS.7 will contain the Sign of the Quotient  (A.sign * B.sign)
1.1  mrg     ;; SS.6 will contain the Sign of the Remainder (A.sign)
1.1  mrg     mov     SS, A7
1.1  mrg     asr     SS
1.1  mrg     ;; Adjust Dividend's Sign as needed
1.1  mrg #if SPEED_DIV
1.1  mrg     ;; Compiling for Speed we know that at least one Sign must be < 0
1.1  mrg     ;; Thus, if A[] >= 0 then we know B[] < 0
1.1  mrg     brpl    22f
1.1  mrg #else
1.1  mrg     brpl    21f
1.1  mrg #endif /* SPEED_DIV */
1.1  mrg
1.1  mrg     XCALL   __negdi2
1.1  mrg
1.1  mrg     ;; Adjust Divisor's Sign and SS.7 as needed
1.1  mrg 21: tst     B7
1.1  mrg     brpl    3f
1.1  mrg 22: ldi     NN, 1 << 7
1.1  mrg     eor     SS, NN
1.1  mrg
1.1  mrg     ldi NN, -1
1.1  mrg     com B4     $  com B5     $  com B6     $  com B7
1.1  mrg                $  com B1     $  com B2     $  com B3
1.1  mrg     NEG B0
1.1  mrg                $  sbc B1,NN  $  sbc B2,NN  $  sbc B3,NN
1.1  mrg     sbc B4,NN  $  sbc B5,NN  $  sbc B6,NN  $  sbc B7,NN
1.1  mrg
1.1  mrg 3:  ;; Do the unsigned 64-Bit Division/Modulo (depending on T-flag)
1.1  mrg     XCALL   __udivmod64
1.1  mrg
1.1  mrg     ;; Adjust Result's Sign
1.1  mrg #ifdef __AVR_ERRATA_SKIP_JMP_CALL__
1.1  mrg     tst     SS
1.1  mrg     brpl    4f
1.1  mrg #else
1.1  mrg     sbrc    SS, 7
1.1  mrg #endif /* __AVR_HAVE_JMP_CALL__ */
1.1  mrg     XCALL   __negdi2
1.1  mrg
1.1  mrg 4:  ;; Epilogue: Restore 12 Registers and return
1.1  mrg     do_epilogue_restores 12
1.1  mrg
1.1  mrg ENDF __divdi3_moddi3
1.1  mrg
1.1  mrg #endif /* L_divdi3 */
1.1  mrg
1.1  mrg #undef R_cnt
1.1  mrg #undef SS
1.1  mrg #undef NN
1.1  mrg
1.1  mrg .section .text.libgcc, "ax", @progbits
1.1  mrg
1.1  mrg #define TT __tmp_reg__
1.1  mrg
1.1  mrg #if defined (L_adddi3)
1.1  mrg ;; (set (reg:DI 18)
1.1  mrg ;;      (plus:DI (reg:DI 18)
1.1  mrg ;;               (reg:DI 10)))
1.1  mrg ;; Sets the V flag for signed overflow tests
1.1  mrg ;; Sets the C flag for unsigned overflow tests
1.1  mrg DEFUN __adddi3
1.1  mrg     ADD A0,B0  $  adc A1,B1  $  adc A2,B2  $  adc A3,B3
1.1  mrg     adc A4,B4  $  adc A5,B5  $  adc A6,B6  $  adc A7,B7
1.1  mrg     ret
1.1  mrg ENDF __adddi3
1.1  mrg #endif /* L_adddi3 */
1.1  mrg
1.1  mrg #if defined (L_adddi3_s8)
1.1  mrg ;; (set (reg:DI 18)
1.1  mrg ;;      (plus:DI (reg:DI 18)
1.1  mrg ;;               (sign_extend:SI (reg:QI 26))))
1.1  mrg ;; Sets the V flag for signed overflow tests
1.1  mrg ;; Sets the C flag for unsigned overflow tests provided 0 <= R26 < 128
1.1  mrg DEFUN __adddi3_s8
1.1  mrg     clr     TT
1.1  mrg     sbrc    r26, 7
1.1  mrg     com     TT
1.1  mrg     ADD A0,r26 $  adc A1,TT  $  adc A2,TT  $  adc A3,TT
1.1  mrg     adc A4,TT  $  adc A5,TT  $  adc A6,TT  $  adc A7,TT
1.1  mrg     ret
1.1  mrg ENDF __adddi3_s8
1.1  mrg #endif /* L_adddi3_s8 */
1.1  mrg
1.1  mrg #if defined (L_subdi3)
1.1  mrg ;; (set (reg:DI 18)
1.1  mrg ;;      (minus:DI (reg:DI 18)
1.1  mrg ;;                (reg:DI 10)))
1.1  mrg ;; Sets the V flag for signed overflow tests
1.1  mrg ;; Sets the C flag for unsigned overflow tests
1.1  mrg DEFUN __subdi3
1.1  mrg     SUB A0,B0  $  sbc A1,B1  $  sbc A2,B2  $  sbc A3,B3
1.1  mrg     sbc A4,B4  $  sbc A5,B5  $  sbc A6,B6  $  sbc A7,B7
1.1  mrg     ret
1.1  mrg ENDF __subdi3
1.1  mrg #endif /* L_subdi3 */
1.1  mrg
1.1  mrg #if defined (L_cmpdi2)
1.1  mrg ;; (set (cc0)
1.1  mrg ;;      (compare (reg:DI 18)
1.1  mrg ;;               (reg:DI 10)))
1.1  mrg DEFUN __cmpdi2
1.1  mrg     CP  A0,B0  $  cpc A1,B1  $  cpc A2,B2  $  cpc A3,B3
1.1  mrg     cpc A4,B4  $  cpc A5,B5  $  cpc A6,B6  $  cpc A7,B7
1.1  mrg     ret
1.1  mrg ENDF __cmpdi2
1.1  mrg #endif /* L_cmpdi2 */
1.1  mrg
1.1  mrg #if defined (L_cmpdi2_s8)
1.1  mrg ;; (set (cc0)
1.1  mrg ;;      (compare (reg:DI 18)
1.1  mrg ;;               (sign_extend:SI (reg:QI 26))))
1.1  mrg DEFUN __cmpdi2_s8
1.1  mrg     clr     TT
1.1  mrg     sbrc    r26, 7
1.1  mrg     com     TT
1.1  mrg     CP  A0,r26 $  cpc A1,TT  $  cpc A2,TT  $  cpc A3,TT
1.1  mrg     cpc A4,TT  $  cpc A5,TT  $  cpc A6,TT  $  cpc A7,TT
1.1  mrg     ret
1.1  mrg ENDF __cmpdi2_s8
1.1  mrg #endif /* L_cmpdi2_s8 */
1.1  mrg
1.1  mrg #if defined (L_negdi2)
1.1  mrg ;; (set (reg:DI 18)
1.1  mrg ;;      (neg:DI (reg:DI 18)))
1.1  mrg ;; Sets the V flag for signed overflow tests
1.1  mrg DEFUN __negdi2
1.1  mrg
1.1  mrg     com  A4    $  com  A5    $  com  A6    $  com  A7
1.1  mrg                $  com  A1    $  com  A2    $  com  A3
1.1  mrg     NEG  A0
1.1  mrg                $  sbci A1,-1 $  sbci A2,-1 $  sbci A3,-1
1.1  mrg     sbci A4,-1 $  sbci A5,-1 $  sbci A6,-1 $  sbci A7,-1
1.1  mrg     ret
1.1  mrg
1.1  mrg ENDF __negdi2
1.1  mrg #endif /* L_negdi2 */
1.1  mrg
1.1  mrg #undef TT
1.1  mrg
1.1  mrg #undef C7
1.1  mrg #undef C6
1.1  mrg #undef C5
1.1  mrg #undef C4
1.1  mrg #undef C3
1.1  mrg #undef C2
1.1  mrg #undef C1
1.1  mrg #undef C0
1.1  mrg
1.1  mrg #undef B7
1.1  mrg #undef B6
1.1  mrg #undef B5
1.1  mrg #undef B4
1.1  mrg #undef B3
1.1  mrg #undef B2
1.1  mrg #undef B1
1.1  mrg #undef B0
1.1  mrg
1.1  mrg #undef A7
1.1  mrg #undef A6
1.1  mrg #undef A5
1.1  mrg #undef A4
1.1  mrg #undef A3
1.1  mrg #undef A2
1.1  mrg #undef A1
1.1  mrg #undef A0
1.1  mrg
1.1  mrg
1.1  mrg .section .text.libgcc.prologue, "ax", @progbits
1.1  mrg
1.1  mrg /**********************************
1.1  mrg  * This is a prologue subroutine
1.1  mrg  **********************************/
1.1  mrg #if defined (L_prologue)
1.1  mrg
1.1  mrg ;; This function does not clobber T-flag; 64-bit division relies on it
1.1  mrg DEFUN __prologue_saves__
1.1  mrg 	push r2
1.1  mrg 	push r3
1.1  mrg 	push r4
1.1  mrg 	push r5
1.1  mrg 	push r6
1.1  mrg 	push r7
1.1  mrg 	push r8
1.1  mrg 	push r9
1.1  mrg 	push r10
1.1  mrg 	push r11
1.1  mrg 	push r12
1.1  mrg 	push r13
1.1  mrg 	push r14
1.1  mrg 	push r15
1.1  mrg 	push r16
1.1  mrg 	push r17
1.1  mrg 	push r28
1.1  mrg 	push r29
1.1  mrg #if !defined (__AVR_HAVE_SPH__)
1.1  mrg 	in	r28,__SP_L__
1.1  mrg 	sub	r28,r26
1.1  mrg 	out	__SP_L__,r28
1.1  mrg 	clr	r29
1.1  mrg #elif defined (__AVR_XMEGA__)
1.1  mrg 	in	r28,__SP_L__
1.1  mrg 	in	r29,__SP_H__
1.1  mrg 	sub	r28,r26
1.1  mrg 	sbc	r29,r27
1.1  mrg 	out	__SP_L__,r28
1.1  mrg 	out	__SP_H__,r29
1.1  mrg #else
1.1  mrg 	in	r28,__SP_L__
1.1  mrg 	in	r29,__SP_H__
1.1  mrg 	sub	r28,r26
1.1  mrg 	sbc	r29,r27
1.1  mrg 	in	__tmp_reg__,__SREG__
1.1  mrg 	cli
1.1  mrg 	out	__SP_H__,r29
1.1  mrg 	out	__SREG__,__tmp_reg__
1.1  mrg 	out	__SP_L__,r28
1.1  mrg #endif /* #SP = 8/16 */
1.1  mrg
1.1  mrg #if defined (__AVR_HAVE_EIJMP_EICALL__)
1.1  mrg 	eijmp
1.1  mrg #else
1.1  mrg 	ijmp
1.1  mrg #endif
1.1  mrg
1.1  mrg ENDF __prologue_saves__
1.1  mrg #endif /* defined (L_prologue) */
1.1  mrg
1.1  mrg /*
1.1  mrg  * This is an epilogue subroutine
1.1  mrg  */
1.1  mrg #if defined (L_epilogue)
1.1  mrg
1.1  mrg DEFUN __epilogue_restores__
1.1  mrg 	ldd	r2,Y+18
1.1  mrg 	ldd	r3,Y+17
1.1  mrg 	ldd	r4,Y+16
1.1  mrg 	ldd	r5,Y+15
1.1  mrg 	ldd	r6,Y+14
1.1  mrg 	ldd	r7,Y+13
1.1  mrg 	ldd	r8,Y+12
1.1  mrg 	ldd	r9,Y+11
1.1  mrg 	ldd	r10,Y+10
1.1  mrg 	ldd	r11,Y+9
1.1  mrg 	ldd	r12,Y+8
1.1  mrg 	ldd	r13,Y+7
1.1  mrg 	ldd	r14,Y+6
1.1  mrg 	ldd	r15,Y+5
1.1  mrg 	ldd	r16,Y+4
1.1  mrg 	ldd	r17,Y+3
1.1  mrg 	ldd	r26,Y+2
1.1  mrg #if !defined (__AVR_HAVE_SPH__)
1.1  mrg 	ldd	r29,Y+1
1.1  mrg 	add	r28,r30
1.1  mrg 	out	__SP_L__,r28
1.1  mrg 	mov	r28, r26
1.1  mrg #elif defined (__AVR_XMEGA__)
1.1  mrg 	ldd  r27,Y+1
1.1  mrg 	add  r28,r30
1.1  mrg 	adc  r29,__zero_reg__
1.1  mrg 	out  __SP_L__,r28
1.1  mrg 	out  __SP_H__,r29
1.1  mrg 	wmov 28, 26
1.1  mrg #else
1.1  mrg 	ldd	r27,Y+1
1.1  mrg 	add	r28,r30
1.1  mrg 	adc	r29,__zero_reg__
1.1  mrg 	in	__tmp_reg__,__SREG__
1.1  mrg 	cli
1.1  mrg 	out	__SP_H__,r29
1.1  mrg 	out	__SREG__,__tmp_reg__
1.1  mrg 	out	__SP_L__,r28
1.1  mrg 	mov_l	r28, r26
1.1  mrg 	mov_h	r29, r27
1.1  mrg #endif /* #SP = 8/16 */
1.1  mrg 	ret
1.1  mrg ENDF __epilogue_restores__
1.1  mrg #endif /* defined (L_epilogue) */
1.1  mrg
1.1  mrg #ifdef L_exit
1.1  mrg 	.section .fini9,"ax",@progbits
1.1  mrg DEFUN _exit
1.1  mrg 	.weak	exit
1.1  mrg exit:
1.1  mrg ENDF _exit
1.1  mrg
1.1  mrg 	/* Code from .fini8 ... .fini1 sections inserted by ld script.  */
1.1  mrg
1.1  mrg 	.section .fini0,"ax",@progbits
1.1  mrg 	cli
1.1  mrg __stop_program:
1.1  mrg 	rjmp	__stop_program
1.1  mrg #endif /* defined (L_exit) */
1.1  mrg
1.1  mrg #ifdef L_cleanup
1.1  mrg 	.weak	_cleanup
1.1  mrg 	.func	_cleanup
1.1  mrg _cleanup:
1.1  mrg 	ret
1.1  mrg .endfunc
1.1  mrg #endif /* defined (L_cleanup) */
1.1  mrg
1.1  mrg
1.1  mrg .section .text.libgcc, "ax", @progbits
1.1  mrg
1.1  mrg #ifdef L_tablejump
1.1  mrg DEFUN __tablejump2__
1.1  mrg 	lsl	r30
1.1  mrg 	rol	r31
1.1  mrg     ;; FALLTHRU
1.1  mrg ENDF __tablejump2__
1.1  mrg
1.1  mrg DEFUN __tablejump__
1.1  mrg #if defined (__AVR_HAVE_LPMX__)
1.1  mrg 	lpm __tmp_reg__, Z+
1.1  mrg 	lpm r31, Z
1.1  mrg 	mov r30, __tmp_reg__
1.1  mrg #if defined (__AVR_HAVE_EIJMP_EICALL__)
1.1  mrg 	eijmp
1.1  mrg #else
1.1  mrg 	ijmp
1.1  mrg #endif
1.1  mrg
1.1  mrg #else /* !HAVE_LPMX */
1.1  mrg 	lpm
1.1  mrg 	adiw r30, 1
1.1  mrg 	push r0
1.1  mrg 	lpm
1.1  mrg 	push r0
1.1  mrg #if defined (__AVR_HAVE_EIJMP_EICALL__)
1.1  mrg 	in   __tmp_reg__, __EIND__
1.1  mrg 	push __tmp_reg__
1.1  mrg #endif
1.1  mrg 	ret
1.1  mrg #endif /* !HAVE_LPMX */
1.1  mrg ENDF __tablejump__
1.1  mrg #endif /* defined (L_tablejump) */
1.1  mrg
1.1  mrg #ifdef L_copy_data
1.1  mrg 	.section .init4,"ax",@progbits
1.1  mrg DEFUN __do_copy_data
1.1  mrg #if defined(__AVR_HAVE_ELPMX__)
1.1  mrg 	ldi	r17, hi8(__data_end)
1.1  mrg 	ldi	r26, lo8(__data_start)
1.1  mrg 	ldi	r27, hi8(__data_start)
1.1  mrg 	ldi	r30, lo8(__data_load_start)
1.1  mrg 	ldi	r31, hi8(__data_load_start)
1.1  mrg 	ldi	r16, hh8(__data_load_start)
1.1  mrg 	out	__RAMPZ__, r16
1.1  mrg 	rjmp	.L__do_copy_data_start
1.1  mrg .L__do_copy_data_loop:
1.1  mrg 	elpm	r0, Z+
1.1  mrg 	st	X+, r0
1.1  mrg .L__do_copy_data_start:
1.1  mrg 	cpi	r26, lo8(__data_end)
1.1  mrg 	cpc	r27, r17
1.1  mrg 	brne	.L__do_copy_data_loop
1.1  mrg #elif  !defined(__AVR_HAVE_ELPMX__) && defined(__AVR_HAVE_ELPM__)
1.1  mrg 	ldi	r17, hi8(__data_end)
1.1  mrg 	ldi	r26, lo8(__data_start)
1.1  mrg 	ldi	r27, hi8(__data_start)
1.1  mrg 	ldi	r30, lo8(__data_load_start)
1.1  mrg 	ldi	r31, hi8(__data_load_start)
1.1  mrg 	ldi	r16, hh8(__data_load_start - 0x10000)
1.1  mrg .L__do_copy_data_carry:
1.1  mrg 	inc	r16
1.1  mrg 	out	__RAMPZ__, r16
1.1  mrg 	rjmp	.L__do_copy_data_start
1.1  mrg .L__do_copy_data_loop:
1.1  mrg 	elpm
1.1  mrg 	st	X+, r0
1.1  mrg 	adiw	r30, 1
1.1  mrg 	brcs	.L__do_copy_data_carry
1.1  mrg .L__do_copy_data_start:
1.1  mrg 	cpi	r26, lo8(__data_end)
1.1  mrg 	cpc	r27, r17
1.1  mrg 	brne	.L__do_copy_data_loop
1.1  mrg #elif !defined(__AVR_HAVE_ELPMX__) && !defined(__AVR_HAVE_ELPM__)
1.1  mrg 	ldi	r17, hi8(__data_end)
1.1  mrg 	ldi	r26, lo8(__data_start)
1.1  mrg 	ldi	r27, hi8(__data_start)
1.1  mrg 	ldi	r30, lo8(__data_load_start)
1.1  mrg 	ldi	r31, hi8(__data_load_start)
1.1  mrg 	rjmp	.L__do_copy_data_start
1.1  mrg .L__do_copy_data_loop:
1.1  mrg #if defined (__AVR_HAVE_LPMX__)
1.1  mrg 	lpm	r0, Z+
1.1  mrg #else
1.1  mrg 	lpm
1.1  mrg 	adiw	r30, 1
1.1  mrg #endif
1.1  mrg 	st	X+, r0
1.1  mrg .L__do_copy_data_start:
1.1  mrg 	cpi	r26, lo8(__data_end)
1.1  mrg 	cpc	r27, r17
1.1  mrg 	brne	.L__do_copy_data_loop
1.1  mrg #endif /* !defined(__AVR_HAVE_ELPMX__) && !defined(__AVR_HAVE_ELPM__) */
1.1  mrg #if defined (__AVR_HAVE_ELPM__) && defined (__AVR_HAVE_RAMPD__)
1.1  mrg 	;; Reset RAMPZ to 0 so that EBI devices don't read garbage from RAM
1.1  mrg 	out	__RAMPZ__, __zero_reg__
1.1  mrg #endif /* ELPM && RAMPD */
1.1  mrg ENDF __do_copy_data
1.1  mrg #endif /* L_copy_data */
1.1  mrg
1.1  mrg /* __do_clear_bss is only necessary if there is anything in .bss section.  */
1.1  mrg
1.1  mrg #ifdef L_clear_bss
1.1  mrg 	.section .init4,"ax",@progbits
1.1  mrg DEFUN __do_clear_bss
1.1  mrg 	ldi	r17, hi8(__bss_end)
1.1  mrg 	ldi	r26, lo8(__bss_start)
1.1  mrg 	ldi	r27, hi8(__bss_start)
1.1  mrg 	rjmp	.do_clear_bss_start
1.1  mrg .do_clear_bss_loop:
1.1  mrg 	st	X+, __zero_reg__
1.1  mrg .do_clear_bss_start:
1.1  mrg 	cpi	r26, lo8(__bss_end)
1.1  mrg 	cpc	r27, r17
1.1  mrg 	brne	.do_clear_bss_loop
1.1  mrg ENDF __do_clear_bss
1.1  mrg #endif /* L_clear_bss */
1.1  mrg
1.1  mrg /* __do_global_ctors and __do_global_dtors are only necessary
1.1  mrg    if there are any constructors/destructors.  */
1.1  mrg
1.1  mrg #ifdef L_ctors
1.1  mrg 	.section .init6,"ax",@progbits
1.1  mrg DEFUN __do_global_ctors
1.1  mrg #if defined(__AVR_HAVE_ELPM__)
1.1  mrg 	ldi	r17, hi8(__ctors_start)
1.1  mrg 	ldi	r28, lo8(__ctors_end)
1.1  mrg 	ldi	r29, hi8(__ctors_end)
1.1  mrg 	ldi	r16, hh8(__ctors_end)
1.1  mrg 	rjmp	.L__do_global_ctors_start
1.1  mrg .L__do_global_ctors_loop:
1.1  mrg 	sbiw	r28, 2
1.1  mrg 	sbc     r16, __zero_reg__
1.1  mrg 	mov_h	r31, r29
1.1  mrg 	mov_l	r30, r28
1.1  mrg 	out     __RAMPZ__, r16
1.1  mrg 	XCALL	__tablejump_elpm__
1.1  mrg .L__do_global_ctors_start:
1.1  mrg 	cpi	r28, lo8(__ctors_start)
1.1  mrg 	cpc	r29, r17
1.1  mrg 	ldi	r24, hh8(__ctors_start)
1.1  mrg 	cpc	r16, r24
1.1  mrg 	brne	.L__do_global_ctors_loop
1.1  mrg #else
1.1  mrg 	ldi	r17, hi8(__ctors_start)
1.1  mrg 	ldi	r28, lo8(__ctors_end)
1.1  mrg 	ldi	r29, hi8(__ctors_end)
1.1  mrg 	rjmp	.L__do_global_ctors_start
1.1  mrg .L__do_global_ctors_loop:
1.1  mrg 	sbiw	r28, 2
1.1  mrg 	mov_h	r31, r29
1.1  mrg 	mov_l	r30, r28
1.1  mrg 	XCALL	__tablejump__
1.1  mrg .L__do_global_ctors_start:
1.1  mrg 	cpi	r28, lo8(__ctors_start)
1.1  mrg 	cpc	r29, r17
1.1  mrg 	brne	.L__do_global_ctors_loop
1.1  mrg #endif /* defined(__AVR_HAVE_ELPM__) */
1.1  mrg ENDF __do_global_ctors
1.1  mrg #endif /* L_ctors */
1.1  mrg
1.1  mrg #ifdef L_dtors
1.1  mrg 	.section .fini6,"ax",@progbits
1.1  mrg DEFUN __do_global_dtors
1.1  mrg #if defined(__AVR_HAVE_ELPM__)
1.1  mrg 	ldi	r17, hi8(__dtors_end)
1.1  mrg 	ldi	r28, lo8(__dtors_start)
1.1  mrg 	ldi	r29, hi8(__dtors_start)
1.1  mrg 	ldi	r16, hh8(__dtors_start)
1.1  mrg 	rjmp	.L__do_global_dtors_start
1.1  mrg .L__do_global_dtors_loop:
1.1  mrg 	sbiw	r28, 2
1.1  mrg 	sbc     r16, __zero_reg__
1.1  mrg 	mov_h	r31, r29
1.1  mrg 	mov_l	r30, r28
1.1  mrg 	out     __RAMPZ__, r16
1.1  mrg 	XCALL	__tablejump_elpm__
1.1  mrg .L__do_global_dtors_start:
1.1  mrg 	cpi	r28, lo8(__dtors_end)
1.1  mrg 	cpc	r29, r17
1.1  mrg 	ldi	r24, hh8(__dtors_end)
1.1  mrg 	cpc	r16, r24
1.1  mrg 	brne	.L__do_global_dtors_loop
1.1  mrg #else
1.1  mrg 	ldi	r17, hi8(__dtors_end)
1.1  mrg 	ldi	r28, lo8(__dtors_start)
1.1  mrg 	ldi	r29, hi8(__dtors_start)
1.1  mrg 	rjmp	.L__do_global_dtors_start
1.1  mrg .L__do_global_dtors_loop:
1.1  mrg 	mov_h	r31, r29
1.1  mrg 	mov_l	r30, r28
1.1  mrg 	XCALL	__tablejump__
1.1  mrg 	adiw	r28, 2
1.1  mrg .L__do_global_dtors_start:
1.1  mrg 	cpi	r28, lo8(__dtors_end)
1.1  mrg 	cpc	r29, r17
1.1  mrg 	brne	.L__do_global_dtors_loop
1.1  mrg #endif /* defined(__AVR_HAVE_ELPM__) */
1.1  mrg ENDF __do_global_dtors
1.1  mrg #endif /* L_dtors */
1.1  mrg
1.1  mrg .section .text.libgcc, "ax", @progbits
1.1  mrg
1.1  mrg #ifdef L_tablejump_elpm
1.1  mrg DEFUN __tablejump_elpm__
1.1  mrg #if defined (__AVR_HAVE_ELPMX__)
1.1  mrg 	elpm	__tmp_reg__, Z+
1.1  mrg 	elpm	r31, Z
1.1  mrg 	mov	r30, __tmp_reg__
1.1  mrg #if defined (__AVR_HAVE_RAMPD__)
1.1  mrg 	;; Reset RAMPZ to 0 so that EBI devices don't read garbage from RAM
1.1  mrg 	out	__RAMPZ__, __zero_reg__
1.1  mrg #endif /* RAMPD */
1.1  mrg #if defined (__AVR_HAVE_EIJMP_EICALL__)
1.1  mrg 	eijmp
1.1  mrg #else
1.1  mrg 	ijmp
1.1  mrg #endif
1.1  mrg
1.1  mrg #elif defined (__AVR_HAVE_ELPM__)
1.1  mrg 	elpm
1.1  mrg 	adiw	r30, 1
1.1  mrg 	push	r0
1.1  mrg 	elpm
1.1  mrg 	push	r0
1.1  mrg #if defined (__AVR_HAVE_EIJMP_EICALL__)
1.1  mrg 	in      __tmp_reg__, __EIND__
1.1  mrg 	push    __tmp_reg__
1.1  mrg #endif
1.1  mrg 	ret
1.1  mrg #endif
1.1  mrg ENDF __tablejump_elpm__
1.1  mrg #endif /* defined (L_tablejump_elpm) */
1.1  mrg
1.1  mrg ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
1.1  mrg ;; Loading n bytes from Flash; n = 3,4
1.1  mrg ;; R22... = Flash[Z]
1.1  mrg ;; Clobbers: __tmp_reg__
1.1  mrg
1.1  mrg #if (defined (L_load_3)        \
1.1  mrg      || defined (L_load_4))    \
1.1  mrg     && !defined (__AVR_HAVE_LPMX__)
1.1  mrg
1.1  mrg ;; Destination
1.1  mrg #define D0  22
1.1  mrg #define D1  D0+1
1.1  mrg #define D2  D0+2
1.1  mrg #define D3  D0+3
1.1  mrg
1.1  mrg .macro  .load dest, n
1.1  mrg     lpm
1.1  mrg     mov     \dest, r0
1.1  mrg .if \dest != D0+\n-1
1.1  mrg     adiw    r30, 1
1.1  mrg .else
1.1  mrg     sbiw    r30, \n-1
1.1  mrg .endif
1.1  mrg .endm
1.1  mrg
1.1  mrg #if defined (L_load_3)
1.1  mrg DEFUN __load_3
1.1  mrg     push  D3
1.1  mrg     XCALL __load_4
1.1  mrg     pop   D3
1.1  mrg     ret
1.1  mrg ENDF __load_3
1.1  mrg #endif /* L_load_3 */
1.1  mrg
1.1  mrg #if defined (L_load_4)
1.1  mrg DEFUN __load_4
1.1  mrg     .load D0, 4
1.1  mrg     .load D1, 4
1.1  mrg     .load D2, 4
1.1  mrg     .load D3, 4
1.1  mrg     ret
1.1  mrg ENDF __load_4
1.1  mrg #endif /* L_load_4 */
1.1  mrg
1.1  mrg #endif /* L_load_3 || L_load_3 */
1.1  mrg
1.1  mrg ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
1.1  mrg ;; Loading n bytes from Flash or RAM;  n = 1,2,3,4
1.1  mrg ;; R22... = Flash[R21:Z] or RAM[Z] depending on R21.7
1.1  mrg ;; Clobbers: __tmp_reg__, R21, R30, R31
1.1  mrg
1.1  mrg #if (defined (L_xload_1)            \
1.1  mrg      || defined (L_xload_2)         \
1.1  mrg      || defined (L_xload_3)         \
1.1  mrg      || defined (L_xload_4))
1.1  mrg
1.1  mrg ;; Destination
1.1  mrg #define D0  22
1.1  mrg #define D1  D0+1
1.1  mrg #define D2  D0+2
1.1  mrg #define D3  D0+3
1.1  mrg
1.1  mrg ;; Register containing bits 16+ of the address
1.1  mrg
1.1  mrg #define HHI8  21
1.1  mrg
1.1  mrg .macro  .xload dest, n
1.1  mrg #if defined (__AVR_HAVE_ELPMX__)
1.1  mrg     elpm    \dest, Z+
1.1  mrg #elif defined (__AVR_HAVE_ELPM__)
1.1  mrg     elpm
1.1  mrg     mov     \dest, r0
1.1  mrg .if \dest != D0+\n-1
1.1  mrg     adiw    r30, 1
1.1  mrg     adc     HHI8, __zero_reg__
1.1  mrg     out     __RAMPZ__, HHI8
1.1  mrg .endif
1.1  mrg #elif defined (__AVR_HAVE_LPMX__)
1.1  mrg     lpm     \dest, Z+
1.1  mrg #else
1.1  mrg     lpm
1.1  mrg     mov     \dest, r0
1.1  mrg .if \dest != D0+\n-1
1.1  mrg     adiw    r30, 1
1.1  mrg .endif
1.1  mrg #endif
1.1  mrg #if defined (__AVR_HAVE_ELPM__) && defined (__AVR_HAVE_RAMPD__)
1.1  mrg .if \dest == D0+\n-1
1.1  mrg     ;; Reset RAMPZ to 0 so that EBI devices don't read garbage from RAM
1.1  mrg     out     __RAMPZ__, __zero_reg__
1.1  mrg .endif
1.1  mrg #endif
1.1  mrg .endm ; .xload
1.1  mrg
1.1  mrg #if defined (L_xload_1)
1.1  mrg DEFUN __xload_1
1.1  mrg #if defined (__AVR_HAVE_LPMX__) && !defined (__AVR_HAVE_ELPM__)
1.1  mrg     sbrc    HHI8, 7
1.1  mrg     ld      D0, Z
1.1  mrg     sbrs    HHI8, 7
1.1  mrg     lpm     D0, Z
1.1  mrg     ret
1.1  mrg #else
1.1  mrg     sbrc    HHI8, 7
1.1  mrg     rjmp    1f
1.1  mrg #if defined (__AVR_HAVE_ELPM__)
1.1  mrg     out     __RAMPZ__, HHI8
1.1  mrg #endif /* __AVR_HAVE_ELPM__ */
1.1  mrg     .xload  D0, 1
1.1  mrg     ret
1.1  mrg 1:  ld      D0, Z
1.1  mrg     ret
1.1  mrg #endif /* LPMx && ! ELPM */
1.1  mrg ENDF __xload_1
1.1  mrg #endif /* L_xload_1 */
1.1  mrg
1.1  mrg #if defined (L_xload_2)
1.1  mrg DEFUN __xload_2
1.1  mrg     sbrc    HHI8, 7
1.1  mrg     rjmp    1f
1.1  mrg #if defined (__AVR_HAVE_ELPM__)
1.1  mrg     out     __RAMPZ__, HHI8
1.1  mrg #endif /* __AVR_HAVE_ELPM__ */
1.1  mrg     .xload  D0, 2
1.1  mrg     .xload  D1, 2
1.1  mrg     ret
1.1  mrg 1:  ld      D0, Z+
1.1  mrg     ld      D1, Z+
1.1  mrg     ret
1.1  mrg ENDF __xload_2
1.1  mrg #endif /* L_xload_2 */
1.1  mrg
1.1  mrg #if defined (L_xload_3)
1.1  mrg DEFUN __xload_3
1.1  mrg     sbrc    HHI8, 7
1.1  mrg     rjmp    1f
1.1  mrg #if defined (__AVR_HAVE_ELPM__)
1.1  mrg     out     __RAMPZ__, HHI8
1.1  mrg #endif /* __AVR_HAVE_ELPM__ */
1.1  mrg     .xload  D0, 3
1.1  mrg     .xload  D1, 3
1.1  mrg     .xload  D2, 3
1.1  mrg     ret
1.1  mrg 1:  ld      D0, Z+
1.1  mrg     ld      D1, Z+
1.1  mrg     ld      D2, Z+
1.1  mrg     ret
1.1  mrg ENDF __xload_3
1.1  mrg #endif /* L_xload_3 */
1.1  mrg
1.1  mrg #if defined (L_xload_4)
1.1  mrg DEFUN __xload_4
1.1  mrg     sbrc    HHI8, 7
1.1  mrg     rjmp    1f
1.1  mrg #if defined (__AVR_HAVE_ELPM__)
1.1  mrg     out     __RAMPZ__, HHI8
1.1  mrg #endif /* __AVR_HAVE_ELPM__ */
1.1  mrg     .xload  D0, 4
1.1  mrg     .xload  D1, 4
1.1  mrg     .xload  D2, 4
1.1  mrg     .xload  D3, 4
1.1  mrg     ret
1.1  mrg 1:  ld      D0, Z+
1.1  mrg     ld      D1, Z+
1.1  mrg     ld      D2, Z+
1.1  mrg     ld      D3, Z+
1.1  mrg     ret
1.1  mrg ENDF __xload_4
1.1  mrg #endif /* L_xload_4 */
1.1  mrg
1.1  mrg #endif /* L_xload_{1|2|3|4} */
1.1  mrg
1.1  mrg ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
1.1  mrg ;; memcopy from Address Space __pgmx to RAM
1.1  mrg ;; R23:Z = Source Address
1.1  mrg ;; X     = Destination Address
1.1  mrg ;; Clobbers: __tmp_reg__, R23, R24, R25, X, Z
1.1  mrg
1.1  mrg #if defined (L_movmemx)
1.1  mrg
1.1  mrg #define HHI8  23
1.1  mrg #define LOOP  24
1.1  mrg
1.1  mrg DEFUN __movmemx_qi
1.1  mrg     ;; #Bytes to copy fity in 8 Bits (1..255)
1.1  mrg     ;; Zero-extend Loop Counter
1.1  mrg     clr     LOOP+1
1.1  mrg     ;; FALLTHRU
1.1  mrg ENDF __movmemx_qi
1.1  mrg
1.1  mrg DEFUN __movmemx_hi
1.1  mrg
1.1  mrg ;; Read from where?
1.1  mrg     sbrc    HHI8, 7
1.1  mrg     rjmp    1f
1.1  mrg
1.1  mrg ;; Read from Flash
1.1  mrg
1.1  mrg #if defined (__AVR_HAVE_ELPM__)
1.1  mrg     out     __RAMPZ__, HHI8
1.1  mrg #endif
1.1  mrg
1.1  mrg 0:  ;; Load 1 Byte from Flash...
1.1  mrg
1.1  mrg #if defined (__AVR_HAVE_ELPMX__)
1.1  mrg     elpm    r0, Z+
1.1  mrg #elif defined (__AVR_HAVE_ELPM__)
1.1  mrg     elpm
1.1  mrg     adiw    r30, 1
1.1  mrg     adc     HHI8, __zero_reg__
1.1  mrg     out     __RAMPZ__, HHI8
1.1  mrg #elif defined (__AVR_HAVE_LPMX__)
1.1  mrg     lpm     r0, Z+
1.1  mrg #else
1.1  mrg     lpm
1.1  mrg     adiw    r30, 1
1.1  mrg #endif
1.1  mrg
1.1  mrg     ;; ...and store that Byte to RAM Destination
1.1  mrg     st      X+, r0
1.1  mrg     sbiw    LOOP, 1
1.1  mrg     brne    0b
1.1  mrg #if defined (__AVR_HAVE_ELPM__) && defined (__AVR_HAVE_RAMPD__)
1.1  mrg     ;; Reset RAMPZ to 0 so that EBI devices don't read garbage from RAM
1.1  mrg     out	__RAMPZ__, __zero_reg__
1.1  mrg #endif /* ELPM && RAMPD */
1.1  mrg     ret
1.1  mrg
1.1  mrg ;; Read from RAM
1.1  mrg
1.1  mrg 1:  ;; Read 1 Byte from RAM...
1.1  mrg     ld      r0, Z+
1.1  mrg     ;; and store that Byte to RAM Destination
1.1  mrg     st      X+, r0
1.1  mrg     sbiw    LOOP, 1
1.1  mrg     brne    1b
1.1  mrg     ret
1.1  mrg ENDF __movmemx_hi
1.1  mrg
1.1  mrg #undef HHI8
1.1  mrg #undef LOOP
1.1  mrg
1.1  mrg #endif /* L_movmemx */
1.1  mrg
1.1  mrg
1.1  mrg .section .text.libgcc.builtins, "ax", @progbits
1.1  mrg
1.1  mrg /**********************************
1.1  mrg  * Find first set Bit (ffs)
1.1  mrg  **********************************/
1.1  mrg
1.1  mrg #if defined (L_ffssi2)
1.1  mrg ;; find first set bit
1.1  mrg ;; r25:r24 = ffs32 (r25:r22)
1.1  mrg ;; clobbers: r22, r26
1.1  mrg DEFUN __ffssi2
1.1  mrg     clr  r26
1.1  mrg     tst  r22
1.1  mrg     brne 1f
1.1  mrg     subi r26, -8
1.1  mrg     or   r22, r23
1.1  mrg     brne 1f
1.1  mrg     subi r26, -8
1.1  mrg     or   r22, r24
1.1  mrg     brne 1f
1.1  mrg     subi r26, -8
1.1  mrg     or   r22, r25
1.1  mrg     brne 1f
1.1  mrg     ret
1.1  mrg 1:  mov  r24, r22
1.1  mrg     XJMP __loop_ffsqi2
1.1  mrg ENDF __ffssi2
1.1  mrg #endif /* defined (L_ffssi2) */
1.1  mrg
1.1  mrg #if defined (L_ffshi2)
1.1  mrg ;; find first set bit
1.1  mrg ;; r25:r24 = ffs16 (r25:r24)
1.1  mrg ;; clobbers: r26
1.1  mrg DEFUN __ffshi2
1.1  mrg     clr  r26
1.1  mrg #ifdef __AVR_ERRATA_SKIP_JMP_CALL__
1.1  mrg     ;; Some cores have problem skipping 2-word instruction
1.1  mrg     tst  r24
1.1  mrg     breq 2f
1.1  mrg #else
1.1  mrg     cpse r24, __zero_reg__
1.1  mrg #endif /* __AVR_HAVE_JMP_CALL__ */
1.1  mrg 1:  XJMP __loop_ffsqi2
1.1  mrg 2:  ldi  r26, 8
1.1  mrg     or   r24, r25
1.1  mrg     brne 1b
1.1  mrg     ret
1.1  mrg ENDF __ffshi2
1.1  mrg #endif /* defined (L_ffshi2) */
1.1  mrg
1.1  mrg #if defined (L_loop_ffsqi2)
1.1  mrg ;; Helper for ffshi2, ffssi2
1.1  mrg ;; r25:r24 = r26 + zero_extend16 (ffs8(r24))
1.1  mrg ;; r24 must be != 0
1.1  mrg ;; clobbers: r26
1.1  mrg DEFUN __loop_ffsqi2
1.1  mrg     inc  r26
1.1  mrg     lsr  r24
1.1  mrg     brcc __loop_ffsqi2
1.1  mrg     mov  r24, r26
1.1  mrg     clr  r25
1.1  mrg     ret
1.1  mrg ENDF __loop_ffsqi2
1.1  mrg #endif /* defined (L_loop_ffsqi2) */
1.1  mrg
1.1  mrg
1.1  mrg /**********************************
1.1  mrg  * Count trailing Zeros (ctz)
1.1  mrg  **********************************/
1.1  mrg
1.1  mrg #if defined (L_ctzsi2)
1.1  mrg ;; count trailing zeros
1.1  mrg ;; r25:r24 = ctz32 (r25:r22)
1.1  mrg ;; clobbers: r26, r22
1.1  mrg ;; ctz(0) = 255
1.1  mrg ;; Note that ctz(0) in undefined for GCC
1.1  mrg DEFUN __ctzsi2
1.1  mrg     XCALL __ffssi2
1.1  mrg     dec  r24
1.1  mrg     ret
1.1  mrg ENDF __ctzsi2
1.1  mrg #endif /* defined (L_ctzsi2) */
1.1  mrg
1.1  mrg #if defined (L_ctzhi2)
1.1  mrg ;; count trailing zeros
1.1  mrg ;; r25:r24 = ctz16 (r25:r24)
1.1  mrg ;; clobbers: r26
1.1  mrg ;; ctz(0) = 255
1.1  mrg ;; Note that ctz(0) in undefined for GCC
1.1  mrg DEFUN __ctzhi2
1.1  mrg     XCALL __ffshi2
1.1  mrg     dec  r24
1.1  mrg     ret
1.1  mrg ENDF __ctzhi2
1.1  mrg #endif /* defined (L_ctzhi2) */
1.1  mrg
1.1  mrg
1.1  mrg /**********************************
1.1  mrg  * Count leading Zeros (clz)
1.1  mrg  **********************************/
1.1  mrg
1.1  mrg #if defined (L_clzdi2)
1.1  mrg ;; count leading zeros
1.1  mrg ;; r25:r24 = clz64 (r25:r18)
1.1  mrg ;; clobbers: r22, r23, r26
1.1  mrg DEFUN __clzdi2
1.1  mrg     XCALL __clzsi2
1.1  mrg     sbrs r24, 5
1.1  mrg     ret
1.1  mrg     mov_l r22, r18
1.1  mrg     mov_h r23, r19
1.1  mrg     mov_l r24, r20
1.1  mrg     mov_h r25, r21
1.1  mrg     XCALL __clzsi2
1.1  mrg     subi r24, -32
1.1  mrg     ret
1.1  mrg ENDF __clzdi2
1.1  mrg #endif /* defined (L_clzdi2) */
1.1  mrg
1.1  mrg #if defined (L_clzsi2)
1.1  mrg ;; count leading zeros
1.1  mrg ;; r25:r24 = clz32 (r25:r22)
1.1  mrg ;; clobbers: r26
1.1  mrg DEFUN __clzsi2
1.1  mrg     XCALL __clzhi2
1.1  mrg     sbrs r24, 4
1.1  mrg     ret
1.1  mrg     mov_l r24, r22
1.1  mrg     mov_h r25, r23
1.1  mrg     XCALL __clzhi2
1.1  mrg     subi r24, -16
1.1  mrg     ret
1.1  mrg ENDF __clzsi2
1.1  mrg #endif /* defined (L_clzsi2) */
1.1  mrg
1.1  mrg #if defined (L_clzhi2)
1.1  mrg ;; count leading zeros
1.1  mrg ;; r25:r24 = clz16 (r25:r24)
1.1  mrg ;; clobbers: r26
1.1  mrg DEFUN __clzhi2
1.1  mrg     clr  r26
1.1  mrg     tst  r25
1.1  mrg     brne 1f
1.1  mrg     subi r26, -8
1.1  mrg     or   r25, r24
1.1  mrg     brne 1f
1.1  mrg     ldi  r24, 16
1.1  mrg     ret
1.1  mrg 1:  cpi  r25, 16
1.1  mrg     brsh 3f
1.1  mrg     subi r26, -3
1.1  mrg     swap r25
1.1  mrg 2:  inc  r26
1.1  mrg 3:  lsl  r25
1.1  mrg     brcc 2b
1.1  mrg     mov  r24, r26
1.1  mrg     clr  r25
1.1  mrg     ret
1.1  mrg ENDF __clzhi2
1.1  mrg #endif /* defined (L_clzhi2) */
1.1  mrg
1.1  mrg
1.1  mrg /**********************************
1.1  mrg  * Parity
1.1  mrg  **********************************/
1.1  mrg
1.1  mrg #if defined (L_paritydi2)
1.1  mrg ;; r25:r24 = parity64 (r25:r18)
1.1  mrg ;; clobbers: __tmp_reg__
1.1  mrg DEFUN __paritydi2
1.1  mrg     eor  r24, r18
1.1  mrg     eor  r24, r19
1.1  mrg     eor  r24, r20
1.1  mrg     eor  r24, r21
1.1  mrg     XJMP __paritysi2
1.1  mrg ENDF __paritydi2
1.1  mrg #endif /* defined (L_paritydi2) */
1.1  mrg
1.1  mrg #if defined (L_paritysi2)
1.1  mrg ;; r25:r24 = parity32 (r25:r22)
1.1  mrg ;; clobbers: __tmp_reg__
1.1  mrg DEFUN __paritysi2
1.1  mrg     eor  r24, r22
1.1  mrg     eor  r24, r23
1.1  mrg     XJMP __parityhi2
1.1  mrg ENDF __paritysi2
1.1  mrg #endif /* defined (L_paritysi2) */
1.1  mrg
1.1  mrg #if defined (L_parityhi2)
1.1  mrg ;; r25:r24 = parity16 (r25:r24)
1.1  mrg ;; clobbers: __tmp_reg__
1.1  mrg DEFUN __parityhi2
1.1  mrg     eor  r24, r25
1.1  mrg ;; FALLTHRU
1.1  mrg ENDF __parityhi2
1.1  mrg
1.1  mrg ;; r25:r24 = parity8 (r24)
1.1  mrg ;; clobbers: __tmp_reg__
1.1  mrg DEFUN __parityqi2
1.1  mrg     ;; parity is in r24[0..7]
1.1  mrg     mov  __tmp_reg__, r24
1.1  mrg     swap __tmp_reg__
1.1  mrg     eor  r24, __tmp_reg__
1.1  mrg     ;; parity is in r24[0..3]
1.1  mrg     subi r24, -4
1.1  mrg     andi r24, -5
1.1  mrg     subi r24, -6
1.1  mrg     ;; parity is in r24[0,3]
1.1  mrg     sbrc r24, 3
1.1  mrg     inc  r24
1.1  mrg     ;; parity is in r24[0]
1.1  mrg     andi r24, 1
1.1  mrg     clr  r25
1.1  mrg     ret
1.1  mrg ENDF __parityqi2
1.1  mrg #endif /* defined (L_parityhi2) */
1.1  mrg
1.1  mrg
1.1  mrg /**********************************
1.1  mrg  * Population Count
1.1  mrg  **********************************/
1.1  mrg
1.1  mrg #if defined (L_popcounthi2)
1.1  mrg ;; population count
1.1  mrg ;; r25:r24 = popcount16 (r25:r24)
1.1  mrg ;; clobbers: __tmp_reg__
1.1  mrg DEFUN __popcounthi2
1.1  mrg     XCALL __popcountqi2
1.1  mrg     push r24
1.1  mrg     mov  r24, r25
1.1  mrg     XCALL __popcountqi2
1.1  mrg     clr  r25
1.1  mrg     ;; FALLTHRU
1.1  mrg ENDF __popcounthi2
1.1  mrg
1.1  mrg DEFUN __popcounthi2_tail
1.1  mrg     pop   __tmp_reg__
1.1  mrg     add   r24, __tmp_reg__
1.1  mrg     ret
1.1  mrg ENDF __popcounthi2_tail
1.1  mrg #endif /* defined (L_popcounthi2) */
1.1  mrg
1.1  mrg #if defined (L_popcountsi2)
1.1  mrg ;; population count
1.1  mrg ;; r25:r24 = popcount32 (r25:r22)
1.1  mrg ;; clobbers: __tmp_reg__
1.1  mrg DEFUN __popcountsi2
1.1  mrg     XCALL __popcounthi2
1.1  mrg     push  r24
1.1  mrg     mov_l r24, r22
1.1  mrg     mov_h r25, r23
1.1  mrg     XCALL __popcounthi2
1.1  mrg     XJMP  __popcounthi2_tail
1.1  mrg ENDF __popcountsi2
1.1  mrg #endif /* defined (L_popcountsi2) */
1.1  mrg
1.1  mrg #if defined (L_popcountdi2)
1.1  mrg ;; population count
1.1  mrg ;; r25:r24 = popcount64 (r25:r18)
1.1  mrg ;; clobbers: r22, r23, __tmp_reg__
1.1  mrg DEFUN __popcountdi2
1.1  mrg     XCALL __popcountsi2
1.1  mrg     push  r24
1.1  mrg     mov_l r22, r18
1.1  mrg     mov_h r23, r19
1.1  mrg     mov_l r24, r20
1.1  mrg     mov_h r25, r21
1.1  mrg     XCALL __popcountsi2
1.1  mrg     XJMP  __popcounthi2_tail
1.1  mrg ENDF __popcountdi2
1.1  mrg #endif /* defined (L_popcountdi2) */
1.1  mrg
1.1  mrg #if defined (L_popcountqi2)
1.1  mrg ;; population count
1.1  mrg ;; r24 = popcount8 (r24)
1.1  mrg ;; clobbers: __tmp_reg__
1.1  mrg DEFUN __popcountqi2
1.1  mrg     mov  __tmp_reg__, r24
1.1  mrg     andi r24, 1
1.1  mrg     lsr  __tmp_reg__
1.1  mrg     lsr  __tmp_reg__
1.1  mrg     adc  r24, __zero_reg__
1.1  mrg     lsr  __tmp_reg__
1.1  mrg     adc  r24, __zero_reg__
1.1  mrg     lsr  __tmp_reg__
1.1  mrg     adc  r24, __zero_reg__
1.1  mrg     lsr  __tmp_reg__
1.1  mrg     adc  r24, __zero_reg__
1.1  mrg     lsr  __tmp_reg__
1.1  mrg     adc  r24, __zero_reg__
1.1  mrg     lsr  __tmp_reg__
1.1  mrg     adc  r24, __tmp_reg__
1.1  mrg     ret
1.1  mrg ENDF __popcountqi2
1.1  mrg #endif /* defined (L_popcountqi2) */
1.1  mrg
1.1  mrg
1.1  mrg /**********************************
1.1  mrg  * Swap bytes
1.1  mrg  **********************************/
1.1  mrg
1.1  mrg ;; swap two registers with different register number
1.1  mrg .macro bswap a, b
1.1  mrg     eor \a, \b
1.1  mrg     eor \b, \a
1.1  mrg     eor \a, \b
1.1  mrg .endm
1.1  mrg
1.1  mrg #if defined (L_bswapsi2)
1.1  mrg ;; swap bytes
1.1  mrg ;; r25:r22 = bswap32 (r25:r22)
1.1  mrg DEFUN __bswapsi2
1.1  mrg     bswap r22, r25
1.1  mrg     bswap r23, r24
1.1  mrg     ret
1.1  mrg ENDF __bswapsi2
1.1  mrg #endif /* defined (L_bswapsi2) */
1.1  mrg
1.1  mrg #if defined (L_bswapdi2)
1.1  mrg ;; swap bytes
1.1  mrg ;; r25:r18 = bswap64 (r25:r18)
1.1  mrg DEFUN __bswapdi2
1.1  mrg     bswap r18, r25
1.1  mrg     bswap r19, r24
1.1  mrg     bswap r20, r23
1.1  mrg     bswap r21, r22
1.1  mrg     ret
1.1  mrg ENDF __bswapdi2
1.1  mrg #endif /* defined (L_bswapdi2) */
1.1  mrg
1.1  mrg
1.1  mrg /**********************************
1.1  mrg  * 64-bit shifts
1.1  mrg  **********************************/
1.1  mrg
1.1  mrg #if defined (L_ashrdi3)
1.1  mrg ;; Arithmetic shift right
1.1  mrg ;; r25:r18 = ashr64 (r25:r18, r17:r16)
1.1  mrg DEFUN __ashrdi3
1.1  mrg     bst     r25, 7
1.1  mrg     bld     __zero_reg__, 0
1.1  mrg     ;; FALLTHRU
1.1  mrg ENDF  __ashrdi3
1.1  mrg
1.1  mrg ;; Logic shift right
1.1  mrg ;; r25:r18 = lshr64 (r25:r18, r17:r16)
1.1  mrg DEFUN __lshrdi3
1.1  mrg     lsr     __zero_reg__
1.1  mrg     sbc     __tmp_reg__, __tmp_reg__
1.1  mrg     push    r16
1.1  mrg 0:  cpi     r16, 8
1.1  mrg     brlo 2f
1.1  mrg     subi    r16, 8
1.1  mrg     mov     r18, r19
1.1  mrg     mov     r19, r20
1.1  mrg     mov     r20, r21
1.1  mrg     mov     r21, r22
1.1  mrg     mov     r22, r23
1.1  mrg     mov     r23, r24
1.1  mrg     mov     r24, r25
1.1  mrg     mov     r25, __tmp_reg__
1.1  mrg     rjmp 0b
1.1  mrg 1:  asr     __tmp_reg__
1.1  mrg     ror     r25
1.1  mrg     ror     r24
1.1  mrg     ror     r23
1.1  mrg     ror     r22
1.1  mrg     ror     r21
1.1  mrg     ror     r20
1.1  mrg     ror     r19
1.1  mrg     ror     r18
1.1  mrg 2:  dec     r16
1.1  mrg     brpl 1b
1.1  mrg     pop     r16
1.1  mrg     ret
1.1  mrg ENDF __lshrdi3
1.1  mrg #endif /* defined (L_ashrdi3) */
1.1  mrg
1.1  mrg #if defined (L_ashldi3)
1.1  mrg ;; Shift left
1.1  mrg ;; r25:r18 = ashl64 (r25:r18, r17:r16)
1.1  mrg DEFUN __ashldi3
1.1  mrg     push    r16
1.1  mrg 0:  cpi     r16, 8
1.1  mrg     brlo 2f
1.1  mrg     mov     r25, r24
1.1  mrg     mov     r24, r23
1.1  mrg     mov     r23, r22
1.1  mrg     mov     r22, r21
1.1  mrg     mov     r21, r20
1.1  mrg     mov     r20, r19
1.1  mrg     mov     r19, r18
1.1  mrg     clr     r18
1.1  mrg     subi    r16, 8
1.1  mrg     rjmp 0b
1.1  mrg 1:  lsl     r18
1.1  mrg     rol     r19
1.1  mrg     rol     r20
1.1  mrg     rol     r21
1.1  mrg     rol     r22
1.1  mrg     rol     r23
1.1  mrg     rol     r24
1.1  mrg     rol     r25
1.1  mrg 2:  dec     r16
1.1  mrg     brpl 1b
1.1  mrg     pop     r16
1.1  mrg     ret
1.1  mrg ENDF __ashldi3
1.1  mrg #endif /* defined (L_ashldi3) */
1.1  mrg
1.1  mrg #if defined (L_rotldi3)
1.1  mrg ;; Shift left
1.1  mrg ;; r25:r18 = rotl64 (r25:r18, r17:r16)
1.1  mrg DEFUN __rotldi3
1.1  mrg     push    r16
1.1  mrg 0:  cpi     r16, 8
1.1  mrg     brlo 2f
1.1  mrg     subi    r16, 8
1.1  mrg     mov     __tmp_reg__, r25
1.1  mrg     mov     r25, r24
1.1  mrg     mov     r24, r23
1.1  mrg     mov     r23, r22
1.1  mrg     mov     r22, r21
1.1  mrg     mov     r21, r20
1.1  mrg     mov     r20, r19
1.1  mrg     mov     r19, r18
1.1  mrg     mov     r18, __tmp_reg__
1.1  mrg     rjmp 0b
1.1  mrg 1:  lsl     r18
1.1  mrg     rol     r19
1.1  mrg     rol     r20
1.1  mrg     rol     r21
1.1  mrg     rol     r22
1.1  mrg     rol     r23
1.1  mrg     rol     r24
1.1  mrg     rol     r25
1.1  mrg     adc     r18, __zero_reg__
1.1  mrg 2:  dec     r16
1.1  mrg     brpl 1b
1.1  mrg     pop     r16
1.1  mrg     ret
1.1  mrg ENDF __rotldi3
1.1  mrg #endif /* defined (L_rotldi3) */
1.1  mrg
1.1  mrg
1.1  mrg .section .text.libgcc.fmul, "ax", @progbits
1.1  mrg
1.1  mrg /***********************************************************/
1.1  mrg ;;; Softmul versions of FMUL, FMULS and FMULSU to implement
1.1  mrg ;;; __builtin_avr_fmul* if !AVR_HAVE_MUL
1.1  mrg /***********************************************************/
1.1  mrg
1.1  mrg #define A1 24
1.1  mrg #define B1 25
1.1  mrg #define C0 22
1.1  mrg #define C1 23
1.1  mrg #define A0 __tmp_reg__
1.1  mrg
1.1  mrg #ifdef L_fmuls
1.1  mrg ;;; r23:r22 = fmuls (r24, r25) like in FMULS instruction
1.1  mrg ;;; Clobbers: r24, r25, __tmp_reg__
1.1  mrg DEFUN __fmuls
1.1  mrg     ;; A0.7 = negate result?
1.1  mrg     mov  A0, A1
1.1  mrg     eor  A0, B1
1.1  mrg     ;; B1 = |B1|
1.1  mrg     sbrc B1, 7
1.1  mrg     neg  B1
1.1  mrg     XJMP __fmulsu_exit
1.1  mrg ENDF __fmuls
1.1  mrg #endif /* L_fmuls */
1.1  mrg
1.1  mrg #ifdef L_fmulsu
1.1  mrg ;;; r23:r22 = fmulsu (r24, r25) like in FMULSU instruction
1.1  mrg ;;; Clobbers: r24, r25, __tmp_reg__
1.1  mrg DEFUN __fmulsu
1.1  mrg     ;; A0.7 = negate result?
1.1  mrg     mov  A0, A1
1.1  mrg ;; FALLTHRU
1.1  mrg ENDF __fmulsu
1.1  mrg
1.1  mrg ;; Helper for __fmuls and __fmulsu
1.1  mrg DEFUN __fmulsu_exit
1.1  mrg     ;; A1 = |A1|
1.1  mrg     sbrc A1, 7
1.1  mrg     neg  A1
1.1  mrg #ifdef __AVR_ERRATA_SKIP_JMP_CALL__
1.1  mrg     ;; Some cores have problem skipping 2-word instruction
1.1  mrg     tst  A0
1.1  mrg     brmi 1f
1.1  mrg #else
1.1  mrg     sbrs A0, 7
1.1  mrg #endif /* __AVR_HAVE_JMP_CALL__ */
1.1  mrg     XJMP  __fmul
1.1  mrg 1:  XCALL __fmul
1.1  mrg     ;; C = -C iff A0.7 = 1
1.1  mrg     NEG2 C0
1.1  mrg     ret
1.1  mrg ENDF __fmulsu_exit
1.1  mrg #endif /* L_fmulsu */
1.1  mrg
1.1  mrg
1.1  mrg #ifdef L_fmul
1.1  mrg ;;; r22:r23 = fmul (r24, r25) like in FMUL instruction
1.1  mrg ;;; Clobbers: r24, r25, __tmp_reg__
1.1  mrg DEFUN __fmul
1.1  mrg     ; clear result
1.1  mrg     clr   C0
1.1  mrg     clr   C1
1.1  mrg     clr   A0
1.1  mrg 1:  tst   B1
1.1  mrg     ;; 1.0 = 0x80, so test for bit 7 of B to see if A must to be added to C.
1.1  mrg 2:  brpl  3f
1.1  mrg     ;; C += A
1.1  mrg     add   C0, A0
1.1  mrg     adc   C1, A1
1.1  mrg 3:  ;; A >>= 1
1.1  mrg     lsr   A1
1.1  mrg     ror   A0
             ;; B <<= 1
             lsl   B1
             brne  2b
             ret
         ENDF __fmul
         #endif /* L_fmul */

         #undef A0
         #undef A1
         #undef B1
         #undef C0
         #undef C1

         #include "lib1funcs-fixed.S"