config/arm/lib1funcs.S

     1.1  mrg @ libgcc routines for ARM cpu.
     1.1  mrg @ Division routines, written by Richard Earnshaw, (rearnsha@armltd.co.uk)
     1.1  mrg
1.1.1.11  mrg /* Copyright (C) 1995-2024 Free Software Foundation, Inc.
     1.1  mrg
     1.1  mrg This file is free software; you can redistribute it and/or modify it
     1.1  mrg under the terms of the GNU General Public License as published by the
     1.1  mrg Free Software Foundation; either version 3, or (at your option) any
     1.1  mrg later version.
     1.1  mrg
     1.1  mrg This file is distributed in the hope that it will be useful, but
     1.1  mrg WITHOUT ANY WARRANTY; without even the implied warranty of
     1.1  mrg MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
     1.1  mrg General Public License for more details.
     1.1  mrg
     1.1  mrg Under Section 7 of GPL version 3, you are granted additional
     1.1  mrg permissions described in the GCC Runtime Library Exception, version
     1.1  mrg 3.1, as published by the Free Software Foundation.
     1.1  mrg
     1.1  mrg You should have received a copy of the GNU General Public License and
     1.1  mrg a copy of the GCC Runtime Library Exception along with this program;
     1.1  mrg see the files COPYING3 and COPYING.RUNTIME respectively.  If not, see
     1.1  mrg <http://www.gnu.org/licenses/>.  */
     1.1  mrg
 1.1.1.9  mrg /* Everything in this file should now use unified syntax.  */
 1.1.1.9  mrg
 1.1.1.9  mrg 	.syntax unified
 1.1.1.9  mrg
     1.1  mrg /* An executable stack is *not* required for these functions.  */
     1.1  mrg #if defined(__ELF__) && defined(__linux__)
     1.1  mrg .section .note.GNU-stack,"",%progbits
     1.1  mrg .previous
     1.1  mrg #endif  /* __ELF__ and __linux__ */
     1.1  mrg
     1.1  mrg #ifdef __ARM_EABI__
     1.1  mrg /* Some attributes that are common to all routines in this file.  */
     1.1  mrg 	/* Tag_ABI_align_needed: This code does not require 8-byte
     1.1  mrg 	   alignment from the caller.  */
     1.1  mrg 	/* .eabi_attribute 24, 0  -- default setting.  */
     1.1  mrg 	/* Tag_ABI_align_preserved: This code preserves 8-byte
     1.1  mrg 	   alignment in any callee.  */
     1.1  mrg 	.eabi_attribute 25, 1
     1.1  mrg #endif /* __ARM_EABI__ */
     1.1  mrg /* ------------------------------------------------------------------------ */
     1.1  mrg
     1.1  mrg /* We need to know what prefix to add to function names.  */
     1.1  mrg
     1.1  mrg #ifndef __USER_LABEL_PREFIX__
     1.1  mrg #error  __USER_LABEL_PREFIX__ not defined
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg /* ANSI concatenation macros.  */
     1.1  mrg
     1.1  mrg #define CONCAT1(a, b) CONCAT2(a, b)
     1.1  mrg #define CONCAT2(a, b) a ## b
     1.1  mrg
     1.1  mrg /* Use the right prefix for global labels.  */
     1.1  mrg
     1.1  mrg #define SYM(x) CONCAT1 (__USER_LABEL_PREFIX__, x)
     1.1  mrg
     1.1  mrg #ifdef __ELF__
     1.1  mrg #ifdef __thumb__
     1.1  mrg #define __PLT__  /* Not supported in Thumb assembler (for now).  */
     1.1  mrg #elif defined __vxworks && !defined __PIC__
     1.1  mrg #define __PLT__ /* Not supported by the kernel loader.  */
     1.1  mrg #else
     1.1  mrg #define __PLT__ (PLT)
     1.1  mrg #endif
     1.1  mrg #define TYPE(x) .type SYM(x),function
     1.1  mrg #define SIZE(x) .size SYM(x), . - SYM(x)
     1.1  mrg #define LSYM(x) .x
     1.1  mrg #else
     1.1  mrg #define __PLT__
     1.1  mrg #define TYPE(x)
     1.1  mrg #define SIZE(x)
     1.1  mrg #define LSYM(x) x
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg /* Function end macros.  Variants for interworking.  */
     1.1  mrg
     1.1  mrg /* There are times when we might prefer Thumb1 code even if ARM code is
     1.1  mrg    permitted, for example, the code might be smaller, or there might be
     1.1  mrg    interworking problems with switching to ARM state if interworking is
     1.1  mrg    disabled.  */
     1.1  mrg #if (defined(__thumb__)			\
     1.1  mrg      && !defined(__thumb2__)		\
     1.1  mrg      && (!defined(__THUMB_INTERWORK__)	\
     1.1  mrg 	 || defined (__OPTIMIZE_SIZE__)	\
 1.1.1.4  mrg 	 || !__ARM_ARCH_ISA_ARM))
     1.1  mrg # define __prefer_thumb__
     1.1  mrg #endif
     1.1  mrg
 1.1.1.4  mrg #if !__ARM_ARCH_ISA_ARM && __ARM_ARCH_ISA_THUMB == 1
 1.1.1.4  mrg #define NOT_ISA_TARGET_32BIT 1
 1.1.1.4  mrg #endif
 1.1.1.4  mrg
     1.1  mrg /* How to return from a function call depends on the architecture variant.  */
     1.1  mrg
 1.1.1.8  mrg #if (__ARM_ARCH > 4) || defined(__ARM_ARCH_4T__)
     1.1  mrg
     1.1  mrg # define RET		bx	lr
     1.1  mrg # define RETc(x)	bx##x	lr
     1.1  mrg
     1.1  mrg /* Special precautions for interworking on armv4t.  */
 1.1.1.8  mrg # if (__ARM_ARCH == 4)
     1.1  mrg
     1.1  mrg /* Always use bx, not ldr pc.  */
     1.1  mrg #  if (defined(__thumb__) || defined(__THUMB_INTERWORK__))
     1.1  mrg #    define __INTERWORKING__
     1.1  mrg #   endif /* __THUMB__ || __THUMB_INTERWORK__ */
     1.1  mrg
     1.1  mrg /* Include thumb stub before arm mode code.  */
     1.1  mrg #  if defined(__thumb__) && !defined(__THUMB_INTERWORK__)
     1.1  mrg #   define __INTERWORKING_STUBS__
     1.1  mrg #  endif /* __thumb__ && !__THUMB_INTERWORK__ */
     1.1  mrg
     1.1  mrg #endif /* __ARM_ARCH == 4 */
     1.1  mrg
     1.1  mrg #else
     1.1  mrg
     1.1  mrg # define RET		mov	pc, lr
     1.1  mrg # define RETc(x)	mov##x	pc, lr
     1.1  mrg
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg .macro	cfi_pop		advance, reg, cfa_offset
     1.1  mrg #ifdef __ELF__
     1.1  mrg 	.pushsection	.debug_frame
     1.1  mrg 	.byte	0x4		/* DW_CFA_advance_loc4 */
     1.1  mrg 	.4byte	\advance
     1.1  mrg 	.byte	(0xc0 | \reg)	/* DW_CFA_restore */
     1.1  mrg 	.byte	0xe		/* DW_CFA_def_cfa_offset */
     1.1  mrg 	.uleb128 \cfa_offset
     1.1  mrg 	.popsection
     1.1  mrg #endif
     1.1  mrg .endm
     1.1  mrg .macro	cfi_push	advance, reg, offset, cfa_offset
     1.1  mrg #ifdef __ELF__
     1.1  mrg 	.pushsection	.debug_frame
     1.1  mrg 	.byte	0x4		/* DW_CFA_advance_loc4 */
     1.1  mrg 	.4byte	\advance
     1.1  mrg 	.byte	(0x80 | \reg)	/* DW_CFA_offset */
     1.1  mrg 	.uleb128 (\offset / -4)
     1.1  mrg 	.byte	0xe		/* DW_CFA_def_cfa_offset */
     1.1  mrg 	.uleb128 \cfa_offset
     1.1  mrg 	.popsection
     1.1  mrg #endif
     1.1  mrg .endm
     1.1  mrg .macro cfi_start	start_label, end_label
     1.1  mrg #ifdef __ELF__
     1.1  mrg 	.pushsection	.debug_frame
     1.1  mrg LSYM(Lstart_frame):
     1.1  mrg 	.4byte	LSYM(Lend_cie) - LSYM(Lstart_cie) @ Length of CIE
     1.1  mrg LSYM(Lstart_cie):
     1.1  mrg         .4byte	0xffffffff	@ CIE Identifier Tag
     1.1  mrg         .byte	0x1	@ CIE Version
     1.1  mrg         .ascii	"\0"	@ CIE Augmentation
     1.1  mrg         .uleb128 0x1	@ CIE Code Alignment Factor
     1.1  mrg         .sleb128 -4	@ CIE Data Alignment Factor
     1.1  mrg         .byte	0xe	@ CIE RA Column
     1.1  mrg         .byte	0xc	@ DW_CFA_def_cfa
     1.1  mrg         .uleb128 0xd
     1.1  mrg         .uleb128 0x0
     1.1  mrg
     1.1  mrg 	.align 2
     1.1  mrg LSYM(Lend_cie):
     1.1  mrg 	.4byte	LSYM(Lend_fde)-LSYM(Lstart_fde)	@ FDE Length
     1.1  mrg LSYM(Lstart_fde):
     1.1  mrg 	.4byte	LSYM(Lstart_frame)	@ FDE CIE offset
     1.1  mrg 	.4byte	\start_label	@ FDE initial location
     1.1  mrg 	.4byte	\end_label-\start_label	@ FDE address range
     1.1  mrg 	.popsection
     1.1  mrg #endif
     1.1  mrg .endm
     1.1  mrg .macro cfi_end	end_label
     1.1  mrg #ifdef __ELF__
     1.1  mrg 	.pushsection	.debug_frame
     1.1  mrg 	.align	2
     1.1  mrg LSYM(Lend_fde):
     1.1  mrg 	.popsection
     1.1  mrg \end_label:
     1.1  mrg #endif
     1.1  mrg .endm
     1.1  mrg
     1.1  mrg /* Don't pass dirn, it's there just to get token pasting right.  */
     1.1  mrg
     1.1  mrg .macro	RETLDM	regs=, cond=, unwind=, dirn=ia
     1.1  mrg #if defined (__INTERWORKING__)
     1.1  mrg 	.ifc "\regs",""
     1.1  mrg 	ldr\cond	lr, [sp], #8
     1.1  mrg 	.else
     1.1  mrg # if defined(__thumb2__)
     1.1  mrg 	pop\cond	{\regs, lr}
     1.1  mrg # else
     1.1  mrg 	ldm\cond\dirn	sp!, {\regs, lr}
     1.1  mrg # endif
     1.1  mrg 	.endif
     1.1  mrg 	.ifnc "\unwind", ""
     1.1  mrg 	/* Mark LR as restored.  */
     1.1  mrg 97:	cfi_pop 97b - \unwind, 0xe, 0x0
     1.1  mrg 	.endif
     1.1  mrg 	bx\cond	lr
     1.1  mrg #else
     1.1  mrg 	/* Caller is responsible for providing IT instruction.  */
     1.1  mrg 	.ifc "\regs",""
     1.1  mrg 	ldr\cond	pc, [sp], #8
     1.1  mrg 	.else
     1.1  mrg # if defined(__thumb2__)
     1.1  mrg 	pop\cond	{\regs, pc}
     1.1  mrg # else
     1.1  mrg 	ldm\cond\dirn	sp!, {\regs, pc}
     1.1  mrg # endif
     1.1  mrg 	.endif
     1.1  mrg #endif
     1.1  mrg .endm
     1.1  mrg
     1.1  mrg /* The Unified assembly syntax allows the same code to be assembled for both
     1.1  mrg    ARM and Thumb-2.  However this is only supported by recent gas, so define
     1.1  mrg    a set of macros to allow ARM code on older assemblers.  */
     1.1  mrg #if defined(__thumb2__)
     1.1  mrg .macro do_it cond, suffix=""
     1.1  mrg 	it\suffix	\cond
     1.1  mrg .endm
     1.1  mrg .macro shift1 op, arg0, arg1, arg2
     1.1  mrg 	\op	\arg0, \arg1, \arg2
     1.1  mrg .endm
     1.1  mrg #define do_push	push
     1.1  mrg #define do_pop	pop
     1.1  mrg /* Perform an arithmetic operation with a variable shift operand.  This
     1.1  mrg    requires two instructions and a scratch register on Thumb-2.  */
     1.1  mrg .macro shiftop name, dest, src1, src2, shiftop, shiftreg, tmp
     1.1  mrg 	\shiftop \tmp, \src2, \shiftreg
     1.1  mrg 	\name \dest, \src1, \tmp
     1.1  mrg .endm
     1.1  mrg #else
     1.1  mrg .macro do_it cond, suffix=""
     1.1  mrg .endm
     1.1  mrg .macro shift1 op, arg0, arg1, arg2
     1.1  mrg 	mov	\arg0, \arg1, \op \arg2
     1.1  mrg .endm
     1.1  mrg #define do_push	stmfd sp!,
     1.1  mrg #define do_pop	ldmfd sp!,
     1.1  mrg .macro shiftop name, dest, src1, src2, shiftop, shiftreg, tmp
     1.1  mrg 	\name \dest, \src1, \src2, \shiftop \shiftreg
     1.1  mrg .endm
     1.1  mrg #endif
     1.1  mrg
 1.1.1.9  mrg #define COND(op1, op2, cond) op1 ## op2 ## cond
 1.1.1.9  mrg
     1.1  mrg #ifdef __ARM_EABI__
     1.1  mrg .macro ARM_LDIV0 name signed
     1.1  mrg 	cmp	r0, #0
     1.1  mrg 	.ifc	\signed, unsigned
     1.1  mrg 	movne	r0, #0xffffffff
     1.1  mrg 	.else
     1.1  mrg 	movgt	r0, #0x7fffffff
     1.1  mrg 	movlt	r0, #0x80000000
     1.1  mrg 	.endif
     1.1  mrg 	b	SYM (__aeabi_idiv0) __PLT__
     1.1  mrg .endm
     1.1  mrg #else
     1.1  mrg .macro ARM_LDIV0 name signed
     1.1  mrg 	str	lr, [sp, #-8]!
     1.1  mrg 98:	cfi_push 98b - __\name, 0xe, -0x8, 0x8
     1.1  mrg 	bl	SYM (__div0) __PLT__
     1.1  mrg 	mov	r0, #0			@ About as wrong as it could be.
     1.1  mrg 	RETLDM	unwind=98b
     1.1  mrg .endm
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg
     1.1  mrg #ifdef __ARM_EABI__
     1.1  mrg .macro THUMB_LDIV0 name signed
 1.1.1.4  mrg #ifdef NOT_ISA_TARGET_32BIT
 1.1.1.4  mrg
 1.1.1.4  mrg 	push	{r0, lr}
 1.1.1.9  mrg 	movs	r0, #0
 1.1.1.4  mrg 	bl	SYM(__aeabi_idiv0)
     1.1  mrg 	@ We know we are not on armv4t, so pop pc is safe.
 1.1.1.4  mrg 	pop	{r1, pc}
 1.1.1.4  mrg
     1.1  mrg #elif defined(__thumb2__)
     1.1  mrg 	.syntax unified
     1.1  mrg 	.ifc \signed, unsigned
     1.1  mrg 	cbz	r0, 1f
     1.1  mrg 	mov	r0, #0xffffffff
     1.1  mrg 1:
     1.1  mrg 	.else
     1.1  mrg 	cmp	r0, #0
     1.1  mrg 	do_it	gt
     1.1  mrg 	movgt	r0, #0x7fffffff
     1.1  mrg 	do_it	lt
     1.1  mrg 	movlt	r0, #0x80000000
     1.1  mrg 	.endif
     1.1  mrg 	b.w	SYM(__aeabi_idiv0) __PLT__
     1.1  mrg #else
     1.1  mrg 	.align	2
     1.1  mrg 	bx	pc
     1.1  mrg 	nop
     1.1  mrg 	.arm
     1.1  mrg 	cmp	r0, #0
     1.1  mrg 	.ifc	\signed, unsigned
     1.1  mrg 	movne	r0, #0xffffffff
     1.1  mrg 	.else
     1.1  mrg 	movgt	r0, #0x7fffffff
     1.1  mrg 	movlt	r0, #0x80000000
     1.1  mrg 	.endif
     1.1  mrg 	b	SYM(__aeabi_idiv0) __PLT__
     1.1  mrg 	.thumb
     1.1  mrg #endif
     1.1  mrg .endm
     1.1  mrg #else
     1.1  mrg .macro THUMB_LDIV0 name signed
     1.1  mrg 	push	{ r1, lr }
     1.1  mrg 98:	cfi_push 98b - __\name, 0xe, -0x4, 0x8
     1.1  mrg 	bl	SYM (__div0)
 1.1.1.9  mrg 	movs	r0, #0			@ About as wrong as it could be.
     1.1  mrg #if defined (__INTERWORKING__)
     1.1  mrg 	pop	{ r1, r2 }
     1.1  mrg 	bx	r2
     1.1  mrg #else
     1.1  mrg 	pop	{ r1, pc }
     1.1  mrg #endif
     1.1  mrg .endm
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg .macro FUNC_END name
     1.1  mrg 	SIZE (__\name)
     1.1  mrg .endm
     1.1  mrg
     1.1  mrg .macro DIV_FUNC_END name signed
     1.1  mrg 	cfi_start	__\name, LSYM(Lend_div0)
     1.1  mrg LSYM(Ldiv0):
     1.1  mrg #ifdef __thumb__
     1.1  mrg 	THUMB_LDIV0 \name \signed
     1.1  mrg #else
     1.1  mrg 	ARM_LDIV0 \name \signed
     1.1  mrg #endif
     1.1  mrg 	cfi_end	LSYM(Lend_div0)
     1.1  mrg 	FUNC_END \name
     1.1  mrg .endm
     1.1  mrg
     1.1  mrg .macro THUMB_FUNC_START name
     1.1  mrg 	.globl	SYM (\name)
     1.1  mrg 	TYPE	(\name)
     1.1  mrg 	.thumb_func
     1.1  mrg SYM (\name):
     1.1  mrg .endm
     1.1  mrg
     1.1  mrg /* Function start macros.  Variants for ARM and Thumb.  */
     1.1  mrg
     1.1  mrg #ifdef __thumb__
     1.1  mrg #define THUMB_FUNC .thumb_func
     1.1  mrg #define THUMB_CODE .force_thumb
     1.1  mrg # if defined(__thumb2__)
 1.1.1.9  mrg #define THUMB_SYNTAX
     1.1  mrg # else
     1.1  mrg #define THUMB_SYNTAX
     1.1  mrg # endif
     1.1  mrg #else
     1.1  mrg #define THUMB_FUNC
     1.1  mrg #define THUMB_CODE
     1.1  mrg #define THUMB_SYNTAX
     1.1  mrg #endif
     1.1  mrg
 1.1.1.8  mrg .macro FUNC_START name
     1.1  mrg 	.text
     1.1  mrg 	.globl SYM (__\name)
     1.1  mrg 	TYPE (__\name)
     1.1  mrg 	.align 0
     1.1  mrg 	THUMB_CODE
     1.1  mrg 	THUMB_FUNC
     1.1  mrg 	THUMB_SYNTAX
     1.1  mrg SYM (__\name):
     1.1  mrg .endm
     1.1  mrg
 1.1.1.2  mrg .macro ARM_SYM_START name
 1.1.1.2  mrg        TYPE (\name)
 1.1.1.2  mrg        .align 0
 1.1.1.2  mrg SYM (\name):
 1.1.1.2  mrg .endm
 1.1.1.2  mrg
 1.1.1.2  mrg .macro SYM_END name
 1.1.1.2  mrg        SIZE (\name)
 1.1.1.2  mrg .endm
 1.1.1.2  mrg
     1.1  mrg /* Special function that will always be coded in ARM assembly, even if
     1.1  mrg    in Thumb-only compilation.  */
     1.1  mrg
     1.1  mrg #if defined(__thumb2__)
     1.1  mrg
     1.1  mrg /* For Thumb-2 we build everything in thumb mode.  */
 1.1.1.8  mrg .macro ARM_FUNC_START name
 1.1.1.8  mrg        FUNC_START \name
     1.1  mrg        .syntax unified
     1.1  mrg .endm
     1.1  mrg #define EQUIV .thumb_set
     1.1  mrg .macro  ARM_CALL name
     1.1  mrg 	bl	__\name
     1.1  mrg .endm
     1.1  mrg
     1.1  mrg #elif defined(__INTERWORKING_STUBS__)
     1.1  mrg
     1.1  mrg .macro	ARM_FUNC_START name
     1.1  mrg 	FUNC_START \name
     1.1  mrg 	bx	pc
     1.1  mrg 	nop
     1.1  mrg 	.arm
     1.1  mrg /* A hook to tell gdb that we've switched to ARM mode.  Also used to call
     1.1  mrg    directly from other local arm routines.  */
     1.1  mrg _L__\name:
     1.1  mrg .endm
     1.1  mrg #define EQUIV .thumb_set
     1.1  mrg /* Branch directly to a function declared with ARM_FUNC_START.
     1.1  mrg    Must be called in arm mode.  */
     1.1  mrg .macro  ARM_CALL name
     1.1  mrg 	bl	_L__\name
     1.1  mrg .endm
     1.1  mrg
     1.1  mrg #else /* !(__INTERWORKING_STUBS__ || __thumb2__) */
     1.1  mrg
 1.1.1.4  mrg #ifdef NOT_ISA_TARGET_32BIT
     1.1  mrg #define EQUIV .thumb_set
     1.1  mrg #else
 1.1.1.8  mrg .macro	ARM_FUNC_START name
     1.1  mrg 	.text
     1.1  mrg 	.globl SYM (__\name)
     1.1  mrg 	TYPE (__\name)
     1.1  mrg 	.align 0
     1.1  mrg 	.arm
     1.1  mrg SYM (__\name):
     1.1  mrg .endm
     1.1  mrg #define EQUIV .set
     1.1  mrg .macro  ARM_CALL name
     1.1  mrg 	bl	__\name
     1.1  mrg .endm
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg .macro	FUNC_ALIAS new old
     1.1  mrg 	.globl	SYM (__\new)
     1.1  mrg #if defined (__thumb__)
     1.1  mrg 	.thumb_set	SYM (__\new), SYM (__\old)
     1.1  mrg #else
     1.1  mrg 	.set	SYM (__\new), SYM (__\old)
     1.1  mrg #endif
     1.1  mrg .endm
     1.1  mrg
 1.1.1.4  mrg #ifndef NOT_ISA_TARGET_32BIT
     1.1  mrg .macro	ARM_FUNC_ALIAS new old
     1.1  mrg 	.globl	SYM (__\new)
     1.1  mrg 	EQUIV	SYM (__\new), SYM (__\old)
     1.1  mrg #if defined(__INTERWORKING_STUBS__)
     1.1  mrg 	.set	SYM (_L__\new), SYM (_L__\old)
     1.1  mrg #endif
     1.1  mrg .endm
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg #ifdef __ARMEB__
     1.1  mrg #define xxh r0
     1.1  mrg #define xxl r1
     1.1  mrg #define yyh r2
     1.1  mrg #define yyl r3
     1.1  mrg #else
     1.1  mrg #define xxh r1
     1.1  mrg #define xxl r0
     1.1  mrg #define yyh r3
     1.1  mrg #define yyl r2
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg #ifdef __ARM_EABI__
     1.1  mrg .macro	WEAK name
     1.1  mrg 	.weak SYM (__\name)
     1.1  mrg .endm
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg #ifdef __thumb__
     1.1  mrg /* Register aliases.  */
     1.1  mrg
     1.1  mrg work		.req	r4	@ XXXX is this safe ?
     1.1  mrg dividend	.req	r0
     1.1  mrg divisor		.req	r1
     1.1  mrg overdone	.req	r2
     1.1  mrg result		.req	r2
     1.1  mrg curbit		.req	r3
     1.1  mrg #endif
     1.1  mrg #if 0
     1.1  mrg ip		.req	r12
     1.1  mrg sp		.req	r13
     1.1  mrg lr		.req	r14
     1.1  mrg pc		.req	r15
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg /* ------------------------------------------------------------------------ */
     1.1  mrg /*		Bodies of the division and modulo routines.		    */
 1.1.1.9  mrg /* ------------------------------------------------------------------------ */
 1.1.1.9  mrg
     1.1  mrg .macro ARM_DIV_BODY dividend, divisor, result, curbit
     1.1  mrg
 1.1.1.8  mrg #if defined (__ARM_FEATURE_CLZ) && ! defined (__OPTIMIZE_SIZE__)
     1.1  mrg
     1.1  mrg #if defined (__thumb2__)
     1.1  mrg 	clz	\curbit, \dividend
     1.1  mrg 	clz	\result, \divisor
     1.1  mrg 	sub	\curbit, \result, \curbit
     1.1  mrg 	rsb	\curbit, \curbit, #31
     1.1  mrg 	adr	\result, 1f
     1.1  mrg 	add	\curbit, \result, \curbit, lsl #4
     1.1  mrg 	mov	\result, #0
     1.1  mrg 	mov	pc, \curbit
     1.1  mrg .p2align 3
     1.1  mrg 1:
     1.1  mrg 	.set	shift, 32
     1.1  mrg 	.rept	32
     1.1  mrg 	.set	shift, shift - 1
     1.1  mrg 	cmp.w	\dividend, \divisor, lsl #shift
     1.1  mrg 	nop.n
     1.1  mrg 	adc.w	\result, \result, \result
     1.1  mrg 	it	cs
     1.1  mrg 	subcs.w	\dividend, \dividend, \divisor, lsl #shift
     1.1  mrg 	.endr
     1.1  mrg #else
     1.1  mrg 	clz	\curbit, \dividend
     1.1  mrg 	clz	\result, \divisor
     1.1  mrg 	sub	\curbit, \result, \curbit
     1.1  mrg 	rsbs	\curbit, \curbit, #31
     1.1  mrg 	addne	\curbit, \curbit, \curbit, lsl #1
     1.1  mrg 	mov	\result, #0
     1.1  mrg 	addne	pc, pc, \curbit, lsl #2
     1.1  mrg 	nop
     1.1  mrg 	.set	shift, 32
     1.1  mrg 	.rept	32
     1.1  mrg 	.set	shift, shift - 1
     1.1  mrg 	cmp	\dividend, \divisor, lsl #shift
     1.1  mrg 	adc	\result, \result, \result
     1.1  mrg 	subcs	\dividend, \dividend, \divisor, lsl #shift
     1.1  mrg 	.endr
     1.1  mrg #endif
     1.1  mrg
 1.1.1.8  mrg #else /* !defined (__ARM_FEATURE_CLZ) || defined (__OPTIMIZE_SIZE__) */
 1.1.1.8  mrg #if defined (__ARM_FEATURE_CLZ)
     1.1  mrg
     1.1  mrg 	clz	\curbit, \divisor
     1.1  mrg 	clz	\result, \dividend
     1.1  mrg 	sub	\result, \curbit, \result
     1.1  mrg 	mov	\curbit, #1
     1.1  mrg 	mov	\divisor, \divisor, lsl \result
     1.1  mrg 	mov	\curbit, \curbit, lsl \result
     1.1  mrg 	mov	\result, #0
     1.1  mrg
 1.1.1.8  mrg #else /* !defined (__ARM_FEATURE_CLZ) */
     1.1  mrg
     1.1  mrg 	@ Initially shift the divisor left 3 bits if possible,
     1.1  mrg 	@ set curbit accordingly.  This allows for curbit to be located
     1.1  mrg 	@ at the left end of each 4-bit nibbles in the division loop
     1.1  mrg 	@ to save one loop in most cases.
     1.1  mrg 	tst	\divisor, #0xe0000000
     1.1  mrg 	moveq	\divisor, \divisor, lsl #3
     1.1  mrg 	moveq	\curbit, #8
     1.1  mrg 	movne	\curbit, #1
     1.1  mrg
     1.1  mrg 	@ Unless the divisor is very big, shift it up in multiples of
     1.1  mrg 	@ four bits, since this is the amount of unwinding in the main
     1.1  mrg 	@ division loop.  Continue shifting until the divisor is
     1.1  mrg 	@ larger than the dividend.
     1.1  mrg 1:	cmp	\divisor, #0x10000000
     1.1  mrg 	cmplo	\divisor, \dividend
     1.1  mrg 	movlo	\divisor, \divisor, lsl #4
     1.1  mrg 	movlo	\curbit, \curbit, lsl #4
     1.1  mrg 	blo	1b
     1.1  mrg
     1.1  mrg 	@ For very big divisors, we must shift it a bit at a time, or
     1.1  mrg 	@ we will be in danger of overflowing.
     1.1  mrg 1:	cmp	\divisor, #0x80000000
     1.1  mrg 	cmplo	\divisor, \dividend
     1.1  mrg 	movlo	\divisor, \divisor, lsl #1
     1.1  mrg 	movlo	\curbit, \curbit, lsl #1
     1.1  mrg 	blo	1b
     1.1  mrg
     1.1  mrg 	mov	\result, #0
     1.1  mrg
 1.1.1.8  mrg #endif /* !defined (__ARM_FEATURE_CLZ) */
     1.1  mrg
     1.1  mrg 	@ Division loop
     1.1  mrg 1:	cmp	\dividend, \divisor
     1.1  mrg 	do_it	hs, t
     1.1  mrg 	subhs	\dividend, \dividend, \divisor
     1.1  mrg 	orrhs	\result,   \result,   \curbit
     1.1  mrg 	cmp	\dividend, \divisor,  lsr #1
     1.1  mrg 	do_it	hs, t
     1.1  mrg 	subhs	\dividend, \dividend, \divisor, lsr #1
     1.1  mrg 	orrhs	\result,   \result,   \curbit,  lsr #1
     1.1  mrg 	cmp	\dividend, \divisor,  lsr #2
     1.1  mrg 	do_it	hs, t
     1.1  mrg 	subhs	\dividend, \dividend, \divisor, lsr #2
     1.1  mrg 	orrhs	\result,   \result,   \curbit,  lsr #2
     1.1  mrg 	cmp	\dividend, \divisor,  lsr #3
     1.1  mrg 	do_it	hs, t
     1.1  mrg 	subhs	\dividend, \dividend, \divisor, lsr #3
     1.1  mrg 	orrhs	\result,   \result,   \curbit,  lsr #3
     1.1  mrg 	cmp	\dividend, #0			@ Early termination?
     1.1  mrg 	do_it	ne, t
     1.1  mrg 	movnes	\curbit,   \curbit,  lsr #4	@ No, any more bits to do?
     1.1  mrg 	movne	\divisor,  \divisor, lsr #4
     1.1  mrg 	bne	1b
     1.1  mrg
 1.1.1.8  mrg #endif /* !defined (__ARM_FEATURE_CLZ) || defined (__OPTIMIZE_SIZE__) */
     1.1  mrg
     1.1  mrg .endm
     1.1  mrg /* ------------------------------------------------------------------------ */
     1.1  mrg .macro ARM_DIV2_ORDER divisor, order
     1.1  mrg
 1.1.1.8  mrg #if defined (__ARM_FEATURE_CLZ)
     1.1  mrg
     1.1  mrg 	clz	\order, \divisor
     1.1  mrg 	rsb	\order, \order, #31
     1.1  mrg
     1.1  mrg #else
     1.1  mrg
     1.1  mrg 	cmp	\divisor, #(1 << 16)
     1.1  mrg 	movhs	\divisor, \divisor, lsr #16
     1.1  mrg 	movhs	\order, #16
     1.1  mrg 	movlo	\order, #0
     1.1  mrg
     1.1  mrg 	cmp	\divisor, #(1 << 8)
     1.1  mrg 	movhs	\divisor, \divisor, lsr #8
     1.1  mrg 	addhs	\order, \order, #8
     1.1  mrg
     1.1  mrg 	cmp	\divisor, #(1 << 4)
     1.1  mrg 	movhs	\divisor, \divisor, lsr #4
     1.1  mrg 	addhs	\order, \order, #4
     1.1  mrg
     1.1  mrg 	cmp	\divisor, #(1 << 2)
     1.1  mrg 	addhi	\order, \order, #3
     1.1  mrg 	addls	\order, \order, \divisor, lsr #1
     1.1  mrg
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg .endm
     1.1  mrg /* ------------------------------------------------------------------------ */
     1.1  mrg .macro ARM_MOD_BODY dividend, divisor, order, spare
     1.1  mrg
 1.1.1.8  mrg #if defined(__ARM_FEATURE_CLZ) && ! defined (__OPTIMIZE_SIZE__)
     1.1  mrg
     1.1  mrg 	clz	\order, \divisor
     1.1  mrg 	clz	\spare, \dividend
     1.1  mrg 	sub	\order, \order, \spare
     1.1  mrg 	rsbs	\order, \order, #31
     1.1  mrg 	addne	pc, pc, \order, lsl #3
     1.1  mrg 	nop
     1.1  mrg 	.set	shift, 32
     1.1  mrg 	.rept	32
     1.1  mrg 	.set	shift, shift - 1
     1.1  mrg 	cmp	\dividend, \divisor, lsl #shift
     1.1  mrg 	subcs	\dividend, \dividend, \divisor, lsl #shift
     1.1  mrg 	.endr
     1.1  mrg
 1.1.1.8  mrg #else /* !defined (__ARM_FEATURE_CLZ) || defined (__OPTIMIZE_SIZE__) */
 1.1.1.8  mrg #if defined (__ARM_FEATURE_CLZ)
     1.1  mrg
     1.1  mrg 	clz	\order, \divisor
     1.1  mrg 	clz	\spare, \dividend
     1.1  mrg 	sub	\order, \order, \spare
     1.1  mrg 	mov	\divisor, \divisor, lsl \order
     1.1  mrg
 1.1.1.8  mrg #else /* !defined (__ARM_FEATURE_CLZ) */
     1.1  mrg
     1.1  mrg 	mov	\order, #0
     1.1  mrg
     1.1  mrg 	@ Unless the divisor is very big, shift it up in multiples of
     1.1  mrg 	@ four bits, since this is the amount of unwinding in the main
     1.1  mrg 	@ division loop.  Continue shifting until the divisor is
     1.1  mrg 	@ larger than the dividend.
     1.1  mrg 1:	cmp	\divisor, #0x10000000
     1.1  mrg 	cmplo	\divisor, \dividend
     1.1  mrg 	movlo	\divisor, \divisor, lsl #4
     1.1  mrg 	addlo	\order, \order, #4
     1.1  mrg 	blo	1b
     1.1  mrg
     1.1  mrg 	@ For very big divisors, we must shift it a bit at a time, or
     1.1  mrg 	@ we will be in danger of overflowing.
     1.1  mrg 1:	cmp	\divisor, #0x80000000
     1.1  mrg 	cmplo	\divisor, \dividend
     1.1  mrg 	movlo	\divisor, \divisor, lsl #1
     1.1  mrg 	addlo	\order, \order, #1
     1.1  mrg 	blo	1b
     1.1  mrg
 1.1.1.8  mrg #endif /* !defined (__ARM_FEATURE_CLZ) */
     1.1  mrg
     1.1  mrg 	@ Perform all needed substractions to keep only the reminder.
     1.1  mrg 	@ Do comparisons in batch of 4 first.
     1.1  mrg 	subs	\order, \order, #3		@ yes, 3 is intended here
     1.1  mrg 	blt	2f
     1.1  mrg
     1.1  mrg 1:	cmp	\dividend, \divisor
     1.1  mrg 	subhs	\dividend, \dividend, \divisor
     1.1  mrg 	cmp	\dividend, \divisor,  lsr #1
     1.1  mrg 	subhs	\dividend, \dividend, \divisor, lsr #1
     1.1  mrg 	cmp	\dividend, \divisor,  lsr #2
     1.1  mrg 	subhs	\dividend, \dividend, \divisor, lsr #2
     1.1  mrg 	cmp	\dividend, \divisor,  lsr #3
     1.1  mrg 	subhs	\dividend, \dividend, \divisor, lsr #3
     1.1  mrg 	cmp	\dividend, #1
     1.1  mrg 	mov	\divisor, \divisor, lsr #4
     1.1  mrg 	subges	\order, \order, #4
     1.1  mrg 	bge	1b
     1.1  mrg
     1.1  mrg 	tst	\order, #3
     1.1  mrg 	teqne	\dividend, #0
     1.1  mrg 	beq	5f
     1.1  mrg
     1.1  mrg 	@ Either 1, 2 or 3 comparison/substractions are left.
     1.1  mrg 2:	cmn	\order, #2
     1.1  mrg 	blt	4f
     1.1  mrg 	beq	3f
     1.1  mrg 	cmp	\dividend, \divisor
     1.1  mrg 	subhs	\dividend, \dividend, \divisor
     1.1  mrg 	mov	\divisor,  \divisor,  lsr #1
     1.1  mrg 3:	cmp	\dividend, \divisor
     1.1  mrg 	subhs	\dividend, \dividend, \divisor
     1.1  mrg 	mov	\divisor,  \divisor,  lsr #1
     1.1  mrg 4:	cmp	\dividend, \divisor
     1.1  mrg 	subhs	\dividend, \dividend, \divisor
     1.1  mrg 5:
     1.1  mrg
 1.1.1.8  mrg #endif /* !defined (__ARM_FEATURE_CLZ) || defined (__OPTIMIZE_SIZE__) */
     1.1  mrg
     1.1  mrg .endm
     1.1  mrg /* ------------------------------------------------------------------------ */
     1.1  mrg .macro THUMB_DIV_MOD_BODY modulo
     1.1  mrg 	@ Load the constant 0x10000000 into our work register.
 1.1.1.9  mrg 	movs	work, #1
 1.1.1.9  mrg 	lsls	work, #28
     1.1  mrg LSYM(Loop1):
     1.1  mrg 	@ Unless the divisor is very big, shift it up in multiples of
     1.1  mrg 	@ four bits, since this is the amount of unwinding in the main
     1.1  mrg 	@ division loop.  Continue shifting until the divisor is
     1.1  mrg 	@ larger than the dividend.
     1.1  mrg 	cmp	divisor, work
     1.1  mrg 	bhs	LSYM(Lbignum)
     1.1  mrg 	cmp	divisor, dividend
     1.1  mrg 	bhs	LSYM(Lbignum)
 1.1.1.9  mrg 	lsls	divisor, #4
 1.1.1.9  mrg 	lsls	curbit,  #4
     1.1  mrg 	b	LSYM(Loop1)
     1.1  mrg LSYM(Lbignum):
     1.1  mrg 	@ Set work to 0x80000000
 1.1.1.9  mrg 	lsls	work, #3
     1.1  mrg LSYM(Loop2):
     1.1  mrg 	@ For very big divisors, we must shift it a bit at a time, or
     1.1  mrg 	@ we will be in danger of overflowing.
     1.1  mrg 	cmp	divisor, work
     1.1  mrg 	bhs	LSYM(Loop3)
     1.1  mrg 	cmp	divisor, dividend
     1.1  mrg 	bhs	LSYM(Loop3)
 1.1.1.9  mrg 	lsls	divisor, #1
 1.1.1.9  mrg 	lsls	curbit,  #1
     1.1  mrg 	b	LSYM(Loop2)
     1.1  mrg LSYM(Loop3):
     1.1  mrg 	@ Test for possible subtractions ...
     1.1  mrg   .if \modulo
     1.1  mrg 	@ ... On the final pass, this may subtract too much from the dividend,
     1.1  mrg 	@ so keep track of which subtractions are done, we can fix them up
     1.1  mrg 	@ afterwards.
 1.1.1.9  mrg 	movs	overdone, #0
     1.1  mrg 	cmp	dividend, divisor
     1.1  mrg 	blo	LSYM(Lover1)
 1.1.1.9  mrg 	subs	dividend, dividend, divisor
     1.1  mrg LSYM(Lover1):
 1.1.1.9  mrg 	lsrs	work, divisor, #1
     1.1  mrg 	cmp	dividend, work
     1.1  mrg 	blo	LSYM(Lover2)
 1.1.1.9  mrg 	subs	dividend, dividend, work
     1.1  mrg 	mov	ip, curbit
 1.1.1.9  mrg 	movs	work, #1
 1.1.1.9  mrg 	rors	curbit, work
 1.1.1.9  mrg 	orrs	overdone, curbit
     1.1  mrg 	mov	curbit, ip
     1.1  mrg LSYM(Lover2):
 1.1.1.9  mrg 	lsrs	work, divisor, #2
     1.1  mrg 	cmp	dividend, work
     1.1  mrg 	blo	LSYM(Lover3)
 1.1.1.9  mrg 	subs	dividend, dividend, work
     1.1  mrg 	mov	ip, curbit
 1.1.1.9  mrg 	movs	work, #2
 1.1.1.9  mrg 	rors	curbit, work
 1.1.1.9  mrg 	orrs	overdone, curbit
     1.1  mrg 	mov	curbit, ip
     1.1  mrg LSYM(Lover3):
 1.1.1.9  mrg 	lsrs	work, divisor, #3
     1.1  mrg 	cmp	dividend, work
     1.1  mrg 	blo	LSYM(Lover4)
 1.1.1.9  mrg 	subs	dividend, dividend, work
     1.1  mrg 	mov	ip, curbit
 1.1.1.9  mrg 	movs	work, #3
 1.1.1.9  mrg 	rors	curbit, work
 1.1.1.9  mrg 	orrs	overdone, curbit
     1.1  mrg 	mov	curbit, ip
     1.1  mrg LSYM(Lover4):
     1.1  mrg 	mov	ip, curbit
     1.1  mrg   .else
     1.1  mrg 	@ ... and note which bits are done in the result.  On the final pass,
     1.1  mrg 	@ this may subtract too much from the dividend, but the result will be ok,
     1.1  mrg 	@ since the "bit" will have been shifted out at the bottom.
     1.1  mrg 	cmp	dividend, divisor
     1.1  mrg 	blo	LSYM(Lover1)
 1.1.1.9  mrg 	subs	dividend, dividend, divisor
 1.1.1.9  mrg 	orrs	result, result, curbit
     1.1  mrg LSYM(Lover1):
 1.1.1.9  mrg 	lsrs	work, divisor, #1
     1.1  mrg 	cmp	dividend, work
     1.1  mrg 	blo	LSYM(Lover2)
 1.1.1.9  mrg 	subs	dividend, dividend, work
 1.1.1.9  mrg 	lsrs	work, curbit, #1
 1.1.1.9  mrg 	orrs	result, work
     1.1  mrg LSYM(Lover2):
 1.1.1.9  mrg 	lsrs	work, divisor, #2
     1.1  mrg 	cmp	dividend, work
     1.1  mrg 	blo	LSYM(Lover3)
 1.1.1.9  mrg 	subs	dividend, dividend, work
 1.1.1.9  mrg 	lsrs	work, curbit, #2
 1.1.1.9  mrg 	orrs	result, work
     1.1  mrg LSYM(Lover3):
 1.1.1.9  mrg 	lsrs	work, divisor, #3
     1.1  mrg 	cmp	dividend, work
     1.1  mrg 	blo	LSYM(Lover4)
 1.1.1.9  mrg 	subs	dividend, dividend, work
 1.1.1.9  mrg 	lsrs	work, curbit, #3
 1.1.1.9  mrg 	orrs	result, work
     1.1  mrg LSYM(Lover4):
     1.1  mrg   .endif
     1.1  mrg
     1.1  mrg 	cmp	dividend, #0			@ Early termination?
     1.1  mrg 	beq	LSYM(Lover5)
 1.1.1.9  mrg 	lsrs	curbit,  #4			@ No, any more bits to do?
     1.1  mrg 	beq	LSYM(Lover5)
 1.1.1.9  mrg 	lsrs	divisor, #4
     1.1  mrg 	b	LSYM(Loop3)
     1.1  mrg LSYM(Lover5):
     1.1  mrg   .if \modulo
     1.1  mrg 	@ Any subtractions that we should not have done will be recorded in
     1.1  mrg 	@ the top three bits of "overdone".  Exactly which were not needed
     1.1  mrg 	@ are governed by the position of the bit, stored in ip.
 1.1.1.9  mrg 	movs	work, #0xe
 1.1.1.9  mrg 	lsls	work, #28
 1.1.1.9  mrg 	ands	overdone, work
     1.1  mrg 	beq	LSYM(Lgot_result)
     1.1  mrg
     1.1  mrg 	@ If we terminated early, because dividend became zero, then the
     1.1  mrg 	@ bit in ip will not be in the bottom nibble, and we should not
     1.1  mrg 	@ perform the additions below.  We must test for this though
     1.1  mrg 	@ (rather relying upon the TSTs to prevent the additions) since
     1.1  mrg 	@ the bit in ip could be in the top two bits which might then match
     1.1  mrg 	@ with one of the smaller RORs.
     1.1  mrg 	mov	curbit, ip
 1.1.1.9  mrg 	movs	work, #0x7
     1.1  mrg 	tst	curbit, work
     1.1  mrg 	beq	LSYM(Lgot_result)
     1.1  mrg
     1.1  mrg 	mov	curbit, ip
 1.1.1.9  mrg 	movs	work, #3
 1.1.1.9  mrg 	rors	curbit, work
     1.1  mrg 	tst	overdone, curbit
     1.1  mrg 	beq	LSYM(Lover6)
 1.1.1.9  mrg 	lsrs	work, divisor, #3
 1.1.1.9  mrg 	adds	dividend, work
     1.1  mrg LSYM(Lover6):
     1.1  mrg 	mov	curbit, ip
 1.1.1.9  mrg 	movs	work, #2
 1.1.1.9  mrg 	rors	curbit, work
     1.1  mrg 	tst	overdone, curbit
     1.1  mrg 	beq	LSYM(Lover7)
 1.1.1.9  mrg 	lsrs	work, divisor, #2
 1.1.1.9  mrg 	adds	dividend, work
     1.1  mrg LSYM(Lover7):
     1.1  mrg 	mov	curbit, ip
 1.1.1.9  mrg 	movs	work, #1
 1.1.1.9  mrg 	rors	curbit, work
     1.1  mrg 	tst	overdone, curbit
     1.1  mrg 	beq	LSYM(Lgot_result)
 1.1.1.9  mrg 	lsrs	work, divisor, #1
 1.1.1.9  mrg 	adds	dividend, work
     1.1  mrg   .endif
     1.1  mrg LSYM(Lgot_result):
 1.1.1.4  mrg .endm
 1.1.1.4  mrg
 1.1.1.4  mrg /* If performance is preferred, the following functions are provided.  */
 1.1.1.4  mrg #if defined(__prefer_thumb__) && !defined(__OPTIMIZE_SIZE__)
 1.1.1.4  mrg
 1.1.1.4  mrg /* Branch to div(n), and jump to label if curbit is lo than divisior.  */
 1.1.1.4  mrg .macro BranchToDiv n, label
 1.1.1.9  mrg 	lsrs	curbit, dividend, \n
 1.1.1.4  mrg 	cmp	curbit, divisor
 1.1.1.4  mrg 	blo	\label
 1.1.1.4  mrg .endm
 1.1.1.4  mrg
 1.1.1.4  mrg /* Body of div(n).  Shift the divisor in n bits and compare the divisor
 1.1.1.4  mrg    and dividend.  Update the dividend as the substruction result.  */
 1.1.1.4  mrg .macro DoDiv n
 1.1.1.9  mrg 	lsrs	curbit, dividend, \n
 1.1.1.4  mrg 	cmp	curbit, divisor
 1.1.1.4  mrg 	bcc	1f
 1.1.1.9  mrg 	lsls	curbit, divisor, \n
 1.1.1.9  mrg 	subs	dividend, dividend, curbit
 1.1.1.4  mrg
 1.1.1.9  mrg 1:	adcs	result, result
 1.1.1.4  mrg .endm
 1.1.1.4  mrg
 1.1.1.4  mrg /* The body of division with positive divisor.  Unless the divisor is very
 1.1.1.4  mrg    big, shift it up in multiples of four bits, since this is the amount of
 1.1.1.4  mrg    unwinding in the main division loop.  Continue shifting until the divisor
 1.1.1.4  mrg    is larger than the dividend.  */
 1.1.1.4  mrg .macro THUMB1_Div_Positive
 1.1.1.9  mrg 	movs	result, #0
 1.1.1.4  mrg 	BranchToDiv #1, LSYM(Lthumb1_div1)
 1.1.1.4  mrg 	BranchToDiv #4, LSYM(Lthumb1_div4)
 1.1.1.4  mrg 	BranchToDiv #8, LSYM(Lthumb1_div8)
 1.1.1.4  mrg 	BranchToDiv #12, LSYM(Lthumb1_div12)
 1.1.1.4  mrg 	BranchToDiv #16, LSYM(Lthumb1_div16)
 1.1.1.4  mrg LSYM(Lthumb1_div_large_positive):
 1.1.1.9  mrg 	movs	result, #0xff
 1.1.1.9  mrg 	lsls	divisor, divisor, #8
 1.1.1.4  mrg 	rev	result, result
 1.1.1.9  mrg 	lsrs	curbit, dividend, #16
 1.1.1.4  mrg 	cmp	curbit, divisor
 1.1.1.4  mrg 	blo	1f
 1.1.1.9  mrg 	asrs	result, #8
 1.1.1.9  mrg 	lsls	divisor, divisor, #8
 1.1.1.4  mrg 	beq	LSYM(Ldivbyzero_waypoint)
 1.1.1.4  mrg
 1.1.1.9  mrg 1:	lsrs	curbit, dividend, #12
 1.1.1.4  mrg 	cmp	curbit, divisor
 1.1.1.4  mrg 	blo	LSYM(Lthumb1_div12)
 1.1.1.4  mrg 	b	LSYM(Lthumb1_div16)
 1.1.1.4  mrg LSYM(Lthumb1_div_loop):
 1.1.1.9  mrg 	lsrs	divisor, divisor, #8
 1.1.1.4  mrg LSYM(Lthumb1_div16):
 1.1.1.4  mrg 	Dodiv	#15
 1.1.1.4  mrg 	Dodiv	#14
 1.1.1.4  mrg 	Dodiv	#13
 1.1.1.4  mrg 	Dodiv	#12
 1.1.1.4  mrg LSYM(Lthumb1_div12):
 1.1.1.4  mrg 	Dodiv	#11
 1.1.1.4  mrg 	Dodiv	#10
 1.1.1.4  mrg 	Dodiv	#9
 1.1.1.4  mrg 	Dodiv	#8
 1.1.1.4  mrg 	bcs	LSYM(Lthumb1_div_loop)
 1.1.1.4  mrg LSYM(Lthumb1_div8):
 1.1.1.4  mrg 	Dodiv	#7
 1.1.1.4  mrg 	Dodiv	#6
 1.1.1.4  mrg 	Dodiv	#5
 1.1.1.4  mrg LSYM(Lthumb1_div5):
 1.1.1.4  mrg 	Dodiv	#4
 1.1.1.4  mrg LSYM(Lthumb1_div4):
 1.1.1.4  mrg 	Dodiv	#3
 1.1.1.4  mrg LSYM(Lthumb1_div3):
 1.1.1.4  mrg 	Dodiv	#2
 1.1.1.4  mrg LSYM(Lthumb1_div2):
 1.1.1.4  mrg 	Dodiv	#1
 1.1.1.4  mrg LSYM(Lthumb1_div1):
 1.1.1.9  mrg 	subs	divisor, dividend, divisor
 1.1.1.4  mrg 	bcs	1f
 1.1.1.4  mrg 	cpy	divisor, dividend
 1.1.1.4  mrg
 1.1.1.9  mrg 1:	adcs	result, result
 1.1.1.4  mrg 	cpy	dividend, result
 1.1.1.4  mrg 	RET
 1.1.1.4  mrg
 1.1.1.4  mrg LSYM(Ldivbyzero_waypoint):
 1.1.1.4  mrg 	b	LSYM(Ldiv0)
 1.1.1.4  mrg .endm
 1.1.1.4  mrg
 1.1.1.4  mrg /* The body of division with negative divisor.  Similar with
 1.1.1.4  mrg    THUMB1_Div_Positive except that the shift steps are in multiples
 1.1.1.4  mrg    of six bits.  */
 1.1.1.4  mrg .macro THUMB1_Div_Negative
 1.1.1.9  mrg 	lsrs	result, divisor, #31
 1.1.1.4  mrg 	beq	1f
 1.1.1.9  mrg 	negs	divisor, divisor
 1.1.1.4  mrg
 1.1.1.9  mrg 1:	asrs	curbit, dividend, #32
 1.1.1.4  mrg 	bcc	2f
 1.1.1.9  mrg 	negs	dividend, dividend
 1.1.1.4  mrg
 1.1.1.9  mrg 2:	eors	curbit, result
 1.1.1.9  mrg 	movs	result, #0
 1.1.1.4  mrg 	cpy	ip, curbit
 1.1.1.4  mrg 	BranchToDiv #4, LSYM(Lthumb1_div_negative4)
 1.1.1.4  mrg 	BranchToDiv #8, LSYM(Lthumb1_div_negative8)
 1.1.1.4  mrg LSYM(Lthumb1_div_large):
 1.1.1.9  mrg 	movs	result, #0xfc
 1.1.1.9  mrg 	lsls	divisor, divisor, #6
 1.1.1.4  mrg 	rev	result, result
 1.1.1.9  mrg 	lsrs	curbit, dividend, #8
 1.1.1.4  mrg 	cmp	curbit, divisor
 1.1.1.4  mrg 	blo	LSYM(Lthumb1_div_negative8)
 1.1.1.4  mrg
 1.1.1.9  mrg 	lsls	divisor, divisor, #6
 1.1.1.9  mrg 	asrs	result, result, #6
 1.1.1.4  mrg 	cmp	curbit, divisor
 1.1.1.4  mrg 	blo	LSYM(Lthumb1_div_negative8)
 1.1.1.4  mrg
 1.1.1.9  mrg 	lsls	divisor, divisor, #6
 1.1.1.9  mrg 	asrs	result, result, #6
 1.1.1.4  mrg 	cmp	curbit, divisor
 1.1.1.4  mrg 	blo	LSYM(Lthumb1_div_negative8)
 1.1.1.4  mrg
 1.1.1.9  mrg 	lsls	divisor, divisor, #6
 1.1.1.4  mrg 	beq	LSYM(Ldivbyzero_negative)
 1.1.1.9  mrg 	asrs	result, result, #6
 1.1.1.4  mrg 	b	LSYM(Lthumb1_div_negative8)
 1.1.1.4  mrg LSYM(Lthumb1_div_negative_loop):
 1.1.1.9  mrg 	lsrs	divisor, divisor, #6
 1.1.1.4  mrg LSYM(Lthumb1_div_negative8):
 1.1.1.4  mrg 	DoDiv	#7
 1.1.1.4  mrg 	DoDiv	#6
 1.1.1.4  mrg 	DoDiv	#5
 1.1.1.4  mrg 	DoDiv	#4
 1.1.1.4  mrg LSYM(Lthumb1_div_negative4):
 1.1.1.4  mrg 	DoDiv	#3
 1.1.1.4  mrg 	DoDiv	#2
 1.1.1.4  mrg 	bcs	LSYM(Lthumb1_div_negative_loop)
 1.1.1.4  mrg 	DoDiv	#1
 1.1.1.9  mrg 	subs	divisor, dividend, divisor
 1.1.1.4  mrg 	bcs	1f
 1.1.1.4  mrg 	cpy	divisor, dividend
 1.1.1.4  mrg
 1.1.1.4  mrg 1:	cpy	curbit, ip
 1.1.1.9  mrg 	adcs	result, result
 1.1.1.9  mrg 	asrs	curbit, curbit, #1
 1.1.1.4  mrg 	cpy	dividend, result
 1.1.1.4  mrg 	bcc	2f
 1.1.1.9  mrg 	negs	dividend, dividend
 1.1.1.4  mrg 	cmp	curbit, #0
 1.1.1.4  mrg
 1.1.1.4  mrg 2:	bpl	3f
 1.1.1.9  mrg 	negs	divisor, divisor
 1.1.1.4  mrg
 1.1.1.4  mrg 3:	RET
 1.1.1.4  mrg
 1.1.1.4  mrg LSYM(Ldivbyzero_negative):
 1.1.1.4  mrg 	cpy	curbit, ip
 1.1.1.9  mrg 	asrs	curbit, curbit, #1
 1.1.1.4  mrg 	bcc	LSYM(Ldiv0)
 1.1.1.9  mrg 	negs	dividend, dividend
 1.1.1.4  mrg .endm
 1.1.1.4  mrg #endif /* ARM Thumb version.  */
 1.1.1.4  mrg
     1.1  mrg /* ------------------------------------------------------------------------ */
     1.1  mrg /*		Start of the Real Functions				    */
     1.1  mrg /* ------------------------------------------------------------------------ */
     1.1  mrg #ifdef L_udivsi3
     1.1  mrg
     1.1  mrg #if defined(__prefer_thumb__)
     1.1  mrg
     1.1  mrg 	FUNC_START udivsi3
     1.1  mrg 	FUNC_ALIAS aeabi_uidiv udivsi3
 1.1.1.4  mrg #if defined(__OPTIMIZE_SIZE__)
     1.1  mrg
     1.1  mrg 	cmp	divisor, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
     1.1  mrg LSYM(udivsi3_skip_div0_test):
 1.1.1.9  mrg 	movs	curbit, #1
 1.1.1.9  mrg 	movs	result, #0
     1.1  mrg
     1.1  mrg 	push	{ work }
     1.1  mrg 	cmp	dividend, divisor
     1.1  mrg 	blo	LSYM(Lgot_result)
     1.1  mrg
     1.1  mrg 	THUMB_DIV_MOD_BODY 0
     1.1  mrg
 1.1.1.9  mrg 	movs	r0, result
     1.1  mrg 	pop	{ work }
     1.1  mrg 	RET
     1.1  mrg
 1.1.1.4  mrg /* Implementation of aeabi_uidiv for ARMv6m.  This version is only
 1.1.1.4  mrg    used in ARMv6-M when we need an efficient implementation.  */
 1.1.1.4  mrg #else
 1.1.1.4  mrg LSYM(udivsi3_skip_div0_test):
 1.1.1.4  mrg 	THUMB1_Div_Positive
 1.1.1.4  mrg
 1.1.1.4  mrg #endif /* __OPTIMIZE_SIZE__ */
 1.1.1.4  mrg
     1.1  mrg #elif defined(__ARM_ARCH_EXT_IDIV__)
     1.1  mrg
     1.1  mrg 	ARM_FUNC_START udivsi3
     1.1  mrg 	ARM_FUNC_ALIAS aeabi_uidiv udivsi3
     1.1  mrg
     1.1  mrg 	cmp	r1, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
     1.1  mrg
     1.1  mrg 	udiv	r0, r0, r1
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg #else /* ARM version/Thumb-2.  */
     1.1  mrg
     1.1  mrg 	ARM_FUNC_START udivsi3
     1.1  mrg 	ARM_FUNC_ALIAS aeabi_uidiv udivsi3
     1.1  mrg
     1.1  mrg 	/* Note: if called via udivsi3_skip_div0_test, this will unnecessarily
     1.1  mrg 	   check for division-by-zero a second time.  */
     1.1  mrg LSYM(udivsi3_skip_div0_test):
     1.1  mrg 	subs	r2, r1, #1
     1.1  mrg 	do_it	eq
     1.1  mrg 	RETc(eq)
     1.1  mrg 	bcc	LSYM(Ldiv0)
     1.1  mrg 	cmp	r0, r1
     1.1  mrg 	bls	11f
     1.1  mrg 	tst	r1, r2
     1.1  mrg 	beq	12f
     1.1  mrg
     1.1  mrg 	ARM_DIV_BODY r0, r1, r2, r3
     1.1  mrg
     1.1  mrg 	mov	r0, r2
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg 11:	do_it	eq, e
     1.1  mrg 	moveq	r0, #1
     1.1  mrg 	movne	r0, #0
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg 12:	ARM_DIV2_ORDER r1, r2
     1.1  mrg
     1.1  mrg 	mov	r0, r0, lsr r2
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg #endif /* ARM version */
     1.1  mrg
     1.1  mrg 	DIV_FUNC_END udivsi3 unsigned
     1.1  mrg
     1.1  mrg #if defined(__prefer_thumb__)
     1.1  mrg FUNC_START aeabi_uidivmod
     1.1  mrg 	cmp	r1, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
 1.1.1.4  mrg # if defined(__OPTIMIZE_SIZE__)
     1.1  mrg 	push	{r0, r1, lr}
     1.1  mrg 	bl	LSYM(udivsi3_skip_div0_test)
     1.1  mrg 	POP	{r1, r2, r3}
 1.1.1.9  mrg 	muls	r2, r0
 1.1.1.9  mrg 	subs	r1, r1, r2
     1.1  mrg 	bx	r3
 1.1.1.4  mrg # else
 1.1.1.4  mrg 	/* Both the quotient and remainder are calculated simultaneously
 1.1.1.4  mrg 	   in THUMB1_Div_Positive.  There is no need to calculate the
 1.1.1.4  mrg 	   remainder again here.  */
 1.1.1.4  mrg 	b	LSYM(udivsi3_skip_div0_test)
 1.1.1.4  mrg 	RET
 1.1.1.4  mrg # endif /* __OPTIMIZE_SIZE__ */
 1.1.1.4  mrg
     1.1  mrg #elif defined(__ARM_ARCH_EXT_IDIV__)
     1.1  mrg ARM_FUNC_START aeabi_uidivmod
     1.1  mrg 	cmp	r1, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
 1.1.1.9  mrg 	mov     r2, r0
     1.1  mrg 	udiv	r0, r0, r1
     1.1  mrg 	mls     r1, r0, r1, r2
     1.1  mrg 	RET
     1.1  mrg #else
     1.1  mrg ARM_FUNC_START aeabi_uidivmod
     1.1  mrg 	cmp	r1, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
     1.1  mrg 	stmfd	sp!, { r0, r1, lr }
     1.1  mrg 	bl	LSYM(udivsi3_skip_div0_test)
     1.1  mrg 	ldmfd	sp!, { r1, r2, lr }
     1.1  mrg 	mul	r3, r2, r0
     1.1  mrg 	sub	r1, r1, r3
     1.1  mrg 	RET
     1.1  mrg #endif
     1.1  mrg 	FUNC_END aeabi_uidivmod
     1.1  mrg
     1.1  mrg #endif /* L_udivsi3 */
     1.1  mrg /* ------------------------------------------------------------------------ */
     1.1  mrg #ifdef L_umodsi3
     1.1  mrg
 1.1.1.4  mrg #if defined(__ARM_ARCH_EXT_IDIV__) && __ARM_ARCH_ISA_THUMB != 1
     1.1  mrg
     1.1  mrg 	ARM_FUNC_START umodsi3
     1.1  mrg
     1.1  mrg 	cmp	r1, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
     1.1  mrg 	udiv	r2, r0, r1
     1.1  mrg 	mls     r0, r1, r2, r0
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg #elif defined(__thumb__)
     1.1  mrg
     1.1  mrg 	FUNC_START umodsi3
     1.1  mrg
     1.1  mrg 	cmp	divisor, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
 1.1.1.9  mrg 	movs	curbit, #1
     1.1  mrg 	cmp	dividend, divisor
     1.1  mrg 	bhs	LSYM(Lover10)
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg LSYM(Lover10):
     1.1  mrg 	push	{ work }
     1.1  mrg
     1.1  mrg 	THUMB_DIV_MOD_BODY 1
     1.1  mrg
     1.1  mrg 	pop	{ work }
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg #else  /* ARM version.  */
 1.1.1.4  mrg
     1.1  mrg 	FUNC_START umodsi3
     1.1  mrg
     1.1  mrg 	subs	r2, r1, #1			@ compare divisor with 1
     1.1  mrg 	bcc	LSYM(Ldiv0)
     1.1  mrg 	cmpne	r0, r1				@ compare dividend with divisor
     1.1  mrg 	moveq   r0, #0
     1.1  mrg 	tsthi	r1, r2				@ see if divisor is power of 2
     1.1  mrg 	andeq	r0, r0, r2
     1.1  mrg 	RETc(ls)
     1.1  mrg
     1.1  mrg 	ARM_MOD_BODY r0, r1, r2, r3
     1.1  mrg
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg #endif /* ARM version.  */
     1.1  mrg
     1.1  mrg 	DIV_FUNC_END umodsi3 unsigned
     1.1  mrg
     1.1  mrg #endif /* L_umodsi3 */
     1.1  mrg /* ------------------------------------------------------------------------ */
     1.1  mrg #ifdef L_divsi3
     1.1  mrg
     1.1  mrg #if defined(__prefer_thumb__)
     1.1  mrg
 1.1.1.4  mrg 	FUNC_START divsi3
     1.1  mrg 	FUNC_ALIAS aeabi_idiv divsi3
 1.1.1.4  mrg #if defined(__OPTIMIZE_SIZE__)
     1.1  mrg
     1.1  mrg 	cmp	divisor, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
     1.1  mrg LSYM(divsi3_skip_div0_test):
     1.1  mrg 	push	{ work }
 1.1.1.9  mrg 	movs	work, dividend
 1.1.1.9  mrg 	eors	work, divisor		@ Save the sign of the result.
     1.1  mrg 	mov	ip, work
 1.1.1.9  mrg 	movs	curbit, #1
 1.1.1.9  mrg 	movs	result, #0
     1.1  mrg 	cmp	divisor, #0
     1.1  mrg 	bpl	LSYM(Lover10)
 1.1.1.9  mrg 	negs	divisor, divisor	@ Loops below use unsigned.
     1.1  mrg LSYM(Lover10):
     1.1  mrg 	cmp	dividend, #0
     1.1  mrg 	bpl	LSYM(Lover11)
 1.1.1.9  mrg 	negs	dividend, dividend
     1.1  mrg LSYM(Lover11):
     1.1  mrg 	cmp	dividend, divisor
     1.1  mrg 	blo	LSYM(Lgot_result)
     1.1  mrg
     1.1  mrg 	THUMB_DIV_MOD_BODY 0
 1.1.1.4  mrg
 1.1.1.9  mrg 	movs	r0, result
     1.1  mrg 	mov	work, ip
     1.1  mrg 	cmp	work, #0
     1.1  mrg 	bpl	LSYM(Lover12)
 1.1.1.9  mrg 	negs	r0, r0
     1.1  mrg LSYM(Lover12):
     1.1  mrg 	pop	{ work }
     1.1  mrg 	RET
     1.1  mrg
 1.1.1.4  mrg /* Implementation of aeabi_idiv for ARMv6m.  This version is only
 1.1.1.4  mrg    used in ARMv6-M when we need an efficient implementation.  */
 1.1.1.4  mrg #else
 1.1.1.4  mrg LSYM(divsi3_skip_div0_test):
 1.1.1.4  mrg 	cpy	curbit, dividend
 1.1.1.9  mrg 	orrs	curbit, divisor
 1.1.1.4  mrg 	bmi	LSYM(Lthumb1_div_negative)
 1.1.1.4  mrg
 1.1.1.4  mrg LSYM(Lthumb1_div_positive):
 1.1.1.4  mrg 	THUMB1_Div_Positive
 1.1.1.4  mrg
 1.1.1.4  mrg LSYM(Lthumb1_div_negative):
 1.1.1.4  mrg 	THUMB1_Div_Negative
 1.1.1.4  mrg
 1.1.1.4  mrg #endif /* __OPTIMIZE_SIZE__ */
 1.1.1.4  mrg
     1.1  mrg #elif defined(__ARM_ARCH_EXT_IDIV__)
     1.1  mrg
     1.1  mrg 	ARM_FUNC_START divsi3
     1.1  mrg 	ARM_FUNC_ALIAS aeabi_idiv divsi3
     1.1  mrg
     1.1  mrg 	cmp 	r1, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
     1.1  mrg 	sdiv	r0, r0, r1
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg #else /* ARM/Thumb-2 version.  */
 1.1.1.4  mrg
 1.1.1.4  mrg 	ARM_FUNC_START divsi3
     1.1  mrg 	ARM_FUNC_ALIAS aeabi_idiv divsi3
     1.1  mrg
     1.1  mrg 	cmp	r1, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
     1.1  mrg LSYM(divsi3_skip_div0_test):
     1.1  mrg 	eor	ip, r0, r1			@ save the sign of the result.
     1.1  mrg 	do_it	mi
     1.1  mrg 	rsbmi	r1, r1, #0			@ loops below use unsigned.
     1.1  mrg 	subs	r2, r1, #1			@ division by 1 or -1 ?
     1.1  mrg 	beq	10f
     1.1  mrg 	movs	r3, r0
     1.1  mrg 	do_it	mi
     1.1  mrg 	rsbmi	r3, r0, #0			@ positive dividend value
     1.1  mrg 	cmp	r3, r1
     1.1  mrg 	bls	11f
     1.1  mrg 	tst	r1, r2				@ divisor is power of 2 ?
     1.1  mrg 	beq	12f
     1.1  mrg
     1.1  mrg 	ARM_DIV_BODY r3, r1, r0, r2
     1.1  mrg
     1.1  mrg 	cmp	ip, #0
     1.1  mrg 	do_it	mi
     1.1  mrg 	rsbmi	r0, r0, #0
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg 10:	teq	ip, r0				@ same sign ?
     1.1  mrg 	do_it	mi
     1.1  mrg 	rsbmi	r0, r0, #0
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg 11:	do_it	lo
     1.1  mrg 	movlo	r0, #0
     1.1  mrg 	do_it	eq,t
     1.1  mrg 	moveq	r0, ip, asr #31
     1.1  mrg 	orreq	r0, r0, #1
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg 12:	ARM_DIV2_ORDER r1, r2
     1.1  mrg
     1.1  mrg 	cmp	ip, #0
     1.1  mrg 	mov	r0, r3, lsr r2
     1.1  mrg 	do_it	mi
     1.1  mrg 	rsbmi	r0, r0, #0
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg #endif /* ARM version */
     1.1  mrg
     1.1  mrg 	DIV_FUNC_END divsi3 signed
     1.1  mrg
     1.1  mrg #if defined(__prefer_thumb__)
     1.1  mrg FUNC_START aeabi_idivmod
     1.1  mrg 	cmp	r1, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
 1.1.1.4  mrg # if defined(__OPTIMIZE_SIZE__)
     1.1  mrg 	push	{r0, r1, lr}
     1.1  mrg 	bl	LSYM(divsi3_skip_div0_test)
     1.1  mrg 	POP	{r1, r2, r3}
 1.1.1.9  mrg 	muls	r2, r0
 1.1.1.9  mrg 	subs	r1, r1, r2
     1.1  mrg 	bx	r3
 1.1.1.4  mrg # else
 1.1.1.4  mrg 	/* Both the quotient and remainder are calculated simultaneously
 1.1.1.4  mrg 	   in THUMB1_Div_Positive and THUMB1_Div_Negative.  There is no
 1.1.1.4  mrg 	   need to calculate the remainder again here.  */
 1.1.1.4  mrg 	b	LSYM(divsi3_skip_div0_test)
 1.1.1.4  mrg 	RET
 1.1.1.4  mrg # endif /* __OPTIMIZE_SIZE__ */
 1.1.1.4  mrg
     1.1  mrg #elif defined(__ARM_ARCH_EXT_IDIV__)
     1.1  mrg ARM_FUNC_START aeabi_idivmod
     1.1  mrg 	cmp 	r1, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
     1.1  mrg 	mov     r2, r0
     1.1  mrg 	sdiv	r0, r0, r1
     1.1  mrg 	mls     r1, r0, r1, r2
     1.1  mrg 	RET
     1.1  mrg #else
     1.1  mrg ARM_FUNC_START aeabi_idivmod
     1.1  mrg 	cmp	r1, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
     1.1  mrg 	stmfd	sp!, { r0, r1, lr }
     1.1  mrg 	bl	LSYM(divsi3_skip_div0_test)
     1.1  mrg 	ldmfd	sp!, { r1, r2, lr }
     1.1  mrg 	mul	r3, r2, r0
     1.1  mrg 	sub	r1, r1, r3
     1.1  mrg 	RET
     1.1  mrg #endif
     1.1  mrg 	FUNC_END aeabi_idivmod
     1.1  mrg
     1.1  mrg #endif /* L_divsi3 */
     1.1  mrg /* ------------------------------------------------------------------------ */
     1.1  mrg #ifdef L_modsi3
     1.1  mrg
 1.1.1.4  mrg #if defined(__ARM_ARCH_EXT_IDIV__) && __ARM_ARCH_ISA_THUMB != 1
     1.1  mrg
     1.1  mrg 	ARM_FUNC_START modsi3
     1.1  mrg
     1.1  mrg 	cmp	r1, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
     1.1  mrg
     1.1  mrg 	sdiv	r2, r0, r1
     1.1  mrg 	mls     r0, r1, r2, r0
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg #elif defined(__thumb__)
     1.1  mrg
     1.1  mrg 	FUNC_START modsi3
     1.1  mrg
 1.1.1.9  mrg 	movs	curbit, #1
     1.1  mrg 	cmp	divisor, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
     1.1  mrg 	bpl	LSYM(Lover10)
 1.1.1.9  mrg 	negs	divisor, divisor		@ Loops below use unsigned.
     1.1  mrg LSYM(Lover10):
     1.1  mrg 	push	{ work }
     1.1  mrg 	@ Need to save the sign of the dividend, unfortunately, we need
     1.1  mrg 	@ work later on.  Must do this after saving the original value of
     1.1  mrg 	@ the work register, because we will pop this value off first.
     1.1  mrg 	push	{ dividend }
     1.1  mrg 	cmp	dividend, #0
     1.1  mrg 	bpl	LSYM(Lover11)
 1.1.1.9  mrg 	negs	dividend, dividend
     1.1  mrg LSYM(Lover11):
     1.1  mrg 	cmp	dividend, divisor
     1.1  mrg 	blo	LSYM(Lgot_result)
     1.1  mrg
     1.1  mrg 	THUMB_DIV_MOD_BODY 1
     1.1  mrg
     1.1  mrg 	pop	{ work }
     1.1  mrg 	cmp	work, #0
     1.1  mrg 	bpl	LSYM(Lover12)
 1.1.1.9  mrg 	negs	dividend, dividend
     1.1  mrg LSYM(Lover12):
     1.1  mrg 	pop	{ work }
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg #else /* ARM version.  */
     1.1  mrg
     1.1  mrg 	FUNC_START modsi3
     1.1  mrg
     1.1  mrg 	cmp	r1, #0
     1.1  mrg 	beq	LSYM(Ldiv0)
     1.1  mrg 	rsbmi	r1, r1, #0			@ loops below use unsigned.
     1.1  mrg 	movs	ip, r0				@ preserve sign of dividend
     1.1  mrg 	rsbmi	r0, r0, #0			@ if negative make positive
     1.1  mrg 	subs	r2, r1, #1			@ compare divisor with 1
     1.1  mrg 	cmpne	r0, r1				@ compare dividend with divisor
     1.1  mrg 	moveq	r0, #0
     1.1  mrg 	tsthi	r1, r2				@ see if divisor is power of 2
     1.1  mrg 	andeq	r0, r0, r2
     1.1  mrg 	bls	10f
     1.1  mrg
     1.1  mrg 	ARM_MOD_BODY r0, r1, r2, r3
     1.1  mrg
     1.1  mrg 10:	cmp	ip, #0
     1.1  mrg 	rsbmi	r0, r0, #0
     1.1  mrg 	RET
     1.1  mrg
     1.1  mrg #endif /* ARM version */
     1.1  mrg
     1.1  mrg 	DIV_FUNC_END modsi3 signed
     1.1  mrg
     1.1  mrg #endif /* L_modsi3 */
     1.1  mrg /* ------------------------------------------------------------------------ */
     1.1  mrg #ifdef L_dvmd_tls
     1.1  mrg
     1.1  mrg #ifdef __ARM_EABI__
     1.1  mrg 	WEAK aeabi_idiv0
     1.1  mrg 	WEAK aeabi_ldiv0
     1.1  mrg 	FUNC_START aeabi_idiv0
     1.1  mrg 	FUNC_START aeabi_ldiv0
     1.1  mrg 	RET
     1.1  mrg 	FUNC_END aeabi_ldiv0
     1.1  mrg 	FUNC_END aeabi_idiv0
     1.1  mrg #else
     1.1  mrg 	FUNC_START div0
     1.1  mrg 	RET
     1.1  mrg 	FUNC_END div0
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg #endif /* L_divmodsi_tools */
     1.1  mrg /* ------------------------------------------------------------------------ */
     1.1  mrg #ifdef L_dvmd_lnx
     1.1  mrg @ GNU/Linux division-by zero handler.  Used in place of L_dvmd_tls
     1.1  mrg
     1.1  mrg /* Constant taken from <asm/signal.h>.  */
     1.1  mrg #define SIGFPE	8
     1.1  mrg
     1.1  mrg #ifdef __ARM_EABI__
 1.1.1.3  mrg 	cfi_start	__aeabi_ldiv0, LSYM(Lend_aeabi_ldiv0)
     1.1  mrg 	WEAK aeabi_idiv0
     1.1  mrg 	WEAK aeabi_ldiv0
     1.1  mrg 	ARM_FUNC_START aeabi_idiv0
     1.1  mrg 	ARM_FUNC_START aeabi_ldiv0
 1.1.1.3  mrg 	do_push	{r1, lr}
 1.1.1.3  mrg 98:	cfi_push 98b - __aeabi_ldiv0, 0xe, -0x4, 0x8
     1.1  mrg #else
 1.1.1.3  mrg 	cfi_start	__div0, LSYM(Lend_div0)
     1.1  mrg 	ARM_FUNC_START div0
 1.1.1.3  mrg 	do_push	{r1, lr}
 1.1.1.3  mrg 98:	cfi_push 98b - __div0, 0xe, -0x4, 0x8
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg 	mov	r0, #SIGFPE
     1.1  mrg 	bl	SYM(raise) __PLT__
 1.1.1.3  mrg 	RETLDM	r1 unwind=98b
     1.1  mrg
     1.1  mrg #ifdef __ARM_EABI__
 1.1.1.3  mrg 	cfi_end	LSYM(Lend_aeabi_ldiv0)
     1.1  mrg 	FUNC_END aeabi_ldiv0
     1.1  mrg 	FUNC_END aeabi_idiv0
     1.1  mrg #else
 1.1.1.3  mrg 	cfi_end	LSYM(Lend_div0)
     1.1  mrg 	FUNC_END div0
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg #endif /* L_dvmd_lnx */
     1.1  mrg #ifdef L_clear_cache
     1.1  mrg #if defined __ARM_EABI__ && defined __linux__
     1.1  mrg @ EABI GNU/Linux call to cacheflush syscall.
     1.1  mrg 	ARM_FUNC_START clear_cache
     1.1  mrg 	do_push	{r7}
 1.1.1.8  mrg #if __ARM_ARCH >= 7 || defined(__ARM_ARCH_6T2__)
     1.1  mrg 	movw	r7, #2
     1.1  mrg 	movt	r7, #0xf
     1.1  mrg #else
     1.1  mrg 	mov	r7, #0xf0000
     1.1  mrg 	add	r7, r7, #2
     1.1  mrg #endif
     1.1  mrg 	mov	r2, #0
1.1.1.11  mrg 	svc	0
     1.1  mrg 	do_pop	{r7}
     1.1  mrg 	RET
     1.1  mrg 	FUNC_END clear_cache
     1.1  mrg #else
     1.1  mrg #error "This is only for ARM EABI GNU/Linux"
     1.1  mrg #endif
     1.1  mrg #endif /* L_clear_cache */
 1.1.1.8  mrg
 1.1.1.8  mrg #ifdef L_speculation_barrier
 1.1.1.8  mrg 	FUNC_START speculation_barrier
 1.1.1.8  mrg #if __ARM_ARCH >= 7
 1.1.1.8  mrg 	isb
 1.1.1.8  mrg 	dsb sy
 1.1.1.8  mrg #elif defined __ARM_EABI__ && defined __linux__
 1.1.1.8  mrg 	/* We don't have a speculation barrier directly for this
 1.1.1.8  mrg 	   platform/architecture variant.  But we can use a kernel
 1.1.1.8  mrg 	   clear_cache service routine which will emit such instructions
 1.1.1.8  mrg 	   if run on a later version of the architecture.  We don't
 1.1.1.8  mrg 	   really want to flush the cache, but we must give it a valid
 1.1.1.8  mrg 	   address, so just clear pc..pc+1.  */
 1.1.1.8  mrg #if defined __thumb__ && !defined __thumb2__
 1.1.1.8  mrg 	push	{r7}
 1.1.1.9  mrg 	movs	r7, #0xf
 1.1.1.9  mrg 	lsls	r7, #16
 1.1.1.9  mrg 	adds	r7, #2
 1.1.1.8  mrg 	adr	r0, . + 4
 1.1.1.9  mrg 	adds	r1, r0, #1
 1.1.1.9  mrg 	movs	r2, #0
 1.1.1.8  mrg 	svc	0
 1.1.1.8  mrg 	pop	{r7}
 1.1.1.8  mrg #else
 1.1.1.8  mrg 	do_push	{r7}
 1.1.1.8  mrg #ifdef __ARM_ARCH_6T2__
 1.1.1.8  mrg 	movw	r7, #2
 1.1.1.8  mrg 	movt	r7, #0xf
 1.1.1.8  mrg #else
 1.1.1.8  mrg 	mov	r7, #0xf0000
 1.1.1.8  mrg 	add	r7, r7, #2
 1.1.1.8  mrg #endif
 1.1.1.8  mrg 	add	r0, pc, #0	/* ADR.  */
 1.1.1.8  mrg 	add	r1, r0, #1
 1.1.1.8  mrg 	mov	r2, #0
 1.1.1.8  mrg 	svc	0
 1.1.1.8  mrg 	do_pop	{r7}
 1.1.1.8  mrg #endif /* Thumb1 only */
 1.1.1.8  mrg #else
 1.1.1.8  mrg #warning "No speculation barrier defined for this platform"
 1.1.1.8  mrg #endif
 1.1.1.8  mrg 	RET
 1.1.1.8  mrg 	FUNC_END speculation_barrier
 1.1.1.8  mrg #endif
     1.1  mrg /* ------------------------------------------------------------------------ */
     1.1  mrg /* Dword shift operations.  */
     1.1  mrg /* All the following Dword shift variants rely on the fact that
     1.1  mrg 	shft xxx, Reg
     1.1  mrg    is in fact done as
     1.1  mrg 	shft xxx, (Reg & 255)
     1.1  mrg    so for Reg value in (32...63) and (-1...-31) we will get zero (in the
     1.1  mrg    case of logical shifts) or the sign (for asr).  */
     1.1  mrg
     1.1  mrg #ifdef __ARMEB__
     1.1  mrg #define al	r1
     1.1  mrg #define ah	r0
     1.1  mrg #else
     1.1  mrg #define al	r0
     1.1  mrg #define ah	r1
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg /* Prevent __aeabi double-word shifts from being produced on SymbianOS.  */
     1.1  mrg #ifndef __symbian__
     1.1  mrg
     1.1  mrg #ifdef L_lshrdi3
     1.1  mrg
     1.1  mrg 	FUNC_START lshrdi3
     1.1  mrg 	FUNC_ALIAS aeabi_llsr lshrdi3
     1.1  mrg
     1.1  mrg #ifdef __thumb__
 1.1.1.9  mrg 	lsrs	al, r2
 1.1.1.9  mrg 	movs	r3, ah
 1.1.1.9  mrg 	lsrs	ah, r2
     1.1  mrg 	mov	ip, r3
 1.1.1.9  mrg 	subs	r2, #32
 1.1.1.9  mrg 	lsrs	r3, r2
 1.1.1.9  mrg 	orrs	al, r3
 1.1.1.9  mrg 	negs	r2, r2
     1.1  mrg 	mov	r3, ip
 1.1.1.9  mrg 	lsls	r3, r2
 1.1.1.9  mrg 	orrs	al, r3
     1.1  mrg 	RET
     1.1  mrg #else
     1.1  mrg 	subs	r3, r2, #32
     1.1  mrg 	rsb	ip, r2, #32
     1.1  mrg 	movmi	al, al, lsr r2
     1.1  mrg 	movpl	al, ah, lsr r3
     1.1  mrg 	orrmi	al, al, ah, lsl ip
     1.1  mrg 	mov	ah, ah, lsr r2
     1.1  mrg 	RET
     1.1  mrg #endif
     1.1  mrg 	FUNC_END aeabi_llsr
     1.1  mrg 	FUNC_END lshrdi3
     1.1  mrg
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg #ifdef L_ashrdi3
     1.1  mrg
     1.1  mrg 	FUNC_START ashrdi3
     1.1  mrg 	FUNC_ALIAS aeabi_lasr ashrdi3
     1.1  mrg
     1.1  mrg #ifdef __thumb__
 1.1.1.9  mrg 	lsrs	al, r2
 1.1.1.9  mrg 	movs	r3, ah
 1.1.1.9  mrg 	asrs	ah, r2
 1.1.1.9  mrg 	subs	r2, #32
     1.1  mrg 	@ If r2 is negative at this point the following step would OR
     1.1  mrg 	@ the sign bit into all of AL.  That's not what we want...
     1.1  mrg 	bmi	1f
     1.1  mrg 	mov	ip, r3
 1.1.1.9  mrg 	asrs	r3, r2
 1.1.1.9  mrg 	orrs	al, r3
     1.1  mrg 	mov	r3, ip
     1.1  mrg 1:
 1.1.1.9  mrg 	negs	r2, r2
 1.1.1.9  mrg 	lsls	r3, r2
 1.1.1.9  mrg 	orrs	al, r3
     1.1  mrg 	RET
     1.1  mrg #else
     1.1  mrg 	subs	r3, r2, #32
     1.1  mrg 	rsb	ip, r2, #32
     1.1  mrg 	movmi	al, al, lsr r2
     1.1  mrg 	movpl	al, ah, asr r3
     1.1  mrg 	orrmi	al, al, ah, lsl ip
     1.1  mrg 	mov	ah, ah, asr r2
     1.1  mrg 	RET
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg 	FUNC_END aeabi_lasr
     1.1  mrg 	FUNC_END ashrdi3
     1.1  mrg
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg #ifdef L_ashldi3
     1.1  mrg
     1.1  mrg 	FUNC_START ashldi3
     1.1  mrg 	FUNC_ALIAS aeabi_llsl ashldi3
     1.1  mrg
     1.1  mrg #ifdef __thumb__
 1.1.1.9  mrg 	lsls	ah, r2
 1.1.1.9  mrg 	movs	r3, al
 1.1.1.9  mrg 	lsls	al, r2
     1.1  mrg 	mov	ip, r3
 1.1.1.9  mrg 	subs	r2, #32
 1.1.1.9  mrg 	lsls	r3, r2
 1.1.1.9  mrg 	orrs	ah, r3
 1.1.1.9  mrg 	negs	r2, r2
     1.1  mrg 	mov	r3, ip
 1.1.1.9  mrg 	lsrs	r3, r2
 1.1.1.9  mrg 	orrs	ah, r3
     1.1  mrg 	RET
     1.1  mrg #else
     1.1  mrg 	subs	r3, r2, #32
     1.1  mrg 	rsb	ip, r2, #32
     1.1  mrg 	movmi	ah, ah, lsl r2
     1.1  mrg 	movpl	ah, al, lsl r3
     1.1  mrg 	orrmi	ah, ah, al, lsr ip
     1.1  mrg 	mov	al, al, lsl r2
     1.1  mrg 	RET
     1.1  mrg #endif
     1.1  mrg 	FUNC_END aeabi_llsl
     1.1  mrg 	FUNC_END ashldi3
     1.1  mrg
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg #endif /* __symbian__ */
     1.1  mrg
     1.1  mrg #ifdef L_clzsi2
 1.1.1.4  mrg #ifdef NOT_ISA_TARGET_32BIT
     1.1  mrg FUNC_START clzsi2
 1.1.1.9  mrg 	movs	r1, #28
 1.1.1.9  mrg 	movs	r3, #1
 1.1.1.9  mrg 	lsls	r3, r3, #16
     1.1  mrg 	cmp	r0, r3 /* 0x10000 */
     1.1  mrg 	bcc	2f
 1.1.1.9  mrg 	lsrs	r0, r0, #16
 1.1.1.9  mrg 	subs	r1, r1, #16
 1.1.1.9  mrg 2:	lsrs	r3, r3, #8
     1.1  mrg 	cmp	r0, r3 /* #0x100 */
     1.1  mrg 	bcc	2f
 1.1.1.9  mrg 	lsrs	r0, r0, #8
 1.1.1.9  mrg 	subs	r1, r1, #8
 1.1.1.9  mrg 2:	lsrs	r3, r3, #4
     1.1  mrg 	cmp	r0, r3 /* #0x10 */
     1.1  mrg 	bcc	2f
 1.1.1.9  mrg 	lsrs	r0, r0, #4
 1.1.1.9  mrg 	subs	r1, r1, #4
     1.1  mrg 2:	adr	r2, 1f
     1.1  mrg 	ldrb	r0, [r2, r0]
 1.1.1.9  mrg 	adds	r0, r0, r1
     1.1  mrg 	bx lr
     1.1  mrg .align 2
     1.1  mrg 1:
     1.1  mrg .byte 4, 3, 2, 2, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0
     1.1  mrg 	FUNC_END clzsi2
     1.1  mrg #else
     1.1  mrg ARM_FUNC_START clzsi2
 1.1.1.8  mrg # if defined (__ARM_FEATURE_CLZ)
     1.1  mrg 	clz	r0, r0
     1.1  mrg 	RET
     1.1  mrg # else
     1.1  mrg 	mov	r1, #28
     1.1  mrg 	cmp	r0, #0x10000
     1.1  mrg 	do_it	cs, t
     1.1  mrg 	movcs	r0, r0, lsr #16
     1.1  mrg 	subcs	r1, r1, #16
     1.1  mrg 	cmp	r0, #0x100
     1.1  mrg 	do_it	cs, t
     1.1  mrg 	movcs	r0, r0, lsr #8
     1.1  mrg 	subcs	r1, r1, #8
     1.1  mrg 	cmp	r0, #0x10
     1.1  mrg 	do_it	cs, t
     1.1  mrg 	movcs	r0, r0, lsr #4
     1.1  mrg 	subcs	r1, r1, #4
     1.1  mrg 	adr	r2, 1f
     1.1  mrg 	ldrb	r0, [r2, r0]
     1.1  mrg 	add	r0, r0, r1
     1.1  mrg 	RET
     1.1  mrg .align 2
     1.1  mrg 1:
     1.1  mrg .byte 4, 3, 2, 2, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0
 1.1.1.8  mrg # endif /* !defined (__ARM_FEATURE_CLZ) */
     1.1  mrg 	FUNC_END clzsi2
     1.1  mrg #endif
     1.1  mrg #endif /* L_clzsi2 */
     1.1  mrg
     1.1  mrg #ifdef L_clzdi2
 1.1.1.8  mrg #if !defined (__ARM_FEATURE_CLZ)
     1.1  mrg
 1.1.1.4  mrg # ifdef NOT_ISA_TARGET_32BIT
     1.1  mrg FUNC_START clzdi2
     1.1  mrg 	push	{r4, lr}
 1.1.1.9  mrg 	cmp	xxh, #0
 1.1.1.9  mrg 	bne	1f
 1.1.1.9  mrg #  ifdef __ARMEB__
 1.1.1.9  mrg 	movs	r0, xxl
 1.1.1.9  mrg 	bl	__clzsi2
 1.1.1.9  mrg 	adds	r0, r0, #32
 1.1.1.9  mrg 	b 2f
 1.1.1.9  mrg 1:
 1.1.1.9  mrg 	bl	__clzsi2
 1.1.1.9  mrg #  else
 1.1.1.9  mrg 	bl	__clzsi2
 1.1.1.9  mrg 	adds	r0, r0, #32
 1.1.1.9  mrg 	b 2f
 1.1.1.9  mrg 1:
 1.1.1.9  mrg 	movs	r0, xxh
 1.1.1.9  mrg 	bl	__clzsi2
 1.1.1.9  mrg #  endif
 1.1.1.9  mrg 2:
 1.1.1.9  mrg 	pop	{r4, pc}
 1.1.1.9  mrg # else /* NOT_ISA_TARGET_32BIT */
     1.1  mrg ARM_FUNC_START clzdi2
     1.1  mrg 	do_push	{r4, lr}
     1.1  mrg 	cmp	xxh, #0
     1.1  mrg 	bne	1f
 1.1.1.9  mrg #  ifdef __ARMEB__
     1.1  mrg 	mov	r0, xxl
     1.1  mrg 	bl	__clzsi2
     1.1  mrg 	add	r0, r0, #32
     1.1  mrg 	b 2f
     1.1  mrg 1:
     1.1  mrg 	bl	__clzsi2
 1.1.1.9  mrg #  else
     1.1  mrg 	bl	__clzsi2
     1.1  mrg 	add	r0, r0, #32
     1.1  mrg 	b 2f
     1.1  mrg 1:
     1.1  mrg 	mov	r0, xxh
     1.1  mrg 	bl	__clzsi2
 1.1.1.9  mrg #  endif
     1.1  mrg 2:
     1.1  mrg 	RETLDM	r4
     1.1  mrg 	FUNC_END clzdi2
 1.1.1.9  mrg # endif /* NOT_ISA_TARGET_32BIT */
     1.1  mrg
 1.1.1.8  mrg #else /* defined (__ARM_FEATURE_CLZ) */
     1.1  mrg
     1.1  mrg ARM_FUNC_START clzdi2
     1.1  mrg 	cmp	xxh, #0
     1.1  mrg 	do_it	eq, et
     1.1  mrg 	clzeq	r0, xxl
     1.1  mrg 	clzne	r0, xxh
     1.1  mrg 	addeq	r0, r0, #32
     1.1  mrg 	RET
     1.1  mrg 	FUNC_END clzdi2
     1.1  mrg
     1.1  mrg #endif
     1.1  mrg #endif /* L_clzdi2 */
     1.1  mrg
     1.1  mrg #ifdef L_ctzsi2
 1.1.1.4  mrg #ifdef NOT_ISA_TARGET_32BIT
     1.1  mrg FUNC_START ctzsi2
 1.1.1.9  mrg 	negs	r1, r0
 1.1.1.9  mrg 	ands	r0, r0, r1
 1.1.1.9  mrg 	movs	r1, #28
 1.1.1.9  mrg 	movs	r3, #1
 1.1.1.9  mrg 	lsls	r3, r3, #16
     1.1  mrg 	cmp	r0, r3 /* 0x10000 */
     1.1  mrg 	bcc	2f
 1.1.1.9  mrg 	lsrs	r0, r0, #16
 1.1.1.9  mrg 	subs	r1, r1, #16
 1.1.1.9  mrg 2:	lsrs	r3, r3, #8
     1.1  mrg 	cmp	r0, r3 /* #0x100 */
     1.1  mrg 	bcc	2f
 1.1.1.9  mrg 	lsrs	r0, r0, #8
 1.1.1.9  mrg 	subs	r1, r1, #8
 1.1.1.9  mrg 2:	lsrs	r3, r3, #4
     1.1  mrg 	cmp	r0, r3 /* #0x10 */
     1.1  mrg 	bcc	2f
 1.1.1.9  mrg 	lsrs	r0, r0, #4
 1.1.1.9  mrg 	subs	r1, r1, #4
     1.1  mrg 2:	adr	r2, 1f
     1.1  mrg 	ldrb	r0, [r2, r0]
 1.1.1.9  mrg 	subs	r0, r0, r1
     1.1  mrg 	bx lr
     1.1  mrg .align 2
     1.1  mrg 1:
     1.1  mrg .byte	27, 28, 29, 29, 30, 30, 30, 30, 31, 31, 31, 31, 31, 31, 31, 31
     1.1  mrg 	FUNC_END ctzsi2
     1.1  mrg #else
     1.1  mrg ARM_FUNC_START ctzsi2
     1.1  mrg 	rsb	r1, r0, #0
     1.1  mrg 	and	r0, r0, r1
 1.1.1.8  mrg # if defined (__ARM_FEATURE_CLZ)
     1.1  mrg 	clz	r0, r0
     1.1  mrg 	rsb	r0, r0, #31
     1.1  mrg 	RET
     1.1  mrg # else
     1.1  mrg 	mov	r1, #28
     1.1  mrg 	cmp	r0, #0x10000
     1.1  mrg 	do_it	cs, t
     1.1  mrg 	movcs	r0, r0, lsr #16
     1.1  mrg 	subcs	r1, r1, #16
     1.1  mrg 	cmp	r0, #0x100
     1.1  mrg 	do_it	cs, t
     1.1  mrg 	movcs	r0, r0, lsr #8
     1.1  mrg 	subcs	r1, r1, #8
     1.1  mrg 	cmp	r0, #0x10
     1.1  mrg 	do_it	cs, t
     1.1  mrg 	movcs	r0, r0, lsr #4
     1.1  mrg 	subcs	r1, r1, #4
     1.1  mrg 	adr	r2, 1f
     1.1  mrg 	ldrb	r0, [r2, r0]
     1.1  mrg 	sub	r0, r0, r1
     1.1  mrg 	RET
     1.1  mrg .align 2
     1.1  mrg 1:
     1.1  mrg .byte	27, 28, 29, 29, 30, 30, 30, 30, 31, 31, 31, 31, 31, 31, 31, 31
 1.1.1.8  mrg # endif /* !defined (__ARM_FEATURE_CLZ) */
     1.1  mrg 	FUNC_END ctzsi2
     1.1  mrg #endif
     1.1  mrg #endif /* L_clzsi2 */
     1.1  mrg
     1.1  mrg /* ------------------------------------------------------------------------ */
     1.1  mrg /* These next two sections are here despite the fact that they contain Thumb
     1.1  mrg    assembler because their presence allows interworked code to be linked even
     1.1  mrg    when the GCC library is this one.  */
     1.1  mrg
     1.1  mrg /* Do not build the interworking functions when the target architecture does
     1.1  mrg    not support Thumb instructions.  (This can be a multilib option).  */
     1.1  mrg #if defined __ARM_ARCH_4T__ || defined __ARM_ARCH_5T__\
     1.1  mrg       || defined __ARM_ARCH_5TE__ || defined __ARM_ARCH_5TEJ__ \
 1.1.1.8  mrg       || __ARM_ARCH >= 6
     1.1  mrg
     1.1  mrg #if defined L_call_via_rX
     1.1  mrg
     1.1  mrg /* These labels & instructions are used by the Arm/Thumb interworking code.
     1.1  mrg    The address of function to be called is loaded into a register and then
     1.1  mrg    one of these labels is called via a BL instruction.  This puts the
     1.1  mrg    return address into the link register with the bottom bit set, and the
     1.1  mrg    code here switches to the correct mode before executing the function.  */
     1.1  mrg
     1.1  mrg 	.text
     1.1  mrg 	.align 0
     1.1  mrg         .force_thumb
     1.1  mrg
     1.1  mrg .macro call_via register
     1.1  mrg 	THUMB_FUNC_START _call_via_\register
     1.1  mrg
     1.1  mrg 	bx	\register
     1.1  mrg 	nop
     1.1  mrg
     1.1  mrg 	SIZE	(_call_via_\register)
     1.1  mrg .endm
     1.1  mrg
     1.1  mrg 	call_via r0
     1.1  mrg 	call_via r1
     1.1  mrg 	call_via r2
     1.1  mrg 	call_via r3
     1.1  mrg 	call_via r4
     1.1  mrg 	call_via r5
     1.1  mrg 	call_via r6
     1.1  mrg 	call_via r7
     1.1  mrg 	call_via r8
     1.1  mrg 	call_via r9
     1.1  mrg 	call_via sl
     1.1  mrg 	call_via fp
     1.1  mrg 	call_via ip
     1.1  mrg 	call_via sp
     1.1  mrg 	call_via lr
     1.1  mrg
     1.1  mrg #endif /* L_call_via_rX */
     1.1  mrg
     1.1  mrg /* Don't bother with the old interworking routines for Thumb-2.  */
     1.1  mrg /* ??? Maybe only omit these on "m" variants.  */
 1.1.1.4  mrg #if !defined(__thumb2__) && __ARM_ARCH_ISA_ARM
     1.1  mrg
     1.1  mrg #if defined L_interwork_call_via_rX
     1.1  mrg
     1.1  mrg /* These labels & instructions are used by the Arm/Thumb interworking code,
     1.1  mrg    when the target address is in an unknown instruction set.  The address
     1.1  mrg    of function to be called is loaded into a register and then one of these
     1.1  mrg    labels is called via a BL instruction.  This puts the return address
     1.1  mrg    into the link register with the bottom bit set, and the code here
     1.1  mrg    switches to the correct mode before executing the function.  Unfortunately
     1.1  mrg    the target code cannot be relied upon to return via a BX instruction, so
     1.1  mrg    instead we have to store the resturn address on the stack and allow the
     1.1  mrg    called function to return here instead.  Upon return we recover the real
     1.1  mrg    return address and use a BX to get back to Thumb mode.
     1.1  mrg
     1.1  mrg    There are three variations of this code.  The first,
     1.1  mrg    _interwork_call_via_rN(), will push the return address onto the
     1.1  mrg    stack and pop it in _arm_return().  It should only be used if all
     1.1  mrg    arguments are passed in registers.
     1.1  mrg
     1.1  mrg    The second, _interwork_r7_call_via_rN(), instead stores the return
     1.1  mrg    address at [r7, #-4].  It is the caller's responsibility to ensure
     1.1  mrg    that this address is valid and contains no useful data.
     1.1  mrg
     1.1  mrg    The third, _interwork_r11_call_via_rN(), works in the same way but
     1.1  mrg    uses r11 instead of r7.  It is useful if the caller does not really
     1.1  mrg    need a frame pointer.  */
     1.1  mrg
     1.1  mrg 	.text
     1.1  mrg 	.align 0
     1.1  mrg
     1.1  mrg 	.code   32
     1.1  mrg 	.globl _arm_return
     1.1  mrg LSYM(Lstart_arm_return):
     1.1  mrg 	cfi_start	LSYM(Lstart_arm_return) LSYM(Lend_arm_return)
     1.1  mrg 	cfi_push	0, 0xe, -0x8, 0x8
     1.1  mrg 	nop	@ This nop is for the benefit of debuggers, so that
     1.1  mrg 		@ backtraces will use the correct unwind information.
     1.1  mrg _arm_return:
     1.1  mrg 	RETLDM	unwind=LSYM(Lstart_arm_return)
     1.1  mrg 	cfi_end	LSYM(Lend_arm_return)
     1.1  mrg
     1.1  mrg 	.globl _arm_return_r7
     1.1  mrg _arm_return_r7:
     1.1  mrg 	ldr	lr, [r7, #-4]
     1.1  mrg 	bx	lr
     1.1  mrg
     1.1  mrg 	.globl _arm_return_r11
     1.1  mrg _arm_return_r11:
     1.1  mrg 	ldr	lr, [r11, #-4]
     1.1  mrg 	bx	lr
     1.1  mrg
     1.1  mrg .macro interwork_with_frame frame, register, name, return
     1.1  mrg 	.code	16
     1.1  mrg
     1.1  mrg 	THUMB_FUNC_START \name
     1.1  mrg
     1.1  mrg 	bx	pc
     1.1  mrg 	nop
     1.1  mrg
     1.1  mrg 	.code	32
     1.1  mrg 	tst	\register, #1
     1.1  mrg 	streq	lr, [\frame, #-4]
     1.1  mrg 	adreq	lr, _arm_return_\frame
     1.1  mrg 	bx	\register
     1.1  mrg
     1.1  mrg 	SIZE	(\name)
     1.1  mrg .endm
     1.1  mrg
     1.1  mrg .macro interwork register
     1.1  mrg 	.code	16
     1.1  mrg
     1.1  mrg 	THUMB_FUNC_START _interwork_call_via_\register
     1.1  mrg
     1.1  mrg 	bx	pc
     1.1  mrg 	nop
     1.1  mrg
     1.1  mrg 	.code	32
     1.1  mrg 	.globl LSYM(Lchange_\register)
     1.1  mrg LSYM(Lchange_\register):
     1.1  mrg 	tst	\register, #1
     1.1  mrg 	streq	lr, [sp, #-8]!
     1.1  mrg 	adreq	lr, _arm_return
     1.1  mrg 	bx	\register
     1.1  mrg
     1.1  mrg 	SIZE	(_interwork_call_via_\register)
     1.1  mrg
     1.1  mrg 	interwork_with_frame r7,\register,_interwork_r7_call_via_\register
     1.1  mrg 	interwork_with_frame r11,\register,_interwork_r11_call_via_\register
     1.1  mrg .endm
     1.1  mrg
     1.1  mrg 	interwork r0
     1.1  mrg 	interwork r1
     1.1  mrg 	interwork r2
     1.1  mrg 	interwork r3
     1.1  mrg 	interwork r4
     1.1  mrg 	interwork r5
     1.1  mrg 	interwork r6
     1.1  mrg 	interwork r7
     1.1  mrg 	interwork r8
     1.1  mrg 	interwork r9
     1.1  mrg 	interwork sl
     1.1  mrg 	interwork fp
     1.1  mrg 	interwork ip
     1.1  mrg 	interwork sp
     1.1  mrg
     1.1  mrg 	/* The LR case has to be handled a little differently...  */
     1.1  mrg 	.code 16
     1.1  mrg
     1.1  mrg 	THUMB_FUNC_START _interwork_call_via_lr
     1.1  mrg
     1.1  mrg 	bx 	pc
     1.1  mrg 	nop
     1.1  mrg
     1.1  mrg 	.code 32
     1.1  mrg 	.globl .Lchange_lr
     1.1  mrg .Lchange_lr:
     1.1  mrg 	tst	lr, #1
     1.1  mrg 	stmeqdb	r13!, {lr, pc}
     1.1  mrg 	mov	ip, lr
     1.1  mrg 	adreq	lr, _arm_return
     1.1  mrg 	bx	ip
     1.1  mrg
     1.1  mrg 	SIZE	(_interwork_call_via_lr)
     1.1  mrg
     1.1  mrg #endif /* L_interwork_call_via_rX */
     1.1  mrg #endif /* !__thumb2__ */
     1.1  mrg
     1.1  mrg /* Functions to support compact pic switch tables in thumb1 state.
     1.1  mrg    All these routines take an index into the table in r0.  The
     1.1  mrg    table is at LR & ~1 (but this must be rounded up in the case
     1.1  mrg    of 32-bit entires).  They are only permitted to clobber r12
     1.1  mrg    and r14 and r0 must be preserved on exit.  */
     1.1  mrg #ifdef L_thumb1_case_sqi
     1.1  mrg
     1.1  mrg 	.text
     1.1  mrg 	.align 0
     1.1  mrg         .force_thumb
     1.1  mrg 	.syntax unified
     1.1  mrg 	THUMB_FUNC_START __gnu_thumb1_case_sqi
     1.1  mrg 	push	{r1}
     1.1  mrg 	mov	r1, lr
     1.1  mrg 	lsrs	r1, r1, #1
     1.1  mrg 	lsls	r1, r1, #1
     1.1  mrg 	ldrsb	r1, [r1, r0]
     1.1  mrg 	lsls	r1, r1, #1
     1.1  mrg 	add	lr, lr, r1
     1.1  mrg 	pop	{r1}
     1.1  mrg 	bx	lr
     1.1  mrg 	SIZE (__gnu_thumb1_case_sqi)
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg #ifdef L_thumb1_case_uqi
     1.1  mrg
     1.1  mrg 	.text
     1.1  mrg 	.align 0
     1.1  mrg         .force_thumb
     1.1  mrg 	.syntax unified
     1.1  mrg 	THUMB_FUNC_START __gnu_thumb1_case_uqi
     1.1  mrg 	push	{r1}
     1.1  mrg 	mov	r1, lr
     1.1  mrg 	lsrs	r1, r1, #1
     1.1  mrg 	lsls	r1, r1, #1
     1.1  mrg 	ldrb	r1, [r1, r0]
     1.1  mrg 	lsls	r1, r1, #1
     1.1  mrg 	add	lr, lr, r1
     1.1  mrg 	pop	{r1}
     1.1  mrg 	bx	lr
     1.1  mrg 	SIZE (__gnu_thumb1_case_uqi)
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg #ifdef L_thumb1_case_shi
     1.1  mrg
     1.1  mrg 	.text
     1.1  mrg 	.align 0
     1.1  mrg         .force_thumb
     1.1  mrg 	.syntax unified
     1.1  mrg 	THUMB_FUNC_START __gnu_thumb1_case_shi
     1.1  mrg 	push	{r0, r1}
     1.1  mrg 	mov	r1, lr
     1.1  mrg 	lsrs	r1, r1, #1
     1.1  mrg 	lsls	r0, r0, #1
     1.1  mrg 	lsls	r1, r1, #1
     1.1  mrg 	ldrsh	r1, [r1, r0]
     1.1  mrg 	lsls	r1, r1, #1
     1.1  mrg 	add	lr, lr, r1
     1.1  mrg 	pop	{r0, r1}
     1.1  mrg 	bx	lr
     1.1  mrg 	SIZE (__gnu_thumb1_case_shi)
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg #ifdef L_thumb1_case_uhi
     1.1  mrg
     1.1  mrg 	.text
     1.1  mrg 	.align 0
     1.1  mrg         .force_thumb
     1.1  mrg 	.syntax unified
     1.1  mrg 	THUMB_FUNC_START __gnu_thumb1_case_uhi
     1.1  mrg 	push	{r0, r1}
     1.1  mrg 	mov	r1, lr
     1.1  mrg 	lsrs	r1, r1, #1
     1.1  mrg 	lsls	r0, r0, #1
     1.1  mrg 	lsls	r1, r1, #1
     1.1  mrg 	ldrh	r1, [r1, r0]
     1.1  mrg 	lsls	r1, r1, #1
     1.1  mrg 	add	lr, lr, r1
     1.1  mrg 	pop	{r0, r1}
     1.1  mrg 	bx	lr
     1.1  mrg 	SIZE (__gnu_thumb1_case_uhi)
     1.1  mrg #endif
     1.1  mrg
1.1.1.11  mrg #ifdef L_sync_none
1.1.1.11  mrg 	/* Null implementation of __sync_synchronize, for use when
1.1.1.11  mrg 	   it is known that the system is single threaded.  */
1.1.1.11  mrg 	.text
1.1.1.11  mrg 	.align 0
1.1.1.11  mrg 	FUNC_START sync_synchronize_none
1.1.1.11  mrg 	bx	lr
1.1.1.11  mrg 	FUNC_END sync_synchronize_none
1.1.1.11  mrg #endif
1.1.1.11  mrg
1.1.1.11  mrg #ifdef L_sync_dmb
1.1.1.11  mrg 	/* Full memory barrier using DMB.  Requires Armv7 (all profiles)
1.1.1.11  mrg 	or armv6-m, or later.  */
1.1.1.11  mrg 	.text
1.1.1.11  mrg 	.align 0
1.1.1.11  mrg #if __ARM_ARCH_PROFILE == 'M'
1.1.1.11  mrg 	.arch armv6-m
1.1.1.11  mrg #else
1.1.1.11  mrg 	.arch armv7-a
1.1.1.11  mrg #endif
1.1.1.11  mrg 	FUNC_START sync_synchronize_dmb
1.1.1.11  mrg 	/* M-profile devices only support SY as the synchronization level,
1.1.1.11  mrg 	   but that's probably what we want here anyway.  */
1.1.1.11  mrg 	dmb
1.1.1.11  mrg 	RET
1.1.1.11  mrg 	FUNC_END sync_synchronize_dmb
1.1.1.11  mrg #endif
1.1.1.11  mrg
1.1.1.11  mrg #ifdef L_sync_cp15dmb
1.1.1.11  mrg #ifndef NOT_ISA_TARGET_32BIT
1.1.1.11  mrg 	/* Implementation of DMB using CP15 operations.  This was first
1.1.1.11  mrg 	   defined in Armv6, but deprecated in Armv7 and can give
1.1.1.11  mrg 	   sub-optimal performance.  */
1.1.1.11  mrg 	.text
1.1.1.11  mrg 	.align 0
1.1.1.11  mrg 	ARM_FUNC_START sync_synchronize_cp15dmb
1.1.1.11  mrg 	mcr	p15, 0, r0, c7, c10, 5
1.1.1.11  mrg 	RET
1.1.1.11  mrg 	FUNC_END sync_synchronize_cp15dmb
1.1.1.11  mrg #endif
1.1.1.11  mrg #endif
1.1.1.11  mrg
1.1.1.11  mrg #ifdef L_sync_synchronize
1.1.1.11  mrg 	/* Generic version of the synchronization primitive.  If we know
1.1.1.11  mrg 	   that DMB exists, then use it.  Otherwise, arrange for a link
1.1.1.11  mrg 	   time warning explaining how to pick a suitable alternative.
1.1.1.11  mrg 	   We choose not to use CP15DMB because it is performance
1.1.1.11  mrg 	   deprecated.  We only define this function if generating
1.1.1.11  mrg 	   ELF binaries as otherwise we can't rely on the warning being
1.1.1.11  mrg 	   generated.  */
1.1.1.11  mrg
1.1.1.11  mrg #ifdef __ELF__
1.1.1.11  mrg 	.text
1.1.1.11  mrg 	.align 0
1.1.1.11  mrg 	FUNC_START sync_synchronize
1.1.1.11  mrg #if __ARM_ARCH >= 7 || __ARM_ARCH_PROFILE == 'M'
1.1.1.11  mrg 	dmb
1.1.1.11  mrg #endif
1.1.1.11  mrg 	RET
1.1.1.11  mrg 	FUNC_END sync_synchronize
1.1.1.11  mrg #if !(__ARM_ARCH >= 7 || __ARM_ARCH_PROFILE == 'M')
1.1.1.11  mrg 	.section .gnu.warning.__sync_synchronize
1.1.1.11  mrg 	.align 0
1.1.1.11  mrg 	.ascii "This implementation of __sync_synchronize is a stub with "
1.1.1.11  mrg 	.ascii "no effect.  Relink with\n"
1.1.1.11  mrg 	.ascii "  -specs=sync-{none,dmb,cp15dmb}.specs\n"
1.1.1.11  mrg 	.ascii "to specify exactly which barrier format to use and avoid "
1.1.1.11  mrg 	.ascii "this warning\0"
1.1.1.11  mrg #endif
1.1.1.11  mrg #endif
1.1.1.11  mrg #endif
1.1.1.11  mrg
     1.1  mrg #ifdef L_thumb1_case_si
     1.1  mrg
     1.1  mrg 	.text
     1.1  mrg 	.align 0
     1.1  mrg         .force_thumb
     1.1  mrg 	.syntax unified
     1.1  mrg 	THUMB_FUNC_START __gnu_thumb1_case_si
     1.1  mrg 	push	{r0, r1}
     1.1  mrg 	mov	r1, lr
     1.1  mrg 	adds.n	r1, r1, #2	/* Align to word.  */
     1.1  mrg 	lsrs	r1, r1, #2
     1.1  mrg 	lsls	r0, r0, #2
     1.1  mrg 	lsls	r1, r1, #2
     1.1  mrg 	ldr	r0, [r1, r0]
     1.1  mrg 	adds	r0, r0, r1
     1.1  mrg 	mov	lr, r0
     1.1  mrg 	pop	{r0, r1}
     1.1  mrg 	mov	pc, lr		/* We know we were called from thumb code.  */
     1.1  mrg 	SIZE (__gnu_thumb1_case_si)
     1.1  mrg #endif
     1.1  mrg
     1.1  mrg #endif /* Arch supports thumb.  */
     1.1  mrg
 1.1.1.3  mrg .macro CFI_START_FUNCTION
 1.1.1.3  mrg 	.cfi_startproc
 1.1.1.3  mrg 	.cfi_remember_state
 1.1.1.3  mrg .endm
 1.1.1.3  mrg
 1.1.1.3  mrg .macro CFI_END_FUNCTION
 1.1.1.3  mrg 	.cfi_restore_state
 1.1.1.3  mrg 	.cfi_endproc
 1.1.1.3  mrg .endm
 1.1.1.3  mrg
     1.1  mrg #ifndef __symbian__
 1.1.1.8  mrg /* The condition here must match the one in gcc/config/arm/elf.h and
 1.1.1.8  mrg    libgcc/config/arm/t-elf.  */
 1.1.1.4  mrg #ifndef NOT_ISA_TARGET_32BIT
     1.1  mrg #include "ieee754-df.S"
     1.1  mrg #include "ieee754-sf.S"
     1.1  mrg #include "bpabi.S"
 1.1.1.4  mrg #else /* NOT_ISA_TARGET_32BIT */
     1.1  mrg #include "bpabi-v6m.S"
 1.1.1.4  mrg #endif /* NOT_ISA_TARGET_32BIT */
     1.1  mrg #endif /* !__symbian__ */