config/sh/lib1funcs.S

1.3  mrg /* Copyright (C) 1994-2015 Free Software Foundation, Inc.
1.1  mrg
1.1  mrg This file is free software; you can redistribute it and/or modify it
1.1  mrg under the terms of the GNU General Public License as published by the
1.1  mrg Free Software Foundation; either version 3, or (at your option) any
1.1  mrg later version.
1.1  mrg
1.1  mrg This file is distributed in the hope that it will be useful, but
1.1  mrg WITHOUT ANY WARRANTY; without even the implied warranty of
1.1  mrg MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
1.1  mrg General Public License for more details.
1.1  mrg
1.1  mrg Under Section 7 of GPL version 3, you are granted additional
1.1  mrg permissions described in the GCC Runtime Library Exception, version
1.1  mrg 3.1, as published by the Free Software Foundation.
1.1  mrg
1.1  mrg You should have received a copy of the GNU General Public License and
1.1  mrg a copy of the GCC Runtime Library Exception along with this program;
1.1  mrg see the files COPYING3 and COPYING.RUNTIME respectively.  If not, see
1.1  mrg <http://www.gnu.org/licenses/>.  */
1.1  mrg
1.1  mrg
1.1  mrg !! libgcc routines for the Renesas / SuperH SH CPUs.
1.1  mrg !! Contributed by Steve Chamberlain.
1.1  mrg !! sac@cygnus.com
1.1  mrg
1.1  mrg !! ashiftrt_r4_x, ___ashrsi3, ___ashlsi3, ___lshrsi3 routines
1.1  mrg !! recoded in assembly by Toshiyasu Morita
1.1  mrg !! tm@netcom.com
1.1  mrg
1.1  mrg #if defined(__ELF__) && defined(__linux__)
1.1  mrg .section .note.GNU-stack,"",%progbits
1.1  mrg .previous
1.1  mrg #endif
1.1  mrg
1.1  mrg /* SH2 optimizations for ___ashrsi3, ___ashlsi3, ___lshrsi3 and
1.1  mrg    ELF local label prefixes by J"orn Rennecke
1.1  mrg    amylaar (at) cygnus.com  */
1.1  mrg
1.1  mrg #include "lib1funcs.h"
1.1  mrg
1.1  mrg /* t-vxworks needs to build both PIC and non-PIC versions of libgcc,
1.1  mrg    so it is more convenient to define NO_FPSCR_VALUES here than to
1.1  mrg    define it on the command line.  */
1.1  mrg #if defined __vxworks && defined __PIC__
1.1  mrg #define NO_FPSCR_VALUES
1.1  mrg #endif
1.1  mrg
1.1  mrg #if ! __SH5__
1.1  mrg #ifdef L_ashiftrt
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_0)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_1)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_2)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_3)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_4)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_5)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_6)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_7)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_8)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_9)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_10)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_11)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_12)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_13)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_14)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_15)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_16)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_17)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_18)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_19)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_20)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_21)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_22)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_23)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_24)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_25)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_26)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_27)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_28)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_29)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_30)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_31)
1.1  mrg 	.global	GLOBAL(ashiftrt_r4_32)
1.1  mrg
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_0))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_1))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_2))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_3))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_4))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_5))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_6))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_7))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_8))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_9))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_10))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_11))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_12))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_13))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_14))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_15))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_16))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_17))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_18))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_19))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_20))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_21))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_22))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_23))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_24))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_25))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_26))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_27))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_28))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_29))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_30))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_31))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashiftrt_r4_32))
1.1  mrg
1.1  mrg 	.align	1
1.1  mrg GLOBAL(ashiftrt_r4_32):
1.1  mrg GLOBAL(ashiftrt_r4_31):
1.1  mrg 	rotcl	r4
1.1  mrg 	rts
1.1  mrg 	subc	r4,r4
1.1  mrg
1.1  mrg GLOBAL(ashiftrt_r4_30):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_29):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_28):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_27):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_26):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_25):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_24):
1.1  mrg 	shlr16	r4
1.1  mrg 	shlr8	r4
1.1  mrg 	rts
1.1  mrg 	exts.b	r4,r4
1.1  mrg
1.1  mrg GLOBAL(ashiftrt_r4_23):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_22):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_21):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_20):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_19):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_18):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_17):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_16):
1.1  mrg 	shlr16	r4
1.1  mrg 	rts
1.1  mrg 	exts.w	r4,r4
1.1  mrg
1.1  mrg GLOBAL(ashiftrt_r4_15):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_14):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_13):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_12):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_11):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_10):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_9):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_8):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_7):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_6):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_5):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_4):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_3):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_2):
1.1  mrg 	shar	r4
1.1  mrg GLOBAL(ashiftrt_r4_1):
1.1  mrg 	rts
1.1  mrg 	shar	r4
1.1  mrg
1.1  mrg GLOBAL(ashiftrt_r4_0):
1.1  mrg 	rts
1.1  mrg 	nop
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_0))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_1))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_2))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_3))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_4))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_5))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_6))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_7))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_8))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_9))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_10))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_11))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_12))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_13))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_14))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_15))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_16))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_17))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_18))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_19))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_20))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_21))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_22))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_23))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_24))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_25))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_26))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_27))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_28))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_29))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_30))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_31))
1.1  mrg 	ENDFUNC(GLOBAL(ashiftrt_r4_32))
1.1  mrg #endif
1.1  mrg
1.1  mrg #ifdef L_ashiftrt_n
1.1  mrg
1.1  mrg !
1.1  mrg ! GLOBAL(ashrsi3)
1.1  mrg !
1.1  mrg ! Entry:
1.1  mrg !
1.1  mrg ! r4: Value to shift
1.1  mrg ! r5: Shift count
1.1  mrg !
1.1  mrg ! Exit:
1.1  mrg !
1.1  mrg ! r0: Result
1.1  mrg !
1.1  mrg ! Destroys:
1.1  mrg !
1.1  mrg ! T bit, r5
1.1  mrg !
1.1  mrg
1.1  mrg 	.global	GLOBAL(ashrsi3)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashrsi3))
1.1  mrg 	.align	2
1.1  mrg GLOBAL(ashrsi3):
1.1  mrg 	mov	#31,r0
1.1  mrg 	and	r0,r5
1.1  mrg 	mova	LOCAL(ashrsi3_table),r0
1.1  mrg 	mov.b	@(r0,r5),r5
1.1  mrg #ifdef __sh1__
1.1  mrg 	add	r5,r0
1.1  mrg 	jmp	@r0
1.1  mrg #else
1.1  mrg 	braf	r5
1.1  mrg #endif
1.1  mrg 	mov	r4,r0
1.1  mrg
1.1  mrg 	.align	2
1.1  mrg LOCAL(ashrsi3_table):
1.1  mrg 	.byte		LOCAL(ashrsi3_0)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_1)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_2)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_3)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_4)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_5)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_6)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_7)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_8)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_9)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_10)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_11)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_12)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_13)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_14)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_15)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_16)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_17)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_18)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_19)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_20)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_21)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_22)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_23)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_24)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_25)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_26)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_27)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_28)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_29)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_30)-LOCAL(ashrsi3_table)
1.1  mrg 	.byte		LOCAL(ashrsi3_31)-LOCAL(ashrsi3_table)
1.1  mrg
1.1  mrg LOCAL(ashrsi3_31):
1.1  mrg 	rotcl	r0
1.1  mrg 	rts
1.1  mrg 	subc	r0,r0
1.1  mrg
1.1  mrg LOCAL(ashrsi3_30):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_29):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_28):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_27):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_26):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_25):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_24):
1.1  mrg 	shlr16	r0
1.1  mrg 	shlr8	r0
1.1  mrg 	rts
1.1  mrg 	exts.b	r0,r0
1.1  mrg
1.1  mrg LOCAL(ashrsi3_23):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_22):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_21):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_20):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_19):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_18):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_17):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_16):
1.1  mrg 	shlr16	r0
1.1  mrg 	rts
1.1  mrg 	exts.w	r0,r0
1.1  mrg
1.1  mrg LOCAL(ashrsi3_15):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_14):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_13):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_12):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_11):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_10):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_9):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_8):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_7):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_6):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_5):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_4):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_3):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_2):
1.1  mrg 	shar	r0
1.1  mrg LOCAL(ashrsi3_1):
1.1  mrg 	rts
1.1  mrg 	shar	r0
1.1  mrg
1.1  mrg LOCAL(ashrsi3_0):
1.1  mrg 	rts
1.1  mrg 	nop
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(ashrsi3))
1.1  mrg #endif
1.1  mrg
1.1  mrg #ifdef L_ashiftlt
1.1  mrg
1.1  mrg !
1.1  mrg ! GLOBAL(ashlsi3)
1.1  mrg ! (For compatibility with older binaries, not used by compiler)
1.1  mrg !
1.1  mrg ! Entry:
1.1  mrg !	r4: Value to shift
1.1  mrg !	r5: Shift count
1.1  mrg !
1.1  mrg ! Exit:
1.1  mrg !	r0: Result
1.1  mrg !
1.1  mrg ! Destroys:
1.1  mrg !	T bit
1.1  mrg !
1.1  mrg !
1.1  mrg ! GLOBAL(ashlsi3_r0)
1.1  mrg !
1.1  mrg ! Entry:
1.1  mrg !	r4: Value to shift
1.1  mrg !	r0: Shift count
1.1  mrg !
1.1  mrg ! Exit:
1.1  mrg !	r0: Result
1.1  mrg !
1.1  mrg ! Destroys:
1.1  mrg !	T bit
1.1  mrg
1.1  mrg 	.global	GLOBAL(ashlsi3)
1.1  mrg 	.global GLOBAL(ashlsi3_r0)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashlsi3))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ashlsi3_r0))
1.1  mrg GLOBAL(ashlsi3):
1.1  mrg 	mov	r5,r0
1.1  mrg 	.align	2
1.1  mrg GLOBAL(ashlsi3_r0):
1.1  mrg
1.1  mrg #ifdef __sh1__
1.1  mrg 	and	#31,r0
1.1  mrg 	shll2	r0
1.1  mrg 	mov.l	r4,@-r15
1.1  mrg 	mov	r0,r4
1.1  mrg 	mova	LOCAL(ashlsi3_table),r0
1.1  mrg 	add	r4,r0
1.1  mrg 	mov.l	@r15+,r4
1.1  mrg 	jmp	@r0
1.1  mrg 	mov	r4,r0
1.1  mrg 	.align 2
1.1  mrg #else
1.1  mrg 	and	#31,r0
1.1  mrg 	shll2	r0
1.1  mrg 	braf	r0
1.1  mrg 	mov	r4,r0
1.1  mrg #endif
1.1  mrg
1.1  mrg LOCAL(ashlsi3_table):
1.1  mrg 	rts				// << 0
1.1  mrg 	nop
1.1  mrg LOCAL(ashlsi_1):
1.1  mrg 	rts				// << 1
1.1  mrg 	shll	r0
1.1  mrg LOCAL(ashlsi_2):			// << 2
1.1  mrg 	rts
1.1  mrg 	shll2	r0
1.1  mrg 	bra	LOCAL(ashlsi_1)		// << 3
1.1  mrg 	shll2	r0
1.1  mrg 	bra	LOCAL(ashlsi_2)		// << 4
1.1  mrg 	shll2	r0
1.1  mrg 	bra	LOCAL(ashlsi_5)		// << 5
1.1  mrg 	shll	r0
1.1  mrg 	bra	LOCAL(ashlsi_6)		// << 6
1.1  mrg 	shll2	r0
1.1  mrg 	bra	LOCAL(ashlsi_7)		// << 7
1.1  mrg 	shll	r0
1.1  mrg LOCAL(ashlsi_8):			// << 8
1.1  mrg 	rts
1.1  mrg 	shll8	r0
1.1  mrg 	bra	LOCAL(ashlsi_8)		// << 9
1.1  mrg 	shll	r0
1.1  mrg 	bra	LOCAL(ashlsi_8)		// << 10
1.1  mrg 	shll2	r0
1.1  mrg 	bra	LOCAL(ashlsi_11)	// << 11
1.1  mrg 	shll	r0
1.1  mrg 	bra	LOCAL(ashlsi_12)	// << 12
1.1  mrg 	shll2	r0
1.1  mrg 	bra	LOCAL(ashlsi_13)	// << 13
1.1  mrg 	shll	r0
1.1  mrg 	bra	LOCAL(ashlsi_14)	// << 14
1.1  mrg 	shll8	r0
1.1  mrg 	bra	LOCAL(ashlsi_15)	// << 15
1.1  mrg 	shll8	r0
1.1  mrg LOCAL(ashlsi_16):			// << 16
1.1  mrg 	rts
1.1  mrg 	shll16	r0
1.1  mrg 	bra	LOCAL(ashlsi_16)	// << 17
1.1  mrg 	shll	r0
1.1  mrg 	bra	LOCAL(ashlsi_16)	// << 18
1.1  mrg 	shll2	r0
1.1  mrg 	bra	LOCAL(ashlsi_19)	// << 19
1.1  mrg 	shll	r0
1.1  mrg 	bra	LOCAL(ashlsi_20)	// << 20
1.1  mrg 	shll2	r0
1.1  mrg 	bra	LOCAL(ashlsi_21)	// << 21
1.1  mrg 	shll	r0
1.1  mrg 	bra	LOCAL(ashlsi_22)	// << 22
1.1  mrg 	shll16	r0
1.1  mrg 	bra	LOCAL(ashlsi_23)	// << 23
1.1  mrg 	shll16	r0
1.1  mrg 	bra	LOCAL(ashlsi_16)	// << 24
1.1  mrg 	shll8	r0
1.1  mrg 	bra	LOCAL(ashlsi_25)	// << 25
1.1  mrg 	shll	r0
1.1  mrg 	bra	LOCAL(ashlsi_26)	// << 26
1.1  mrg 	shll2	r0
1.1  mrg 	bra	LOCAL(ashlsi_27)	// << 27
1.1  mrg 	shll	r0
1.1  mrg 	bra	LOCAL(ashlsi_28)	// << 28
1.1  mrg 	shll2	r0
1.1  mrg 	bra	LOCAL(ashlsi_29)	// << 29
1.1  mrg 	shll16	r0
1.1  mrg 	bra	LOCAL(ashlsi_30)	// << 30
1.1  mrg 	shll16	r0
1.1  mrg 	and	#1,r0			// << 31
1.1  mrg 	rts
1.1  mrg 	rotr	r0
1.1  mrg
1.1  mrg LOCAL(ashlsi_7):
1.1  mrg 	shll2	r0
1.1  mrg LOCAL(ashlsi_5):
1.1  mrg LOCAL(ashlsi_6):
1.1  mrg 	shll2	r0
1.1  mrg 	rts
1.1  mrg LOCAL(ashlsi_13):
1.1  mrg 	shll2	r0
1.1  mrg LOCAL(ashlsi_12):
1.1  mrg LOCAL(ashlsi_11):
1.1  mrg 	shll8	r0
1.1  mrg 	rts
1.1  mrg LOCAL(ashlsi_21):
1.1  mrg 	shll2	r0
1.1  mrg LOCAL(ashlsi_20):
1.1  mrg LOCAL(ashlsi_19):
1.1  mrg 	shll16	r0
1.1  mrg 	rts
1.1  mrg LOCAL(ashlsi_28):
1.1  mrg LOCAL(ashlsi_27):
1.1  mrg 	shll2	r0
1.1  mrg LOCAL(ashlsi_26):
1.1  mrg LOCAL(ashlsi_25):
1.1  mrg 	shll16	r0
1.1  mrg 	rts
1.1  mrg 	shll8	r0
1.1  mrg
1.1  mrg LOCAL(ashlsi_22):
1.1  mrg LOCAL(ashlsi_14):
1.1  mrg 	shlr2	r0
1.1  mrg 	rts
1.1  mrg 	shll8	r0
1.1  mrg
1.1  mrg LOCAL(ashlsi_23):
1.1  mrg LOCAL(ashlsi_15):
1.1  mrg 	shlr	r0
1.1  mrg 	rts
1.1  mrg 	shll8	r0
1.1  mrg
1.1  mrg LOCAL(ashlsi_29):
1.1  mrg 	shlr	r0
1.1  mrg LOCAL(ashlsi_30):
1.1  mrg 	shlr2	r0
1.1  mrg 	rts
1.1  mrg 	shll16	r0
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(ashlsi3))
1.1  mrg 	ENDFUNC(GLOBAL(ashlsi3_r0))
1.1  mrg #endif
1.1  mrg
1.1  mrg #ifdef L_lshiftrt
1.1  mrg
1.1  mrg !
1.1  mrg ! GLOBAL(lshrsi3)
1.1  mrg ! (For compatibility with older binaries, not used by compiler)
1.1  mrg !
1.1  mrg ! Entry:
1.1  mrg !	r4: Value to shift
1.1  mrg !	r5: Shift count
1.1  mrg !
1.1  mrg ! Exit:
1.1  mrg !	r0: Result
1.1  mrg !
1.1  mrg ! Destroys:
1.1  mrg !	T bit
1.1  mrg !
1.1  mrg !
1.1  mrg ! GLOBAL(lshrsi3_r0)
1.1  mrg !
1.1  mrg ! Entry:
1.1  mrg !	r4: Value to shift
1.1  mrg !	r0: Shift count
1.1  mrg !
1.1  mrg ! Exit:
1.1  mrg !	r0: Result
1.1  mrg !
1.1  mrg ! Destroys:
1.1  mrg !	T bit
1.1  mrg
1.1  mrg 	.global	GLOBAL(lshrsi3)
1.1  mrg 	.global	GLOBAL(lshrsi3_r0)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(lshrsi3))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(lshrsi3_r0))
1.1  mrg GLOBAL(lshrsi3):
1.1  mrg 	mov	r5,r0
1.1  mrg 	.align	2
1.1  mrg GLOBAL(lshrsi3_r0):
1.1  mrg
1.1  mrg #ifdef __sh1__
1.1  mrg 	and	#31,r0
1.1  mrg 	shll2	r0
1.1  mrg 	mov.l	r4,@-r15
1.1  mrg 	mov	r0,r4
1.1  mrg 	mova	LOCAL(lshrsi3_table),r0
1.1  mrg 	add	r4,r0
1.1  mrg 	mov.l	@r15+,r4
1.1  mrg 	jmp	@r0
1.1  mrg 	mov	r4,r0
1.1  mrg 	.align 2
1.1  mrg #else
1.1  mrg 	and	#31,r0
1.1  mrg 	shll2	r0
1.1  mrg 	braf	r0
1.1  mrg 	mov	r4,r0
1.1  mrg #endif
1.1  mrg LOCAL(lshrsi3_table):
1.1  mrg 	rts				// >> 0
1.1  mrg 	nop
1.1  mrg LOCAL(lshrsi_1):			// >> 1
1.1  mrg 	rts
1.1  mrg 	shlr	r0
1.1  mrg LOCAL(lshrsi_2):			// >> 2
1.1  mrg 	rts
1.1  mrg 	shlr2	r0
1.1  mrg 	bra	LOCAL(lshrsi_1)		// >> 3
1.1  mrg 	shlr2	r0
1.1  mrg 	bra	LOCAL(lshrsi_2)		// >> 4
1.1  mrg 	shlr2	r0
1.1  mrg 	bra	LOCAL(lshrsi_5)		// >> 5
1.1  mrg 	shlr	r0
1.1  mrg 	bra	LOCAL(lshrsi_6)		// >> 6
1.1  mrg 	shlr2	r0
1.1  mrg 	bra	LOCAL(lshrsi_7)		// >> 7
1.1  mrg 	shlr	r0
1.1  mrg LOCAL(lshrsi_8):			// >> 8
1.1  mrg 	rts
1.1  mrg 	shlr8	r0
1.1  mrg 	bra	LOCAL(lshrsi_8)		// >> 9
1.1  mrg 	shlr	r0
1.1  mrg 	bra	LOCAL(lshrsi_8)		// >> 10
1.1  mrg 	shlr2	r0
1.1  mrg 	bra	LOCAL(lshrsi_11)	// >> 11
1.1  mrg 	shlr	r0
1.1  mrg 	bra	LOCAL(lshrsi_12)	// >> 12
1.1  mrg 	shlr2	r0
1.1  mrg 	bra	LOCAL(lshrsi_13)	// >> 13
1.1  mrg 	shlr	r0
1.1  mrg 	bra	LOCAL(lshrsi_14)	// >> 14
1.1  mrg 	shlr8	r0
1.1  mrg 	bra	LOCAL(lshrsi_15)	// >> 15
1.1  mrg 	shlr8	r0
1.1  mrg LOCAL(lshrsi_16):			// >> 16
1.1  mrg 	rts
1.1  mrg 	shlr16	r0
1.1  mrg 	bra	LOCAL(lshrsi_16)	// >> 17
1.1  mrg 	shlr	r0
1.1  mrg 	bra	LOCAL(lshrsi_16)	// >> 18
1.1  mrg 	shlr2	r0
1.1  mrg 	bra	LOCAL(lshrsi_19)	// >> 19
1.1  mrg 	shlr	r0
1.1  mrg 	bra	LOCAL(lshrsi_20)	// >> 20
1.1  mrg 	shlr2	r0
1.1  mrg 	bra	LOCAL(lshrsi_21)	// >> 21
1.1  mrg 	shlr	r0
1.1  mrg 	bra	LOCAL(lshrsi_22)	// >> 22
1.1  mrg 	shlr16	r0
1.1  mrg 	bra	LOCAL(lshrsi_23)	// >> 23
1.1  mrg 	shlr16	r0
1.1  mrg 	bra	LOCAL(lshrsi_16)	// >> 24
1.1  mrg 	shlr8	r0
1.1  mrg 	bra	LOCAL(lshrsi_25)	// >> 25
1.1  mrg 	shlr	r0
1.1  mrg 	bra	LOCAL(lshrsi_26)	// >> 26
1.1  mrg 	shlr2	r0
1.1  mrg 	bra	LOCAL(lshrsi_27)	// >> 27
1.1  mrg 	shlr	r0
1.1  mrg 	bra	LOCAL(lshrsi_28)	// >> 28
1.1  mrg 	shlr2	r0
1.1  mrg 	bra	LOCAL(lshrsi_29)	// >> 29
1.1  mrg 	shlr16	r0
1.1  mrg 	bra	LOCAL(lshrsi_30)	// >> 30
1.1  mrg 	shlr16	r0
1.1  mrg 	shll	r0			// >> 31
1.1  mrg 	rts
1.1  mrg 	movt	r0
1.1  mrg
1.1  mrg LOCAL(lshrsi_7):
1.1  mrg 	shlr2	r0
1.1  mrg LOCAL(lshrsi_5):
1.1  mrg LOCAL(lshrsi_6):
1.1  mrg 	shlr2	r0
1.1  mrg 	rts
1.1  mrg LOCAL(lshrsi_13):
1.1  mrg 	shlr2	r0
1.1  mrg LOCAL(lshrsi_12):
1.1  mrg LOCAL(lshrsi_11):
1.1  mrg 	shlr8	r0
1.1  mrg 	rts
1.1  mrg LOCAL(lshrsi_21):
1.1  mrg 	shlr2	r0
1.1  mrg LOCAL(lshrsi_20):
1.1  mrg LOCAL(lshrsi_19):
1.1  mrg 	shlr16	r0
1.1  mrg 	rts
1.1  mrg LOCAL(lshrsi_28):
1.1  mrg LOCAL(lshrsi_27):
1.1  mrg 	shlr2	r0
1.1  mrg LOCAL(lshrsi_26):
1.1  mrg LOCAL(lshrsi_25):
1.1  mrg 	shlr16	r0
1.1  mrg 	rts
1.1  mrg 	shlr8	r0
1.1  mrg
1.1  mrg LOCAL(lshrsi_22):
1.1  mrg LOCAL(lshrsi_14):
1.1  mrg 	shll2	r0
1.1  mrg 	rts
1.1  mrg 	shlr8	r0
1.1  mrg
1.1  mrg LOCAL(lshrsi_23):
1.1  mrg LOCAL(lshrsi_15):
1.1  mrg 	shll	r0
1.1  mrg 	rts
1.1  mrg 	shlr8	r0
1.1  mrg
1.1  mrg LOCAL(lshrsi_29):
1.1  mrg 	shll	r0
1.1  mrg LOCAL(lshrsi_30):
1.1  mrg 	shll2	r0
1.1  mrg 	rts
1.1  mrg 	shlr16	r0
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(lshrsi3))
1.1  mrg 	ENDFUNC(GLOBAL(lshrsi3_r0))
1.1  mrg #endif
1.1  mrg
1.1  mrg #ifdef L_movmem
1.1  mrg 	.text
1.1  mrg 	.balign	4
1.1  mrg 	.global	GLOBAL(movmem)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmem))
1.1  mrg 	HIDDEN_ALIAS(movstr,movmem)
1.1  mrg 	/* This would be a lot simpler if r6 contained the byte count
1.1  mrg 	   minus 64, and we wouldn't be called here for a byte count of 64.  */
1.1  mrg GLOBAL(movmem):
1.1  mrg 	sts.l	pr,@-r15
1.1  mrg 	shll2	r6
1.1  mrg 	bsr	GLOBAL(movmemSI52+2)
1.1  mrg 	mov.l	@(48,r5),r0
1.1  mrg 	.balign	4
1.1  mrg LOCAL(movmem_loop): /* Reached with rts */
1.1  mrg 	mov.l	@(60,r5),r0
1.1  mrg 	add	#-64,r6
1.1  mrg 	mov.l	r0,@(60,r4)
1.1  mrg 	tst	r6,r6
1.1  mrg 	mov.l	@(56,r5),r0
1.1  mrg 	bt	LOCAL(movmem_done)
1.1  mrg 	mov.l	r0,@(56,r4)
1.1  mrg 	cmp/pl	r6
1.1  mrg 	mov.l	@(52,r5),r0
1.1  mrg 	add	#64,r5
1.1  mrg 	mov.l	r0,@(52,r4)
1.1  mrg 	add	#64,r4
1.1  mrg 	bt	GLOBAL(movmemSI52)
1.1  mrg ! done all the large groups, do the remainder
1.1  mrg ! jump to movmem+
1.1  mrg 	mova	GLOBAL(movmemSI4)+4,r0
1.1  mrg 	add	r6,r0
1.1  mrg 	jmp	@r0
1.1  mrg LOCAL(movmem_done): ! share slot insn, works out aligned.
1.1  mrg 	lds.l	@r15+,pr
1.1  mrg 	mov.l	r0,@(56,r4)
1.1  mrg 	mov.l	@(52,r5),r0
1.1  mrg 	rts
1.1  mrg 	mov.l	r0,@(52,r4)
1.1  mrg 	.balign	4
1.1  mrg ! ??? We need aliases movstr* for movmem* for the older libraries.  These
1.1  mrg ! aliases will be removed at the some point in the future.
1.1  mrg 	.global	GLOBAL(movmemSI64)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI64))
1.1  mrg 	HIDDEN_ALIAS(movstrSI64,movmemSI64)
1.1  mrg GLOBAL(movmemSI64):
1.1  mrg 	mov.l	@(60,r5),r0
1.1  mrg 	mov.l	r0,@(60,r4)
1.1  mrg 	.global	GLOBAL(movmemSI60)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI60))
1.1  mrg 	HIDDEN_ALIAS(movstrSI60,movmemSI60)
1.1  mrg GLOBAL(movmemSI60):
1.1  mrg 	mov.l	@(56,r5),r0
1.1  mrg 	mov.l	r0,@(56,r4)
1.1  mrg 	.global	GLOBAL(movmemSI56)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI56))
1.1  mrg 	HIDDEN_ALIAS(movstrSI56,movmemSI56)
1.1  mrg GLOBAL(movmemSI56):
1.1  mrg 	mov.l	@(52,r5),r0
1.1  mrg 	mov.l	r0,@(52,r4)
1.1  mrg 	.global	GLOBAL(movmemSI52)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI52))
1.1  mrg 	HIDDEN_ALIAS(movstrSI52,movmemSI52)
1.1  mrg GLOBAL(movmemSI52):
1.1  mrg 	mov.l	@(48,r5),r0
1.1  mrg 	mov.l	r0,@(48,r4)
1.1  mrg 	.global	GLOBAL(movmemSI48)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI48))
1.1  mrg 	HIDDEN_ALIAS(movstrSI48,movmemSI48)
1.1  mrg GLOBAL(movmemSI48):
1.1  mrg 	mov.l	@(44,r5),r0
1.1  mrg 	mov.l	r0,@(44,r4)
1.1  mrg 	.global	GLOBAL(movmemSI44)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI44))
1.1  mrg 	HIDDEN_ALIAS(movstrSI44,movmemSI44)
1.1  mrg GLOBAL(movmemSI44):
1.1  mrg 	mov.l	@(40,r5),r0
1.1  mrg 	mov.l	r0,@(40,r4)
1.1  mrg 	.global	GLOBAL(movmemSI40)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI40))
1.1  mrg 	HIDDEN_ALIAS(movstrSI40,movmemSI40)
1.1  mrg GLOBAL(movmemSI40):
1.1  mrg 	mov.l	@(36,r5),r0
1.1  mrg 	mov.l	r0,@(36,r4)
1.1  mrg 	.global	GLOBAL(movmemSI36)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI36))
1.1  mrg 	HIDDEN_ALIAS(movstrSI36,movmemSI36)
1.1  mrg GLOBAL(movmemSI36):
1.1  mrg 	mov.l	@(32,r5),r0
1.1  mrg 	mov.l	r0,@(32,r4)
1.1  mrg 	.global	GLOBAL(movmemSI32)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI32))
1.1  mrg 	HIDDEN_ALIAS(movstrSI32,movmemSI32)
1.1  mrg GLOBAL(movmemSI32):
1.1  mrg 	mov.l	@(28,r5),r0
1.1  mrg 	mov.l	r0,@(28,r4)
1.1  mrg 	.global	GLOBAL(movmemSI28)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI28))
1.1  mrg 	HIDDEN_ALIAS(movstrSI28,movmemSI28)
1.1  mrg GLOBAL(movmemSI28):
1.1  mrg 	mov.l	@(24,r5),r0
1.1  mrg 	mov.l	r0,@(24,r4)
1.1  mrg 	.global	GLOBAL(movmemSI24)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI24))
1.1  mrg 	HIDDEN_ALIAS(movstrSI24,movmemSI24)
1.1  mrg GLOBAL(movmemSI24):
1.1  mrg 	mov.l	@(20,r5),r0
1.1  mrg 	mov.l	r0,@(20,r4)
1.1  mrg 	.global	GLOBAL(movmemSI20)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI20))
1.1  mrg 	HIDDEN_ALIAS(movstrSI20,movmemSI20)
1.1  mrg GLOBAL(movmemSI20):
1.1  mrg 	mov.l	@(16,r5),r0
1.1  mrg 	mov.l	r0,@(16,r4)
1.1  mrg 	.global	GLOBAL(movmemSI16)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI16))
1.1  mrg 	HIDDEN_ALIAS(movstrSI16,movmemSI16)
1.1  mrg GLOBAL(movmemSI16):
1.1  mrg 	mov.l	@(12,r5),r0
1.1  mrg 	mov.l	r0,@(12,r4)
1.1  mrg 	.global	GLOBAL(movmemSI12)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI12))
1.1  mrg 	HIDDEN_ALIAS(movstrSI12,movmemSI12)
1.1  mrg GLOBAL(movmemSI12):
1.1  mrg 	mov.l	@(8,r5),r0
1.1  mrg 	mov.l	r0,@(8,r4)
1.1  mrg 	.global	GLOBAL(movmemSI8)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI8))
1.1  mrg 	HIDDEN_ALIAS(movstrSI8,movmemSI8)
1.1  mrg GLOBAL(movmemSI8):
1.1  mrg 	mov.l	@(4,r5),r0
1.1  mrg 	mov.l	r0,@(4,r4)
1.1  mrg 	.global	GLOBAL(movmemSI4)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI4))
1.1  mrg 	HIDDEN_ALIAS(movstrSI4,movmemSI4)
1.1  mrg GLOBAL(movmemSI4):
1.1  mrg 	mov.l	@(0,r5),r0
1.1  mrg 	rts
1.1  mrg 	mov.l	r0,@(0,r4)
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI64))
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI60))
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI56))
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI52))
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI48))
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI44))
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI40))
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI36))
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI32))
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI28))
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI24))
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI20))
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI16))
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI12))
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI8))
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI4))
1.1  mrg 	ENDFUNC(GLOBAL(movmem))
1.1  mrg #endif
1.1  mrg
1.1  mrg #ifdef L_movmem_i4
1.1  mrg 	.text
1.1  mrg 	.global	GLOBAL(movmem_i4_even)
1.1  mrg 	.global	GLOBAL(movmem_i4_odd)
1.1  mrg 	.global	GLOBAL(movmemSI12_i4)
1.1  mrg
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmem_i4_even))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmem_i4_odd))
1.1  mrg 	HIDDEN_FUNC(GLOBAL(movmemSI12_i4))
1.1  mrg
1.1  mrg 	HIDDEN_ALIAS(movstr_i4_even,movmem_i4_even)
1.1  mrg 	HIDDEN_ALIAS(movstr_i4_odd,movmem_i4_odd)
1.1  mrg 	HIDDEN_ALIAS(movstrSI12_i4,movmemSI12_i4)
1.1  mrg
1.1  mrg 	.p2align	5
1.1  mrg L_movmem_2mod4_end:
1.1  mrg 	mov.l	r0,@(16,r4)
1.1  mrg 	rts
1.1  mrg 	mov.l	r1,@(20,r4)
1.1  mrg
1.1  mrg 	.p2align	2
1.1  mrg
1.1  mrg GLOBAL(movmem_i4_even):
1.1  mrg 	mov.l	@r5+,r0
1.1  mrg 	bra	L_movmem_start_even
1.1  mrg 	mov.l	@r5+,r1
1.1  mrg
1.1  mrg GLOBAL(movmem_i4_odd):
1.1  mrg 	mov.l	@r5+,r1
1.1  mrg 	add	#-4,r4
1.1  mrg 	mov.l	@r5+,r2
1.1  mrg 	mov.l	@r5+,r3
1.1  mrg 	mov.l	r1,@(4,r4)
1.1  mrg 	mov.l	r2,@(8,r4)
1.1  mrg
1.1  mrg L_movmem_loop:
1.1  mrg 	mov.l	r3,@(12,r4)
1.1  mrg 	dt	r6
1.1  mrg 	mov.l	@r5+,r0
1.1  mrg 	bt/s	L_movmem_2mod4_end
1.1  mrg 	mov.l	@r5+,r1
1.1  mrg 	add	#16,r4
1.1  mrg L_movmem_start_even:
1.1  mrg 	mov.l	@r5+,r2
1.1  mrg 	mov.l	@r5+,r3
1.1  mrg 	mov.l	r0,@r4
1.1  mrg 	dt	r6
1.1  mrg 	mov.l	r1,@(4,r4)
1.1  mrg 	bf/s	L_movmem_loop
1.1  mrg 	mov.l	r2,@(8,r4)
1.1  mrg 	rts
1.1  mrg 	mov.l	r3,@(12,r4)
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(movmem_i4_even))
1.1  mrg 	ENDFUNC(GLOBAL(movmem_i4_odd))
1.1  mrg
1.1  mrg 	.p2align	4
1.1  mrg GLOBAL(movmemSI12_i4):
1.1  mrg 	mov.l	@r5,r0
1.1  mrg 	mov.l	@(4,r5),r1
1.1  mrg 	mov.l	@(8,r5),r2
1.1  mrg 	mov.l	r0,@r4
1.1  mrg 	mov.l	r1,@(4,r4)
1.1  mrg 	rts
1.1  mrg 	mov.l	r2,@(8,r4)
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(movmemSI12_i4))
1.1  mrg #endif
1.1  mrg
1.1  mrg #ifdef L_mulsi3
1.1  mrg
1.1  mrg
1.1  mrg 	.global	GLOBAL(mulsi3)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(mulsi3))
1.1  mrg
1.1  mrg ! r4 =       aabb
1.1  mrg ! r5 =       ccdd
1.1  mrg ! r0 = aabb*ccdd  via partial products
1.1  mrg !
1.1  mrg ! if aa == 0 and cc = 0
1.1  mrg ! r0 = bb*dd
1.1  mrg !
1.1  mrg ! else
1.1  mrg ! aa = bb*dd + (aa*dd*65536) + (cc*bb*65536)
1.1  mrg !
1.1  mrg
1.1  mrg GLOBAL(mulsi3):
1.1  mrg 	mulu.w  r4,r5		! multiply the lsws  macl=bb*dd
1.1  mrg 	mov     r5,r3		! r3 = ccdd
1.1  mrg 	swap.w  r4,r2		! r2 = bbaa
1.1  mrg 	xtrct   r2,r3		! r3 = aacc
1.1  mrg 	tst  	r3,r3		! msws zero ?
1.1  mrg 	bf      hiset
1.1  mrg 	rts			! yes - then we have the answer
1.1  mrg 	sts     macl,r0
1.1  mrg
1.1  mrg hiset:	sts	macl,r0		! r0 = bb*dd
1.1  mrg 	mulu.w	r2,r5		! brewing macl = aa*dd
1.1  mrg 	sts	macl,r1
1.1  mrg 	mulu.w	r3,r4		! brewing macl = cc*bb
1.1  mrg 	sts	macl,r2
1.1  mrg 	add	r1,r2
1.1  mrg 	shll16	r2
1.1  mrg 	rts
1.1  mrg 	add	r2,r0
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(mulsi3))
1.1  mrg #endif
1.1  mrg #endif /* ! __SH5__ */
1.3  mrg
1.3  mrg /*------------------------------------------------------------------------------
1.3  mrg   32 bit signed integer division that uses FPU double precision division.  */
1.3  mrg
1.1  mrg #ifdef L_sdivsi3_i4
1.1  mrg 	.title "SH DIVIDE"
1.3  mrg
1.1  mrg #if defined (__SH4__) || defined (__SH2A__)
1.3  mrg /* This variant is used when FPSCR.PR = 1 (double precision) is the default
1.3  mrg    setting.
1.3  mrg    Args in r4 and r5, result in fpul, clobber dr0, dr2.  */
1.1  mrg
1.1  mrg 	.global	GLOBAL(sdivsi3_i4)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(sdivsi3_i4))
1.1  mrg GLOBAL(sdivsi3_i4):
1.1  mrg 	lds r4,fpul
1.1  mrg 	float fpul,dr0
1.1  mrg 	lds r5,fpul
1.1  mrg 	float fpul,dr2
1.1  mrg 	fdiv dr2,dr0
1.1  mrg 	rts
1.1  mrg 	ftrc dr0,fpul
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(sdivsi3_i4))
1.3  mrg
1.1  mrg #elif defined (__SH2A_SINGLE__) || defined (__SH2A_SINGLE_ONLY__) || defined(__SH4_SINGLE__) || defined(__SH4_SINGLE_ONLY__) || (defined (__SH5__) && ! defined __SH4_NOFPU__)
1.3  mrg /* This variant is used when FPSCR.PR = 0 (sigle precision) is the default
1.3  mrg    setting.
1.3  mrg    Args in r4 and r5, result in fpul, clobber r2, dr0, dr2.
1.3  mrg    For this to work, we must temporarily switch the FPU do double precision,
1.3  mrg    but we better do not touch FPSCR.FR.  See PR 6526.  */
1.1  mrg
1.1  mrg #if ! __SH5__ || __SH5__ == 32
1.1  mrg #if __SH5__
1.1  mrg 	.mode	SHcompact
1.1  mrg #endif
1.1  mrg 	.global	GLOBAL(sdivsi3_i4)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(sdivsi3_i4))
1.1  mrg GLOBAL(sdivsi3_i4):
1.3  mrg
1.3  mrg #ifndef __SH4A__
1.3  mrg 	mov.l	r3,@-r15
1.3  mrg 	sts	fpscr,r2
1.3  mrg 	mov	#8,r3
1.3  mrg 	swap.w	r3,r3		// r3 = 1 << 19 (FPSCR.PR bit)
1.3  mrg 	or	r2,r3
1.3  mrg 	lds	r3,fpscr	// Set FPSCR.PR = 1.
1.3  mrg 	lds	r4,fpul
1.3  mrg 	float	fpul,dr0
1.3  mrg 	lds	r5,fpul
1.3  mrg 	float	fpul,dr2
1.3  mrg 	fdiv	dr2,dr0
1.3  mrg 	ftrc	dr0,fpul
1.3  mrg 	lds	r2,fpscr
1.3  mrg 	rts
1.3  mrg 	mov.l	@r15+,r3
1.3  mrg #else
1.3  mrg /* On SH4A we can use the fpchg instruction to flip the FPSCR.PR bit.  */
1.3  mrg 	fpchg
1.3  mrg 	lds	r4,fpul
1.3  mrg 	float	fpul,dr0
1.3  mrg 	lds	r5,fpul
1.3  mrg 	float	fpul,dr2
1.3  mrg 	fdiv	dr2,dr0
1.3  mrg 	ftrc	dr0,fpul
1.1  mrg 	rts
1.3  mrg 	fpchg
1.3  mrg
1.3  mrg #endif /* __SH4A__  */
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(sdivsi3_i4))
1.1  mrg #endif /* ! __SH5__ || __SH5__ == 32 */
1.1  mrg #endif /* ! __SH4__ || __SH2A__  */
1.3  mrg #endif /* L_sdivsi3_i4  */
1.1  mrg
1.3  mrg //------------------------------------------------------------------------------
1.1  mrg #ifdef L_sdivsi3
1.1  mrg /* __SH4_SINGLE_ONLY__ keeps this part for link compatibility with
1.1  mrg    sh2e/sh3e code.  */
1.1  mrg !!
1.1  mrg !! Steve Chamberlain
1.1  mrg !! sac@cygnus.com
1.1  mrg !!
1.1  mrg !!
1.1  mrg
1.1  mrg !! args in r4 and r5, result in r0 clobber r1, r2, r3, and t bit
1.1  mrg
1.1  mrg 	.global	GLOBAL(sdivsi3)
1.1  mrg #if __SHMEDIA__
1.1  mrg #if __SH5__ == 32
1.1  mrg 	.section	.text..SHmedia32,"ax"
1.1  mrg #else
1.1  mrg 	.text
1.1  mrg #endif
1.1  mrg 	.align	2
1.1  mrg #if 0
1.1  mrg /* The assembly code that follows is a hand-optimized version of the C
1.1  mrg    code that follows.  Note that the registers that are modified are
1.1  mrg    exactly those listed as clobbered in the patterns divsi3_i1 and
1.1  mrg    divsi3_i1_media.
1.1  mrg
1.1  mrg int __sdivsi3 (i, j)
1.1  mrg      int i, j;
1.1  mrg {
1.1  mrg   register unsigned long long r18 asm ("r18");
1.1  mrg   register unsigned long long r19 asm ("r19");
1.1  mrg   register unsigned long long r0 asm ("r0") = 0;
1.1  mrg   register unsigned long long r1 asm ("r1") = 1;
1.1  mrg   register int r2 asm ("r2") = i >> 31;
1.1  mrg   register int r3 asm ("r3") = j >> 31;
1.1  mrg
1.1  mrg   r2 = r2 ? r2 : r1;
1.1  mrg   r3 = r3 ? r3 : r1;
1.1  mrg   r18 = i * r2;
1.1  mrg   r19 = j * r3;
1.1  mrg   r2 *= r3;
1.1  mrg
1.1  mrg   r19 <<= 31;
1.1  mrg   r1 <<= 31;
1.1  mrg   do
1.1  mrg     if (r18 >= r19)
1.1  mrg       r0 |= r1, r18 -= r19;
1.1  mrg   while (r19 >>= 1, r1 >>= 1);
1.1  mrg
1.1  mrg   return r2 * (int)r0;
1.1  mrg }
1.1  mrg */
1.1  mrg GLOBAL(sdivsi3):
1.1  mrg 	pt/l	LOCAL(sdivsi3_dontadd), tr2
1.1  mrg 	pt/l	LOCAL(sdivsi3_loop), tr1
1.1  mrg 	ptabs/l	r18, tr0
1.1  mrg 	movi	0, r0
1.1  mrg 	movi	1, r1
1.1  mrg 	shari.l	r4, 31, r2
1.1  mrg 	shari.l	r5, 31, r3
1.1  mrg 	cmveq	r2, r1, r2
1.1  mrg 	cmveq	r3, r1, r3
1.1  mrg 	muls.l	r4, r2, r18
1.1  mrg 	muls.l	r5, r3, r19
1.1  mrg 	muls.l	r2, r3, r2
1.1  mrg 	shlli	r19, 31, r19
1.1  mrg 	shlli	r1, 31, r1
1.1  mrg LOCAL(sdivsi3_loop):
1.1  mrg 	bgtu	r19, r18, tr2
1.1  mrg 	or	r0, r1, r0
1.1  mrg 	sub	r18, r19, r18
1.1  mrg LOCAL(sdivsi3_dontadd):
1.1  mrg 	shlri	r1, 1, r1
1.1  mrg 	shlri	r19, 1, r19
1.1  mrg 	bnei	r1, 0, tr1
1.1  mrg 	muls.l	r0, r2, r0
1.1  mrg 	add.l	r0, r63, r0
1.1  mrg 	blink	tr0, r63
1.1  mrg #elif 0 /* ! 0 */
1.1  mrg  // inputs: r4,r5
1.1  mrg  // clobbered: r1,r2,r3,r18,r19,r20,r21,r25,tr0
1.1  mrg  // result in r0
1.1  mrg GLOBAL(sdivsi3):
1.1  mrg  // can create absolute value without extra latency,
1.1  mrg  // but dependent on proper sign extension of inputs:
1.1  mrg  // shari.l r5,31,r2
1.1  mrg  // xor r5,r2,r20
1.1  mrg  // sub r20,r2,r20 // r20 is now absolute value of r5, zero-extended.
1.1  mrg  shari.l r5,31,r2
1.1  mrg  ori r2,1,r2
1.1  mrg  muls.l r5,r2,r20 // r20 is now absolute value of r5, zero-extended.
1.1  mrg  movi 0xffffffffffffbb0c,r19 // shift count eqiv 76
1.1  mrg  shari.l r4,31,r3
1.1  mrg  nsb r20,r0
1.1  mrg  shlld r20,r0,r25
1.1  mrg  shlri r25,48,r25
1.1  mrg  sub r19,r25,r1
1.1  mrg  mmulfx.w r1,r1,r2
1.1  mrg  mshflo.w r1,r63,r1
1.1  mrg  // If r4 was to be used in-place instead of r21, could use this sequence
1.1  mrg  // to compute absolute:
1.1  mrg  // sub r63,r4,r19 // compute absolute value of r4
1.1  mrg  // shlri r4,32,r3 // into lower 32 bit of r4, keeping
1.1  mrg  // mcmv r19,r3,r4 // the sign in the upper 32 bits intact.
1.1  mrg  ori r3,1,r3
1.1  mrg  mmulfx.w r25,r2,r2
1.1  mrg  sub r19,r0,r0
1.1  mrg  muls.l r4,r3,r21
1.1  mrg  msub.w r1,r2,r2
1.1  mrg  addi r2,-2,r1
1.1  mrg  mulu.l r21,r1,r19
1.1  mrg  mmulfx.w r2,r2,r2
1.1  mrg  shlli r1,15,r1
1.1  mrg  shlrd r19,r0,r19
1.1  mrg  mulu.l r19,r20,r3
1.1  mrg  mmacnfx.wl r25,r2,r1
1.1  mrg  ptabs r18,tr0
1.1  mrg  sub r21,r3,r25
1.1  mrg
1.1  mrg  mulu.l r25,r1,r2
1.1  mrg  addi r0,14,r0
1.1  mrg  xor r4,r5,r18
1.1  mrg  shlrd r2,r0,r2
1.1  mrg  mulu.l r2,r20,r3
1.1  mrg  add r19,r2,r19
1.1  mrg  shari.l r18,31,r18
1.1  mrg  sub r25,r3,r25
1.1  mrg
1.1  mrg  mulu.l r25,r1,r2
1.1  mrg  sub r25,r20,r25
1.1  mrg  add r19,r18,r19
1.1  mrg  shlrd r2,r0,r2
1.1  mrg  mulu.l r2,r20,r3
1.1  mrg  addi r25,1,r25
1.1  mrg  add r19,r2,r19
1.1  mrg
1.1  mrg  cmpgt r25,r3,r25
1.1  mrg  add.l r19,r25,r0
1.1  mrg  xor r0,r18,r0
1.1  mrg  blink tr0,r63
1.1  mrg #else /* ! 0 && ! 0 */
1.1  mrg
1.1  mrg  // inputs: r4,r5
1.1  mrg  // clobbered: r1,r18,r19,r20,r21,r25,tr0
1.1  mrg  // result in r0
1.1  mrg 	HIDDEN_FUNC(GLOBAL(sdivsi3_2))
1.1  mrg #ifndef __pic__
1.1  mrg 	FUNC(GLOBAL(sdivsi3))
1.1  mrg GLOBAL(sdivsi3): /* this is the shcompact entry point */
1.1  mrg  // The special SHmedia entry point sdivsi3_1 prevents accidental linking
1.1  mrg  // with the SHcompact implementation, which clobbers tr1 / tr2.
1.1  mrg  .global GLOBAL(sdivsi3_1)
1.1  mrg GLOBAL(sdivsi3_1):
1.1  mrg  .global GLOBAL(div_table_internal)
1.1  mrg  movi (GLOBAL(div_table_internal) >> 16) & 65535, r20
1.1  mrg  shori GLOBAL(div_table_internal) & 65535, r20
1.1  mrg #endif
1.1  mrg  .global GLOBAL(sdivsi3_2)
1.1  mrg  // div_table in r20
1.1  mrg  // clobbered: r1,r18,r19,r21,r25,tr0
1.1  mrg GLOBAL(sdivsi3_2):
1.1  mrg  nsb r5, r1
1.1  mrg  shlld r5, r1, r25    // normalize; [-2 ..1, 1..2) in s2.62
1.1  mrg  shari r25, 58, r21   // extract 5(6) bit index (s2.4 with hole -1..1)
1.1  mrg  ldx.ub r20, r21, r19 // u0.8
1.1  mrg  shari r25, 32, r25   // normalize to s2.30
1.1  mrg  shlli r21, 1, r21
1.1  mrg  muls.l r25, r19, r19 // s2.38
1.1  mrg  ldx.w r20, r21, r21  // s2.14
1.1  mrg   ptabs r18, tr0
1.1  mrg  shari r19, 24, r19   // truncate to s2.14
1.1  mrg  sub r21, r19, r19    // some 11 bit inverse in s1.14
1.1  mrg  muls.l r19, r19, r21 // u0.28
1.1  mrg   sub r63, r1, r1
1.1  mrg   addi r1, 92, r1
1.1  mrg  muls.l r25, r21, r18 // s2.58
1.1  mrg  shlli r19, 45, r19   // multiply by two and convert to s2.58
1.1  mrg   /* bubble */
1.1  mrg  sub r19, r18, r18
1.1  mrg  shari r18, 28, r18   // some 22 bit inverse in s1.30
1.1  mrg  muls.l r18, r25, r0  // s2.60
1.1  mrg   muls.l r18, r4, r25 // s32.30
1.1  mrg   /* bubble */
1.1  mrg  shari r0, 16, r19   // s-16.44
1.1  mrg  muls.l r19, r18, r19 // s-16.74
1.1  mrg   shari r25, 63, r0
1.1  mrg   shari r4, 14, r18   // s19.-14
1.1  mrg  shari r19, 30, r19   // s-16.44
1.1  mrg  muls.l r19, r18, r19 // s15.30
1.1  mrg   xor r21, r0, r21    // You could also use the constant 1 << 27.
1.1  mrg   add r21, r25, r21
1.1  mrg  sub r21, r19, r21
1.1  mrg  shard r21, r1, r21
1.1  mrg  sub r21, r0, r0
1.1  mrg  blink tr0, r63
1.1  mrg #ifndef __pic__
1.1  mrg 	ENDFUNC(GLOBAL(sdivsi3))
1.1  mrg #endif
1.1  mrg 	ENDFUNC(GLOBAL(sdivsi3_2))
1.1  mrg #endif
1.1  mrg #elif __SHMEDIA__
1.1  mrg /* m5compact-nofpu */
1.1  mrg  // clobbered: r18,r19,r20,r21,r25,tr0,tr1,tr2
1.1  mrg 	.mode	SHmedia
1.1  mrg 	.section	.text..SHmedia32,"ax"
1.1  mrg 	.align	2
1.1  mrg 	FUNC(GLOBAL(sdivsi3))
1.1  mrg GLOBAL(sdivsi3):
1.1  mrg 	pt/l LOCAL(sdivsi3_dontsub), tr0
1.1  mrg 	pt/l LOCAL(sdivsi3_loop), tr1
1.1  mrg 	ptabs/l r18,tr2
1.1  mrg 	shari.l r4,31,r18
1.1  mrg 	shari.l r5,31,r19
1.1  mrg 	xor r4,r18,r20
1.1  mrg 	xor r5,r19,r21
1.1  mrg 	sub.l r20,r18,r20
1.1  mrg 	sub.l r21,r19,r21
1.1  mrg 	xor r18,r19,r19
1.1  mrg 	shlli r21,32,r25
1.1  mrg 	addi r25,-1,r21
1.1  mrg 	addz.l r20,r63,r20
1.1  mrg LOCAL(sdivsi3_loop):
1.1  mrg 	shlli r20,1,r20
1.1  mrg 	bgeu/u r21,r20,tr0
1.1  mrg 	sub r20,r21,r20
1.1  mrg LOCAL(sdivsi3_dontsub):
1.1  mrg 	addi.l r25,-1,r25
1.1  mrg 	bnei r25,-32,tr1
1.1  mrg 	xor r20,r19,r20
1.1  mrg 	sub.l r20,r19,r0
1.1  mrg 	blink tr2,r63
1.1  mrg 	ENDFUNC(GLOBAL(sdivsi3))
1.1  mrg #else /* ! __SHMEDIA__ */
1.1  mrg 	FUNC(GLOBAL(sdivsi3))
1.1  mrg GLOBAL(sdivsi3):
1.1  mrg 	mov	r4,r1
1.1  mrg 	mov	r5,r0
1.1  mrg
1.1  mrg 	tst	r0,r0
1.1  mrg 	bt	div0
1.1  mrg 	mov	#0,r2
1.1  mrg 	div0s	r2,r1
1.1  mrg 	subc	r3,r3
1.1  mrg 	subc	r2,r1
1.1  mrg 	div0s	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	div1	r0,r3
1.1  mrg 	rotcl	r1
1.1  mrg 	addc	r2,r1
1.1  mrg 	rts
1.1  mrg 	mov	r1,r0
1.1  mrg
1.1  mrg
1.1  mrg div0:	rts
1.1  mrg 	mov	#0,r0
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(sdivsi3))
1.3  mrg #endif /* ! __SHMEDIA__  */
1.3  mrg #endif /* L_sdivsi3  */
1.3  mrg
1.3  mrg /*------------------------------------------------------------------------------
1.3  mrg   32 bit unsigned integer division that uses FPU double precision division.  */
1.3  mrg
1.1  mrg #ifdef L_udivsi3_i4
1.3  mrg 	.title "SH DIVIDE"
1.1  mrg
1.1  mrg #if defined (__SH4__) || defined (__SH2A__)
1.3  mrg /* This variant is used when FPSCR.PR = 1 (double precision) is the default
1.3  mrg    setting.
1.3  mrg    Args in r4 and r5, result in fpul,
1.3  mrg    clobber r0, r1, r4, r5, dr0, dr2, dr4, and t bit  */
1.1  mrg
1.1  mrg 	.global	GLOBAL(udivsi3_i4)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(udivsi3_i4))
1.1  mrg GLOBAL(udivsi3_i4):
1.3  mrg 	mov	#1,r1
1.3  mrg 	cmp/hi	r1,r5
1.3  mrg 	bf/s	trivial
1.3  mrg 	rotr	r1
1.3  mrg 	xor	r1,r4
1.3  mrg 	lds	r4,fpul
1.3  mrg 	mova	L1,r0
1.1  mrg #ifdef FMOVD_WORKS
1.3  mrg 	fmov.d	@r0+,dr4
1.1  mrg #else
1.3  mrg 	fmov.s	@r0+,DR40
1.3  mrg 	fmov.s	@r0,DR41
1.1  mrg #endif
1.3  mrg 	float	fpul,dr0
1.3  mrg 	xor	r1,r5
1.3  mrg 	lds	r5,fpul
1.3  mrg 	float	fpul,dr2
1.3  mrg 	fadd	dr4,dr0
1.3  mrg 	fadd	dr4,dr2
1.3  mrg 	fdiv	dr2,dr0
1.1  mrg 	rts
1.3  mrg 	ftrc	dr0,fpul
1.1  mrg
1.1  mrg trivial:
1.1  mrg 	rts
1.3  mrg 	lds	r4,fpul
1.1  mrg
1.1  mrg 	.align 2
1.1  mrg #ifdef FMOVD_WORKS
1.3  mrg 	.align 3	// Make the double below 8 byte aligned.
1.1  mrg #endif
1.1  mrg L1:
1.1  mrg 	.double 2147483648
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(udivsi3_i4))
1.3  mrg
1.1  mrg #elif defined (__SH5__) && ! defined (__SH4_NOFPU__) && ! defined (__SH2A_NOFPU__)
1.1  mrg #if ! __SH5__ || __SH5__ == 32
1.1  mrg !! args in r4 and r5, result in fpul, clobber r20, r21, dr0, fr33
1.1  mrg 	.mode	SHmedia
1.1  mrg 	.global	GLOBAL(udivsi3_i4)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(udivsi3_i4))
1.1  mrg GLOBAL(udivsi3_i4):
1.1  mrg 	addz.l	r4,r63,r20
1.1  mrg 	addz.l	r5,r63,r21
1.1  mrg 	fmov.qd	r20,dr0
1.1  mrg 	fmov.qd	r21,dr32
1.1  mrg 	ptabs	r18,tr0
1.1  mrg 	float.qd dr0,dr0
1.1  mrg 	float.qd dr32,dr32
1.1  mrg 	fdiv.d	dr0,dr32,dr0
1.1  mrg 	ftrc.dq dr0,dr32
1.1  mrg 	fmov.s fr33,fr32
1.1  mrg 	blink tr0,r63
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(udivsi3_i4))
1.1  mrg #endif /* ! __SH5__ || __SH5__ == 32 */
1.3  mrg
1.1  mrg #elif defined (__SH2A_SINGLE__) || defined (__SH2A_SINGLE_ONLY__) || defined(__SH4_SINGLE__) || defined(__SH4_SINGLE_ONLY__)
1.3  mrg /* This variant is used when FPSCR.PR = 0 (sigle precision) is the default
1.3  mrg    setting.
1.3  mrg    Args in r4 and r5, result in fpul,
1.3  mrg    clobber r0, r1, r4, r5, dr0, dr2, dr4.
1.3  mrg    For this to work, we must temporarily switch the FPU do double precision,
1.3  mrg    but we better do not touch FPSCR.FR.  See PR 6526.  */
1.1  mrg
1.1  mrg 	.global	GLOBAL(udivsi3_i4)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(udivsi3_i4))
1.1  mrg GLOBAL(udivsi3_i4):
1.3  mrg
1.3  mrg #ifndef __SH4A__
1.3  mrg 	mov	#1,r1
1.3  mrg 	cmp/hi	r1,r5
1.3  mrg 	bf/s	trivial
1.3  mrg 	rotr	r1		// r1 = 1 << 31
1.3  mrg 	sts.l	fpscr,@-r15
1.3  mrg 	xor	r1,r4
1.3  mrg 	mov.l	@(0,r15),r0
1.3  mrg 	xor	r1,r5
1.3  mrg 	mov.l	L2,r1
1.3  mrg 	lds	r4,fpul
1.3  mrg 	or	r0,r1
1.3  mrg 	mova	L1,r0
1.3  mrg 	lds	r1,fpscr
1.1  mrg #ifdef FMOVD_WORKS
1.3  mrg 	fmov.d	@r0+,dr4
1.1  mrg #else
1.3  mrg 	fmov.s	@r0+,DR40
1.3  mrg 	fmov.s	@r0,DR41
1.1  mrg #endif
1.3  mrg 	float	fpul,dr0
1.3  mrg 	lds	r5,fpul
1.3  mrg 	float	fpul,dr2
1.3  mrg 	fadd	dr4,dr0
1.3  mrg 	fadd	dr4,dr2
1.3  mrg 	fdiv	dr2,dr0
1.3  mrg 	ftrc	dr0,fpul
1.1  mrg 	rts
1.3  mrg 	lds.l	@r15+,fpscr
1.1  mrg
1.1  mrg #ifdef FMOVD_WORKS
1.3  mrg 	.align 3	// Make the double below 8 byte aligned.
1.1  mrg #endif
1.1  mrg trivial:
1.1  mrg 	rts
1.3  mrg 	lds	r4,fpul
1.1  mrg
1.1  mrg 	.align 2
1.3  mrg L2:
1.3  mrg #ifdef FMOVD_WORKS
1.3  mrg 	.long 0x180000	// FPSCR.PR = 1, FPSCR.SZ = 1
1.3  mrg #else
1.3  mrg 	.long 0x80000	// FPSCR.PR = 1
1.3  mrg #endif
1.1  mrg L1:
1.3  mrg 	.double 2147483648
1.3  mrg
1.1  mrg #else
1.3  mrg /* On SH4A we can use the fpchg instruction to flip the FPSCR.PR bit.
1.3  mrg    Although on SH4A fmovd usually works, it would require either additional
1.3  mrg    two fschg instructions or an FPSCR push + pop.  It's not worth the effort
1.3  mrg    for loading only one double constant.  */
1.3  mrg 	mov	#1,r1
1.3  mrg 	cmp/hi	r1,r5
1.3  mrg 	bf/s	trivial
1.3  mrg 	rotr	r1		// r1 = 1 << 31
1.3  mrg 	fpchg
1.3  mrg 	mova	L1,r0
1.3  mrg 	xor	r1,r4
1.3  mrg 	fmov.s	@r0+,DR40
1.3  mrg 	lds	r4,fpul
1.3  mrg 	fmov.s	@r0,DR41
1.3  mrg 	xor	r1,r5
1.3  mrg 	float	fpul,dr0
1.3  mrg 	lds	r5,fpul
1.3  mrg 	float	fpul,dr2
1.3  mrg 	fadd	dr4,dr0
1.3  mrg 	fadd	dr4,dr2
1.3  mrg 	fdiv	dr2,dr0
1.3  mrg 	ftrc	dr0,fpul
1.3  mrg 	rts
1.3  mrg 	fpchg
1.3  mrg
1.3  mrg trivial:
1.3  mrg 	rts
1.3  mrg 	lds	r4,fpul
1.3  mrg
1.3  mrg 	.align 2
1.3  mrg L1:
1.1  mrg 	.double 2147483648
1.1  mrg
1.3  mrg #endif /* __SH4A__  */
1.3  mrg
1.3  mrg
1.1  mrg 	ENDFUNC(GLOBAL(udivsi3_i4))
1.1  mrg #endif /* ! __SH4__ */
1.3  mrg #endif /* L_udivsi3_i4  */
1.1  mrg
1.1  mrg #ifdef L_udivsi3
1.1  mrg /* __SH4_SINGLE_ONLY__ keeps this part for link compatibility with
1.1  mrg    sh2e/sh3e code.  */
1.1  mrg
1.1  mrg !! args in r4 and r5, result in r0, clobbers r4, pr, and t bit
1.1  mrg 	.global	GLOBAL(udivsi3)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(udivsi3))
1.1  mrg
1.1  mrg #if __SHMEDIA__
1.1  mrg #if __SH5__ == 32
1.1  mrg 	.section	.text..SHmedia32,"ax"
1.1  mrg #else
1.1  mrg 	.text
1.1  mrg #endif
1.1  mrg 	.align	2
1.1  mrg #if 0
1.1  mrg /* The assembly code that follows is a hand-optimized version of the C
1.1  mrg    code that follows.  Note that the registers that are modified are
1.1  mrg    exactly those listed as clobbered in the patterns udivsi3_i1 and
1.1  mrg    udivsi3_i1_media.
1.1  mrg
1.1  mrg unsigned
1.1  mrg __udivsi3 (i, j)
1.1  mrg     unsigned i, j;
1.1  mrg {
1.1  mrg   register unsigned long long r0 asm ("r0") = 0;
1.1  mrg   register unsigned long long r18 asm ("r18") = 1;
1.1  mrg   register unsigned long long r4 asm ("r4") = i;
1.1  mrg   register unsigned long long r19 asm ("r19") = j;
1.1  mrg
1.1  mrg   r19 <<= 31;
1.1  mrg   r18 <<= 31;
1.1  mrg   do
1.1  mrg     if (r4 >= r19)
1.1  mrg       r0 |= r18, r4 -= r19;
1.1  mrg   while (r19 >>= 1, r18 >>= 1);
1.1  mrg
1.1  mrg   return r0;
1.1  mrg }
1.1  mrg */
1.1  mrg GLOBAL(udivsi3):
1.1  mrg 	pt/l	LOCAL(udivsi3_dontadd), tr2
1.1  mrg 	pt/l	LOCAL(udivsi3_loop), tr1
1.1  mrg 	ptabs/l	r18, tr0
1.1  mrg 	movi	0, r0
1.1  mrg 	movi	1, r18
1.1  mrg 	addz.l	r5, r63, r19
1.1  mrg 	addz.l	r4, r63, r4
1.1  mrg 	shlli	r19, 31, r19
1.1  mrg 	shlli	r18, 31, r18
1.1  mrg LOCAL(udivsi3_loop):
1.1  mrg 	bgtu	r19, r4, tr2
1.1  mrg 	or	r0, r18, r0
1.1  mrg 	sub	r4, r19, r4
1.1  mrg LOCAL(udivsi3_dontadd):
1.1  mrg 	shlri	r18, 1, r18
1.1  mrg 	shlri	r19, 1, r19
1.1  mrg 	bnei	r18, 0, tr1
1.1  mrg 	blink	tr0, r63
1.1  mrg #else
1.1  mrg GLOBAL(udivsi3):
1.1  mrg  // inputs: r4,r5
1.1  mrg  // clobbered: r18,r19,r20,r21,r22,r25,tr0
1.1  mrg  // result in r0.
1.1  mrg  addz.l r5,r63,r22
1.1  mrg  nsb r22,r0
1.1  mrg  shlld r22,r0,r25
1.1  mrg  shlri r25,48,r25
1.1  mrg  movi 0xffffffffffffbb0c,r20 // shift count eqiv 76
1.1  mrg  sub r20,r25,r21
1.1  mrg  mmulfx.w r21,r21,r19
1.1  mrg  mshflo.w r21,r63,r21
1.1  mrg  ptabs r18,tr0
1.1  mrg  mmulfx.w r25,r19,r19
1.1  mrg  sub r20,r0,r0
1.1  mrg  /* bubble */
1.1  mrg  msub.w r21,r19,r19
1.1  mrg  addi r19,-2,r21 /* It would be nice for scheduling to do this add to r21
1.1  mrg 		    before the msub.w, but we need a different value for
1.1  mrg 		    r19 to keep errors under control.  */
1.1  mrg  mulu.l r4,r21,r18
1.1  mrg  mmulfx.w r19,r19,r19
1.1  mrg  shlli r21,15,r21
1.1  mrg  shlrd r18,r0,r18
1.1  mrg  mulu.l r18,r22,r20
1.1  mrg  mmacnfx.wl r25,r19,r21
1.1  mrg  /* bubble */
1.1  mrg  sub r4,r20,r25
1.1  mrg
1.1  mrg  mulu.l r25,r21,r19
1.1  mrg  addi r0,14,r0
1.1  mrg  /* bubble */
1.1  mrg  shlrd r19,r0,r19
1.1  mrg  mulu.l r19,r22,r20
1.1  mrg  add r18,r19,r18
1.1  mrg  /* bubble */
1.1  mrg  sub.l r25,r20,r25
1.1  mrg
1.1  mrg  mulu.l r25,r21,r19
1.1  mrg  addz.l r25,r63,r25
1.1  mrg  sub r25,r22,r25
1.1  mrg  shlrd r19,r0,r19
1.1  mrg  mulu.l r19,r22,r20
1.1  mrg  addi r25,1,r25
1.1  mrg  add r18,r19,r18
1.1  mrg
1.1  mrg  cmpgt r25,r20,r25
1.1  mrg  add.l r18,r25,r0
1.1  mrg  blink tr0,r63
1.1  mrg #endif
1.1  mrg #elif __SHMEDIA__
1.1  mrg /* m5compact-nofpu - more emphasis on code size than on speed, but don't
1.1  mrg    ignore speed altogether - div1 needs 9 cycles, subc 7 and rotcl 4.
1.1  mrg    So use a short shmedia loop.  */
1.1  mrg  // clobbered: r20,r21,r25,tr0,tr1,tr2
1.1  mrg 	.mode	SHmedia
1.1  mrg 	.section	.text..SHmedia32,"ax"
1.1  mrg 	.align	2
1.1  mrg GLOBAL(udivsi3):
1.1  mrg  pt/l LOCAL(udivsi3_dontsub), tr0
1.1  mrg  pt/l LOCAL(udivsi3_loop), tr1
1.1  mrg  ptabs/l r18,tr2
1.1  mrg  shlli r5,32,r25
1.1  mrg  addi r25,-1,r21
1.1  mrg  addz.l r4,r63,r20
1.1  mrg LOCAL(udivsi3_loop):
1.1  mrg  shlli r20,1,r20
1.1  mrg  bgeu/u r21,r20,tr0
1.1  mrg  sub r20,r21,r20
1.1  mrg LOCAL(udivsi3_dontsub):
1.1  mrg  addi.l r25,-1,r25
1.1  mrg  bnei r25,-32,tr1
1.1  mrg  add.l r20,r63,r0
1.1  mrg  blink tr2,r63
1.1  mrg #else /* ! __SHMEDIA__ */
1.1  mrg LOCAL(div8):
1.1  mrg  div1 r5,r4
1.1  mrg LOCAL(div7):
1.1  mrg  div1 r5,r4; div1 r5,r4; div1 r5,r4
1.1  mrg  div1 r5,r4; div1 r5,r4; div1 r5,r4; rts; div1 r5,r4
1.1  mrg
1.1  mrg LOCAL(divx4):
1.1  mrg  div1 r5,r4; rotcl r0
1.1  mrg  div1 r5,r4; rotcl r0
1.1  mrg  div1 r5,r4; rotcl r0
1.1  mrg  rts; div1 r5,r4
1.1  mrg
1.1  mrg GLOBAL(udivsi3):
1.1  mrg  sts.l pr,@-r15
1.1  mrg  extu.w r5,r0
1.1  mrg  cmp/eq r5,r0
1.1  mrg #ifdef __sh1__
1.1  mrg  bf LOCAL(large_divisor)
1.1  mrg #else
1.1  mrg  bf/s LOCAL(large_divisor)
1.1  mrg #endif
1.1  mrg  div0u
1.1  mrg  swap.w r4,r0
1.1  mrg  shlr16 r4
1.1  mrg  bsr LOCAL(div8)
1.1  mrg  shll16 r5
1.1  mrg  bsr LOCAL(div7)
1.1  mrg  div1 r5,r4
1.1  mrg  xtrct r4,r0
1.1  mrg  xtrct r0,r4
1.1  mrg  bsr LOCAL(div8)
1.1  mrg  swap.w r4,r4
1.1  mrg  bsr LOCAL(div7)
1.1  mrg  div1 r5,r4
1.1  mrg  lds.l @r15+,pr
1.1  mrg  xtrct r4,r0
1.1  mrg  swap.w r0,r0
1.1  mrg  rotcl r0
1.1  mrg  rts
1.1  mrg  shlr16 r5
1.1  mrg
1.1  mrg LOCAL(large_divisor):
1.1  mrg #ifdef __sh1__
1.1  mrg  div0u
1.1  mrg #endif
1.1  mrg  mov #0,r0
1.1  mrg  xtrct r4,r0
1.1  mrg  xtrct r0,r4
1.1  mrg  bsr LOCAL(divx4)
1.1  mrg  rotcl r0
1.1  mrg  bsr LOCAL(divx4)
1.1  mrg  rotcl r0
1.1  mrg  bsr LOCAL(divx4)
1.1  mrg  rotcl r0
1.1  mrg  bsr LOCAL(divx4)
1.1  mrg  rotcl r0
1.1  mrg  lds.l @r15+,pr
1.1  mrg  rts
1.1  mrg  rotcl r0
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(udivsi3))
1.1  mrg #endif /* ! __SHMEDIA__ */
1.1  mrg #endif /* L_udivsi3 */
1.1  mrg
1.1  mrg #ifdef L_udivdi3
1.1  mrg #if __SHMEDIA__
1.1  mrg 	.mode	SHmedia
1.1  mrg 	.section	.text..SHmedia32,"ax"
1.1  mrg 	.align	2
1.1  mrg 	.global	GLOBAL(udivdi3)
1.1  mrg 	FUNC(GLOBAL(udivdi3))
1.1  mrg GLOBAL(udivdi3):
1.1  mrg 	HIDDEN_ALIAS(udivdi3_internal,udivdi3)
1.1  mrg 	shlri r3,1,r4
1.1  mrg 	nsb r4,r22
1.1  mrg 	shlld r3,r22,r6
1.1  mrg 	shlri r6,49,r5
1.1  mrg 	movi 0xffffffffffffbaf1,r21 /* .l shift count 17.  */
1.1  mrg 	sub r21,r5,r1
1.1  mrg 	mmulfx.w r1,r1,r4
1.1  mrg 	mshflo.w r1,r63,r1
1.1  mrg 	sub r63,r22,r20 // r63 == 64 % 64
1.1  mrg 	mmulfx.w r5,r4,r4
1.1  mrg 	pta LOCAL(large_divisor),tr0
1.1  mrg 	addi r20,32,r9
1.1  mrg 	msub.w r1,r4,r1
1.1  mrg 	madd.w r1,r1,r1
1.1  mrg 	mmulfx.w r1,r1,r4
1.1  mrg 	shlri r6,32,r7
1.1  mrg 	bgt/u r9,r63,tr0 // large_divisor
1.1  mrg 	mmulfx.w r5,r4,r4
1.1  mrg 	shlri r2,32+14,r19
1.1  mrg 	addi r22,-31,r0
1.1  mrg 	msub.w r1,r4,r1
1.1  mrg
1.1  mrg 	mulu.l r1,r7,r4
1.1  mrg 	addi r1,-3,r5
1.1  mrg 	mulu.l r5,r19,r5
1.1  mrg 	sub r63,r4,r4 // Negate to make sure r1 ends up <= 1/r2
1.1  mrg 	shlri r4,2,r4 /* chop off leading %0000000000000000 001.00000000000 - or, as
1.1  mrg 	                 the case may be, %0000000000000000 000.11111111111, still */
1.1  mrg 	muls.l r1,r4,r4 /* leaving at least one sign bit.  */
1.1  mrg 	mulu.l r5,r3,r8
1.1  mrg 	mshalds.l r1,r21,r1
1.1  mrg 	shari r4,26,r4
1.1  mrg 	shlld r8,r0,r8
1.1  mrg 	add r1,r4,r1 // 31 bit unsigned reciprocal now in r1 (msb equiv. 0.5)
1.1  mrg 	sub r2,r8,r2
1.1  mrg 	/* Can do second step of 64 : 32 div now, using r1 and the rest in r2.  */
1.1  mrg
1.1  mrg 	shlri r2,22,r21
1.1  mrg 	mulu.l r21,r1,r21
1.1  mrg 	shlld r5,r0,r8
1.1  mrg 	addi r20,30-22,r0
1.1  mrg 	shlrd r21,r0,r21
1.1  mrg 	mulu.l r21,r3,r5
1.1  mrg 	add r8,r21,r8
1.1  mrg 	mcmpgt.l r21,r63,r21 // See Note 1
1.1  mrg 	addi r20,30,r0
1.1  mrg 	mshfhi.l r63,r21,r21
1.1  mrg 	sub r2,r5,r2
1.1  mrg 	andc r2,r21,r2
1.1  mrg
1.1  mrg 	/* small divisor: need a third divide step */
1.1  mrg 	mulu.l r2,r1,r7
1.1  mrg 	ptabs r18,tr0
1.1  mrg 	addi r2,1,r2
1.1  mrg 	shlrd r7,r0,r7
1.1  mrg 	mulu.l r7,r3,r5
1.1  mrg 	add r8,r7,r8
1.1  mrg 	sub r2,r3,r2
1.1  mrg 	cmpgt r2,r5,r5
1.1  mrg 	add r8,r5,r2
1.1  mrg 	/* could test r3 here to check for divide by zero.  */
1.1  mrg 	blink tr0,r63
1.1  mrg
1.1  mrg LOCAL(large_divisor):
1.1  mrg 	mmulfx.w r5,r4,r4
1.1  mrg 	shlrd r2,r9,r25
1.1  mrg 	shlri r25,32,r8
1.1  mrg 	msub.w r1,r4,r1
1.1  mrg
1.1  mrg 	mulu.l r1,r7,r4
1.1  mrg 	addi r1,-3,r5
1.1  mrg 	mulu.l r5,r8,r5
1.1  mrg 	sub r63,r4,r4 // Negate to make sure r1 ends up <= 1/r2
1.1  mrg 	shlri r4,2,r4 /* chop off leading %0000000000000000 001.00000000000 - or, as
1.1  mrg 	                 the case may be, %0000000000000000 000.11111111111, still */
1.1  mrg 	muls.l r1,r4,r4 /* leaving at least one sign bit.  */
1.1  mrg 	shlri r5,14-1,r8
1.1  mrg 	mulu.l r8,r7,r5
1.1  mrg 	mshalds.l r1,r21,r1
1.1  mrg 	shari r4,26,r4
1.1  mrg 	add r1,r4,r1 // 31 bit unsigned reciprocal now in r1 (msb equiv. 0.5)
1.1  mrg 	sub r25,r5,r25
1.1  mrg 	/* Can do second step of 64 : 32 div now, using r1 and the rest in r25.  */
1.1  mrg
1.1  mrg 	shlri r25,22,r21
1.1  mrg 	mulu.l r21,r1,r21
1.1  mrg 	pta LOCAL(no_lo_adj),tr0
1.1  mrg 	addi r22,32,r0
1.1  mrg 	shlri r21,40,r21
1.1  mrg 	mulu.l r21,r7,r5
1.1  mrg 	add r8,r21,r8
1.1  mrg 	shlld r2,r0,r2
1.1  mrg 	sub r25,r5,r25
1.1  mrg 	bgtu/u r7,r25,tr0 // no_lo_adj
1.1  mrg 	addi r8,1,r8
1.1  mrg 	sub r25,r7,r25
1.1  mrg LOCAL(no_lo_adj):
1.1  mrg 	mextr4 r2,r25,r2
1.1  mrg
1.1  mrg 	/* large_divisor: only needs a few adjustments.  */
1.1  mrg 	mulu.l r8,r6,r5
1.1  mrg 	ptabs r18,tr0
1.1  mrg 	/* bubble */
1.1  mrg 	cmpgtu r5,r2,r5
1.1  mrg 	sub r8,r5,r2
1.1  mrg 	blink tr0,r63
1.1  mrg 	ENDFUNC(GLOBAL(udivdi3))
1.1  mrg /* Note 1: To shift the result of the second divide stage so that the result
1.1  mrg    always fits into 32 bits, yet we still reduce the rest sufficiently
1.1  mrg    would require a lot of instructions to do the shifts just right.  Using
1.1  mrg    the full 64 bit shift result to multiply with the divisor would require
1.1  mrg    four extra instructions for the upper 32 bits (shift / mulu / shift / sub).
1.1  mrg    Fortunately, if the upper 32 bits of the shift result are nonzero, we
1.1  mrg    know that the rest after taking this partial result into account will
1.1  mrg    fit into 32 bits.  So we just clear the upper 32 bits of the rest if the
1.1  mrg    upper 32 bits of the partial result are nonzero.  */
1.1  mrg #endif /* __SHMEDIA__ */
1.1  mrg #endif /* L_udivdi3 */
1.1  mrg
1.1  mrg #ifdef L_divdi3
1.1  mrg #if __SHMEDIA__
1.1  mrg 	.mode	SHmedia
1.1  mrg 	.section	.text..SHmedia32,"ax"
1.1  mrg 	.align	2
1.1  mrg 	.global	GLOBAL(divdi3)
1.1  mrg 	FUNC(GLOBAL(divdi3))
1.1  mrg GLOBAL(divdi3):
1.1  mrg 	pta GLOBAL(udivdi3_internal),tr0
1.1  mrg 	shari r2,63,r22
1.1  mrg 	shari r3,63,r23
1.1  mrg 	xor r2,r22,r2
1.1  mrg 	xor r3,r23,r3
1.1  mrg 	sub r2,r22,r2
1.1  mrg 	sub r3,r23,r3
1.1  mrg 	beq/u r22,r23,tr0
1.1  mrg 	ptabs r18,tr1
1.1  mrg 	blink tr0,r18
1.1  mrg 	sub r63,r2,r2
1.1  mrg 	blink tr1,r63
1.1  mrg 	ENDFUNC(GLOBAL(divdi3))
1.1  mrg #endif /* __SHMEDIA__ */
1.1  mrg #endif /* L_divdi3 */
1.1  mrg
1.1  mrg #ifdef L_umoddi3
1.1  mrg #if __SHMEDIA__
1.1  mrg 	.mode	SHmedia
1.1  mrg 	.section	.text..SHmedia32,"ax"
1.1  mrg 	.align	2
1.1  mrg 	.global	GLOBAL(umoddi3)
1.1  mrg 	FUNC(GLOBAL(umoddi3))
1.1  mrg GLOBAL(umoddi3):
1.1  mrg 	HIDDEN_ALIAS(umoddi3_internal,umoddi3)
1.1  mrg 	shlri r3,1,r4
1.1  mrg 	nsb r4,r22
1.1  mrg 	shlld r3,r22,r6
1.1  mrg 	shlri r6,49,r5
1.1  mrg 	movi 0xffffffffffffbaf1,r21 /* .l shift count 17.  */
1.1  mrg 	sub r21,r5,r1
1.1  mrg 	mmulfx.w r1,r1,r4
1.1  mrg 	mshflo.w r1,r63,r1
1.1  mrg 	sub r63,r22,r20 // r63 == 64 % 64
1.1  mrg 	mmulfx.w r5,r4,r4
1.1  mrg 	pta LOCAL(large_divisor),tr0
1.1  mrg 	addi r20,32,r9
1.1  mrg 	msub.w r1,r4,r1
1.1  mrg 	madd.w r1,r1,r1
1.1  mrg 	mmulfx.w r1,r1,r4
1.1  mrg 	shlri r6,32,r7
1.1  mrg 	bgt/u r9,r63,tr0 // large_divisor
1.1  mrg 	mmulfx.w r5,r4,r4
1.1  mrg 	shlri r2,32+14,r19
1.1  mrg 	addi r22,-31,r0
1.1  mrg 	msub.w r1,r4,r1
1.1  mrg
1.1  mrg 	mulu.l r1,r7,r4
1.1  mrg 	addi r1,-3,r5
1.1  mrg 	mulu.l r5,r19,r5
1.1  mrg 	sub r63,r4,r4 // Negate to make sure r1 ends up <= 1/r2
1.1  mrg 	shlri r4,2,r4 /* chop off leading %0000000000000000 001.00000000000 - or, as
1.1  mrg 	                 the case may be, %0000000000000000 000.11111111111, still */
1.1  mrg 	muls.l r1,r4,r4 /* leaving at least one sign bit.  */
1.1  mrg 	mulu.l r5,r3,r5
1.1  mrg 	mshalds.l r1,r21,r1
1.1  mrg 	shari r4,26,r4
1.1  mrg 	shlld r5,r0,r5
1.1  mrg 	add r1,r4,r1 // 31 bit unsigned reciprocal now in r1 (msb equiv. 0.5)
1.1  mrg 	sub r2,r5,r2
1.1  mrg 	/* Can do second step of 64 : 32 div now, using r1 and the rest in r2.  */
1.1  mrg
1.1  mrg 	shlri r2,22,r21
1.1  mrg 	mulu.l r21,r1,r21
1.1  mrg 	addi r20,30-22,r0
1.1  mrg 	/* bubble */ /* could test r3 here to check for divide by zero.  */
1.1  mrg 	shlrd r21,r0,r21
1.1  mrg 	mulu.l r21,r3,r5
1.1  mrg 	mcmpgt.l r21,r63,r21 // See Note 1
1.1  mrg 	addi r20,30,r0
1.1  mrg 	mshfhi.l r63,r21,r21
1.1  mrg 	sub r2,r5,r2
1.1  mrg 	andc r2,r21,r2
1.1  mrg
1.1  mrg 	/* small divisor: need a third divide step */
1.1  mrg 	mulu.l r2,r1,r7
1.1  mrg 	ptabs r18,tr0
1.1  mrg 	sub r2,r3,r8 /* re-use r8 here for rest - r3 */
1.1  mrg 	shlrd r7,r0,r7
1.1  mrg 	mulu.l r7,r3,r5
1.1  mrg 	/* bubble */
1.1  mrg 	addi r8,1,r7
1.1  mrg 	cmpgt r7,r5,r7
1.1  mrg 	cmvne r7,r8,r2
1.1  mrg 	sub r2,r5,r2
1.1  mrg 	blink tr0,r63
1.1  mrg
1.1  mrg LOCAL(large_divisor):
1.1  mrg 	mmulfx.w r5,r4,r4
1.1  mrg 	shlrd r2,r9,r25
1.1  mrg 	shlri r25,32,r8
1.1  mrg 	msub.w r1,r4,r1
1.1  mrg
1.1  mrg 	mulu.l r1,r7,r4
1.1  mrg 	addi r1,-3,r5
1.1  mrg 	mulu.l r5,r8,r5
1.1  mrg 	sub r63,r4,r4 // Negate to make sure r1 ends up <= 1/r2
1.1  mrg 	shlri r4,2,r4 /* chop off leading %0000000000000000 001.00000000000 - or, as
1.1  mrg 	                 the case may be, %0000000000000000 000.11111111111, still */
1.1  mrg 	muls.l r1,r4,r4 /* leaving at least one sign bit.  */
1.1  mrg 	shlri r5,14-1,r8
1.1  mrg 	mulu.l r8,r7,r5
1.1  mrg 	mshalds.l r1,r21,r1
1.1  mrg 	shari r4,26,r4
1.1  mrg 	add r1,r4,r1 // 31 bit unsigned reciprocal now in r1 (msb equiv. 0.5)
1.1  mrg 	sub r25,r5,r25
1.1  mrg 	/* Can do second step of 64 : 32 div now, using r1 and the rest in r25.  */
1.1  mrg
1.1  mrg 	shlri r25,22,r21
1.1  mrg 	mulu.l r21,r1,r21
1.1  mrg 	pta LOCAL(no_lo_adj),tr0
1.1  mrg 	addi r22,32,r0
1.1  mrg 	shlri r21,40,r21
1.1  mrg 	mulu.l r21,r7,r5
1.1  mrg 	add r8,r21,r8
1.1  mrg 	shlld r2,r0,r2
1.1  mrg 	sub r25,r5,r25
1.1  mrg 	bgtu/u r7,r25,tr0 // no_lo_adj
1.1  mrg 	addi r8,1,r8
1.1  mrg 	sub r25,r7,r25
1.1  mrg LOCAL(no_lo_adj):
1.1  mrg 	mextr4 r2,r25,r2
1.1  mrg
1.1  mrg 	/* large_divisor: only needs a few adjustments.  */
1.1  mrg 	mulu.l r8,r6,r5
1.1  mrg 	ptabs r18,tr0
1.1  mrg 	add r2,r6,r7
1.1  mrg 	cmpgtu r5,r2,r8
1.1  mrg 	cmvne r8,r7,r2
1.1  mrg 	sub r2,r5,r2
1.1  mrg 	shlrd r2,r22,r2
1.1  mrg 	blink tr0,r63
1.1  mrg 	ENDFUNC(GLOBAL(umoddi3))
1.1  mrg /* Note 1: To shift the result of the second divide stage so that the result
1.1  mrg    always fits into 32 bits, yet we still reduce the rest sufficiently
1.1  mrg    would require a lot of instructions to do the shifts just right.  Using
1.1  mrg    the full 64 bit shift result to multiply with the divisor would require
1.1  mrg    four extra instructions for the upper 32 bits (shift / mulu / shift / sub).
1.1  mrg    Fortunately, if the upper 32 bits of the shift result are nonzero, we
1.1  mrg    know that the rest after taking this partial result into account will
1.1  mrg    fit into 32 bits.  So we just clear the upper 32 bits of the rest if the
1.1  mrg    upper 32 bits of the partial result are nonzero.  */
1.1  mrg #endif /* __SHMEDIA__ */
1.1  mrg #endif /* L_umoddi3 */
1.1  mrg
1.1  mrg #ifdef L_moddi3
1.1  mrg #if __SHMEDIA__
1.1  mrg 	.mode	SHmedia
1.1  mrg 	.section	.text..SHmedia32,"ax"
1.1  mrg 	.align	2
1.1  mrg 	.global	GLOBAL(moddi3)
1.1  mrg 	FUNC(GLOBAL(moddi3))
1.1  mrg GLOBAL(moddi3):
1.1  mrg 	pta GLOBAL(umoddi3_internal),tr0
1.1  mrg 	shari r2,63,r22
1.1  mrg 	shari r3,63,r23
1.1  mrg 	xor r2,r22,r2
1.1  mrg 	xor r3,r23,r3
1.1  mrg 	sub r2,r22,r2
1.1  mrg 	sub r3,r23,r3
1.1  mrg 	beq/u r22,r63,tr0
1.1  mrg 	ptabs r18,tr1
1.1  mrg 	blink tr0,r18
1.1  mrg 	sub r63,r2,r2
1.1  mrg 	blink tr1,r63
1.1  mrg 	ENDFUNC(GLOBAL(moddi3))
1.1  mrg #endif /* __SHMEDIA__ */
1.1  mrg #endif /* L_moddi3 */
1.1  mrg
1.1  mrg #ifdef L_set_fpscr
1.1  mrg #if !defined (__SH2A_NOFPU__)
1.1  mrg #if defined (__SH2E__) || defined (__SH2A__) || defined (__SH3E__) || defined(__SH4_SINGLE__) || defined(__SH4__) || defined(__SH4_SINGLE_ONLY__) || __SH5__ == 32
1.1  mrg #ifdef __SH5__
1.1  mrg 	.mode	SHcompact
1.1  mrg #endif
1.1  mrg 	.global GLOBAL(set_fpscr)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(set_fpscr))
1.1  mrg GLOBAL(set_fpscr):
1.1  mrg 	lds r4,fpscr
1.1  mrg #ifdef __PIC__
1.1  mrg 	mov.l	r12,@-r15
1.1  mrg #ifdef __vxworks
1.1  mrg 	mov.l	LOCAL(set_fpscr_L0_base),r12
1.1  mrg 	mov.l	LOCAL(set_fpscr_L0_index),r0
1.1  mrg 	mov.l	@r12,r12
1.1  mrg 	mov.l	@(r0,r12),r12
1.1  mrg #else
1.1  mrg 	mova	LOCAL(set_fpscr_L0),r0
1.1  mrg 	mov.l	LOCAL(set_fpscr_L0),r12
1.1  mrg 	add	r0,r12
1.1  mrg #endif
1.1  mrg 	mov.l	LOCAL(set_fpscr_L1),r0
1.1  mrg 	mov.l	@(r0,r12),r1
1.1  mrg 	mov.l	@r15+,r12
1.1  mrg #else
1.1  mrg 	mov.l LOCAL(set_fpscr_L1),r1
1.1  mrg #endif
1.1  mrg 	swap.w r4,r0
1.1  mrg 	or #24,r0
1.1  mrg #ifndef FMOVD_WORKS
1.1  mrg 	xor #16,r0
1.1  mrg #endif
1.1  mrg #if defined(__SH4__) || defined (__SH2A_DOUBLE__)
1.1  mrg 	swap.w r0,r3
1.1  mrg 	mov.l r3,@(4,r1)
1.1  mrg #else /* defined (__SH2E__) || defined(__SH3E__) || defined(__SH4_SINGLE*__) */
1.1  mrg 	swap.w r0,r2
1.1  mrg 	mov.l r2,@r1
1.1  mrg #endif
1.1  mrg #ifndef FMOVD_WORKS
1.1  mrg 	xor #8,r0
1.1  mrg #else
1.1  mrg 	xor #24,r0
1.1  mrg #endif
1.1  mrg #if defined(__SH4__) || defined (__SH2A_DOUBLE__)
1.1  mrg 	swap.w r0,r2
1.1  mrg 	rts
1.1  mrg 	mov.l r2,@r1
1.1  mrg #else /* defined(__SH2E__) || defined(__SH3E__) || defined(__SH4_SINGLE*__) */
1.1  mrg 	swap.w r0,r3
1.1  mrg 	rts
1.1  mrg 	mov.l r3,@(4,r1)
1.1  mrg #endif
1.1  mrg 	.align 2
1.1  mrg #ifdef __PIC__
1.1  mrg #ifdef __vxworks
1.1  mrg LOCAL(set_fpscr_L0_base):
1.1  mrg 	.long ___GOTT_BASE__
1.1  mrg LOCAL(set_fpscr_L0_index):
1.1  mrg 	.long ___GOTT_INDEX__
1.1  mrg #else
1.1  mrg LOCAL(set_fpscr_L0):
1.1  mrg 	.long _GLOBAL_OFFSET_TABLE_
1.1  mrg #endif
1.1  mrg LOCAL(set_fpscr_L1):
1.1  mrg 	.long GLOBAL(fpscr_values@GOT)
1.1  mrg #else
1.1  mrg LOCAL(set_fpscr_L1):
1.1  mrg 	.long GLOBAL(fpscr_values)
1.1  mrg #endif
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(set_fpscr))
1.1  mrg #ifndef NO_FPSCR_VALUES
1.1  mrg #ifdef __ELF__
1.1  mrg         .comm   GLOBAL(fpscr_values),8,4
1.1  mrg #else
1.1  mrg         .comm   GLOBAL(fpscr_values),8
1.1  mrg #endif /* ELF */
1.1  mrg #endif /* NO_FPSCR_VALUES */
1.1  mrg #endif /* SH2E / SH3E / SH4 */
1.1  mrg #endif /* __SH2A_NOFPU__ */
1.1  mrg #endif /* L_set_fpscr */
1.1  mrg #ifdef L_ic_invalidate
1.1  mrg #if __SH5__ == 32
1.1  mrg 	.mode	SHmedia
1.1  mrg 	.section	.text..SHmedia32,"ax"
1.1  mrg 	.align	2
1.1  mrg 	.global	GLOBAL(init_trampoline)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(init_trampoline))
1.1  mrg GLOBAL(init_trampoline):
1.1  mrg 	st.l	r0,8,r2
1.1  mrg #ifdef __LITTLE_ENDIAN__
1.1  mrg 	movi	9,r20
1.1  mrg 	shori	0x402b,r20
1.1  mrg 	shori	0xd101,r20
1.1  mrg 	shori	0xd002,r20
1.1  mrg #else
1.1  mrg 	movi	0xffffffffffffd002,r20
1.1  mrg 	shori	0xd101,r20
1.1  mrg 	shori	0x402b,r20
1.1  mrg 	shori	9,r20
1.1  mrg #endif
1.1  mrg 	st.q	r0,0,r20
1.1  mrg 	st.l	r0,12,r3
1.1  mrg 	ENDFUNC(GLOBAL(init_trampoline))
1.1  mrg 	.global	GLOBAL(ic_invalidate)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ic_invalidate))
1.1  mrg GLOBAL(ic_invalidate):
1.1  mrg 	ocbwb	r0,0
1.1  mrg 	synco
1.1  mrg 	icbi	r0, 0
1.1  mrg 	ptabs	r18, tr0
1.1  mrg 	synci
1.1  mrg 	blink	tr0, r63
1.1  mrg 	ENDFUNC(GLOBAL(ic_invalidate))
1.1  mrg #elif defined(__SH4A__)
1.1  mrg 	.global GLOBAL(ic_invalidate)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ic_invalidate))
1.1  mrg GLOBAL(ic_invalidate):
1.1  mrg 	ocbwb	@r4
1.1  mrg 	synco
1.1  mrg 	icbi	@r4
1.1  mrg 	rts
1.1  mrg 	  nop
1.1  mrg 	ENDFUNC(GLOBAL(ic_invalidate))
1.1  mrg #elif defined(__SH4_SINGLE__) || defined(__SH4__) || defined(__SH4_SINGLE_ONLY__) || (defined(__SH4_NOFPU__) && !defined(__SH5__))
1.1  mrg 	/* For system code, we use ic_invalidate_line_i, but user code
1.1  mrg 	   needs a different mechanism.  A kernel call is generally not
1.1  mrg 	   available, and it would also be slow.  Different SH4 variants use
1.1  mrg 	   different sizes and associativities of the Icache.  We use a small
1.1  mrg 	   bit of dispatch code that can be put hidden in every shared object,
1.1  mrg 	   which calls the actual processor-specific invalidation code in a
1.1  mrg 	   separate module.
1.1  mrg 	   Or if you have operating system support, the OS could mmap the
1.1  mrg 	   procesor-specific code from a single page, since it is highly
1.1  mrg 	   repetitive.  */
1.1  mrg 	.global GLOBAL(ic_invalidate)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(ic_invalidate))
1.1  mrg GLOBAL(ic_invalidate):
1.1  mrg #ifdef __pic__
1.1  mrg #ifdef __vxworks
1.1  mrg 	mov.l	1f,r1
1.1  mrg 	mov.l	2f,r0
1.1  mrg 	mov.l	@r1,r1
1.1  mrg 	mov.l	0f,r2
1.1  mrg 	mov.l	@(r0,r1),r0
1.1  mrg #else
1.1  mrg 	mov.l	1f,r1
1.1  mrg 	mova	1f,r0
1.1  mrg 	mov.l	0f,r2
1.1  mrg 	add	r1,r0
1.1  mrg #endif
1.1  mrg 	mov.l	@(r0,r2),r1
1.1  mrg #else
1.1  mrg 	mov.l	0f,r1
1.1  mrg #endif
1.1  mrg 	ocbwb	@r4
1.1  mrg 	mov.l	@(8,r1),r0
1.1  mrg 	sub	r1,r4
1.1  mrg 	and	r4,r0
1.1  mrg 	add	r1,r0
1.1  mrg 	jmp	@r0
1.1  mrg 	mov.l	@(4,r1),r0
1.1  mrg 	.align	2
1.1  mrg #ifndef __pic__
1.1  mrg 0:	.long   GLOBAL(ic_invalidate_array)
1.1  mrg #else /* __pic__ */
1.1  mrg 	.global GLOBAL(ic_invalidate_array)
1.1  mrg 0:	.long   GLOBAL(ic_invalidate_array)@GOT
1.1  mrg #ifdef __vxworks
1.1  mrg 1:	.long	___GOTT_BASE__
1.1  mrg 2:	.long	___GOTT_INDEX__
1.1  mrg #else
1.1  mrg 1:	.long   _GLOBAL_OFFSET_TABLE_
1.1  mrg #endif
1.1  mrg 	ENDFUNC(GLOBAL(ic_invalidate))
1.1  mrg #endif /* __pic__ */
1.1  mrg #endif /* SH4 */
1.1  mrg #endif /* L_ic_invalidate */
1.1  mrg
1.1  mrg #ifdef L_ic_invalidate_array
1.1  mrg #if defined(__SH4A__) || (defined (__FORCE_SH4A__) && (defined(__SH4_SINGLE__) || defined(__SH4__) || defined(__SH4_SINGLE_ONLY__) || (defined(__SH4_NOFPU__) && !defined(__SH5__))))
1.1  mrg 	.global GLOBAL(ic_invalidate_array)
1.1  mrg 	/* This is needed when an SH4 dso with trampolines is used on SH4A.  */
1.1  mrg 	.global GLOBAL(ic_invalidate_array)
1.1  mrg 	FUNC(GLOBAL(ic_invalidate_array))
1.1  mrg GLOBAL(ic_invalidate_array):
1.1  mrg 	add	r1,r4
1.1  mrg 	synco
1.1  mrg 	icbi	@r4
1.1  mrg 	rts
1.1  mrg 	  nop
1.1  mrg 	.align 2
1.1  mrg 	.long	0
1.1  mrg 	ENDFUNC(GLOBAL(ic_invalidate_array))
1.1  mrg #elif defined(__SH4_SINGLE__) || defined(__SH4__) || defined(__SH4_SINGLE_ONLY__) || (defined(__SH4_NOFPU__) && !defined(__SH5__))
1.1  mrg 	.global GLOBAL(ic_invalidate_array)
1.1  mrg 	.p2align 5
1.1  mrg 	FUNC(GLOBAL(ic_invalidate_array))
1.1  mrg /* This must be aligned to the beginning of a cache line.  */
1.1  mrg GLOBAL(ic_invalidate_array):
1.1  mrg #ifndef WAYS
1.1  mrg #define WAYS 4
1.1  mrg #define WAY_SIZE 0x4000
1.1  mrg #endif
1.1  mrg #if WAYS == 1
1.1  mrg 	.rept	WAY_SIZE * WAYS / 32
1.1  mrg 	rts
1.1  mrg 	nop
1.1  mrg 	.rept	7
1.1  mrg 	.long	WAY_SIZE - 32
1.1  mrg 	.endr
1.1  mrg 	.endr
1.1  mrg #elif WAYS <= 6
1.1  mrg 	.rept	WAY_SIZE * WAYS / 32
1.1  mrg 	braf	r0
1.1  mrg 	add	#-8,r0
1.1  mrg 	.long	WAY_SIZE + 8
1.1  mrg 	.long	WAY_SIZE - 32
1.1  mrg 	.rept	WAYS-2
1.1  mrg 	braf	r0
1.1  mrg 	nop
1.1  mrg 	.endr
1.1  mrg 	.rept	7 - WAYS
1.1  mrg 	rts
1.1  mrg 	nop
1.1  mrg 	.endr
1.1  mrg 	.endr
1.1  mrg #else /* WAYS > 6 */
1.1  mrg 	/* This variant needs two different pages for mmap-ing.  */
1.1  mrg  	.rept	WAYS-1
1.1  mrg 	.rept	WAY_SIZE / 32
1.1  mrg 	braf	r0
1.1  mrg 	nop
1.1  mrg 	.long	WAY_SIZE
1.1  mrg 	.rept 6
1.1  mrg 	.long	WAY_SIZE - 32
1.1  mrg 	.endr
1.1  mrg 	.endr
1.1  mrg 	.endr
1.1  mrg 	.rept	WAY_SIZE / 32
1.1  mrg 	rts
1.1  mrg 	.rept	15
1.1  mrg 	nop
1.1  mrg 	.endr
1.1  mrg 	.endr
1.1  mrg #endif /* WAYS */
1.1  mrg 	ENDFUNC(GLOBAL(ic_invalidate_array))
1.1  mrg #endif /* SH4 */
1.1  mrg #endif /* L_ic_invalidate_array */
1.1  mrg
1.1  mrg #if defined (__SH5__) && __SH5__ == 32
1.1  mrg #ifdef L_shcompact_call_trampoline
1.1  mrg 	.section	.rodata
1.1  mrg 	.align	1
1.1  mrg LOCAL(ct_main_table):
1.1  mrg .word	LOCAL(ct_r2_fp) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r2_ld) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r2_pop) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r3_fp) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r3_ld) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r3_pop) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r4_fp) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r4_ld) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r4_pop) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r5_fp) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r5_ld) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r5_pop) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r6_fph) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r6_fpl) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r6_ld) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r6_pop) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r7_fph) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r7_fpl) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r7_ld) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r7_pop) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r8_fph) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r8_fpl) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r8_ld) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r8_pop) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r9_fph) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r9_fpl) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r9_ld) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r9_pop) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_pop_seq) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_pop_seq) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_r9_pop) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_ret_wide) - datalabel LOCAL(ct_main_label)
1.1  mrg .word	LOCAL(ct_call_func) - datalabel LOCAL(ct_main_label)
1.1  mrg 	.mode	SHmedia
1.1  mrg 	.section	.text..SHmedia32, "ax"
1.1  mrg 	.align	2
1.1  mrg
1.1  mrg      /* This function loads 64-bit general-purpose registers from the
1.1  mrg 	stack, from a memory address contained in them or from an FP
1.1  mrg 	register, according to a cookie passed in r1.  Its execution
1.1  mrg 	time is linear on the number of registers that actually have
1.1  mrg 	to be copied.  See sh.h for details on the actual bit pattern.
1.1  mrg
1.1  mrg 	The function to be called is passed in r0.  If a 32-bit return
1.1  mrg 	value is expected, the actual function will be tail-called,
1.1  mrg 	otherwise the return address will be stored in r10 (that the
1.1  mrg 	caller should expect to be clobbered) and the return value
1.1  mrg 	will be expanded into r2/r3 upon return.  */
1.1  mrg
1.1  mrg 	.global	GLOBAL(GCC_shcompact_call_trampoline)
1.1  mrg 	FUNC(GLOBAL(GCC_shcompact_call_trampoline))
1.1  mrg GLOBAL(GCC_shcompact_call_trampoline):
1.1  mrg 	ptabs/l	r0, tr0	/* Prepare to call the actual function.  */
1.1  mrg 	movi	((datalabel LOCAL(ct_main_table) - 31 * 2) >> 16) & 65535, r0
1.1  mrg 	pt/l	LOCAL(ct_loop), tr1
1.1  mrg 	addz.l	r1, r63, r1
1.1  mrg 	shori	((datalabel LOCAL(ct_main_table) - 31 * 2)) & 65535, r0
1.1  mrg LOCAL(ct_loop):
1.1  mrg 	nsb	r1, r28
1.1  mrg 	shlli	r28, 1, r29
1.1  mrg 	ldx.w	r0, r29, r30
1.1  mrg LOCAL(ct_main_label):
1.1  mrg 	ptrel/l	r30, tr2
1.1  mrg 	blink	tr2, r63
1.1  mrg LOCAL(ct_r2_fp):	/* Copy r2 from an FP register.  */
1.1  mrg 	/* It must be dr0, so just do it.  */
1.1  mrg 	fmov.dq	dr0, r2
1.1  mrg 	movi	7, r30
1.1  mrg 	shlli	r30, 29, r31
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r3_fp):	/* Copy r3 from an FP register.  */
1.1  mrg 	/* It is either dr0 or dr2.  */
1.1  mrg 	movi	7, r30
1.1  mrg 	shlri	r1, 26, r32
1.1  mrg 	shlli	r30, 26, r31
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	fmov.dq	dr0, r3
1.1  mrg 	beqi/l	r32, 4, tr1
1.1  mrg 	fmov.dq	dr2, r3
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r4_fp):	/* Copy r4 from an FP register.  */
1.1  mrg 	shlri	r1, 23 - 3, r34
1.1  mrg 	andi	r34, 3 << 3, r33
1.1  mrg 	addi	r33, LOCAL(ct_r4_fp_copy) - datalabel LOCAL(ct_r4_fp_base), r32
1.1  mrg LOCAL(ct_r4_fp_base):
1.1  mrg 	ptrel/l	r32, tr2
1.1  mrg 	movi	7, r30
1.1  mrg 	shlli	r30, 23, r31
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	blink	tr2, r63
1.1  mrg LOCAL(ct_r4_fp_copy):
1.1  mrg 	fmov.dq	dr0, r4
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr2, r4
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr4, r4
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r5_fp):	/* Copy r5 from an FP register.  */
1.1  mrg 	shlri	r1, 20 - 3, r34
1.1  mrg 	andi	r34, 3 << 3, r33
1.1  mrg 	addi	r33, LOCAL(ct_r5_fp_copy) - datalabel LOCAL(ct_r5_fp_base), r32
1.1  mrg LOCAL(ct_r5_fp_base):
1.1  mrg 	ptrel/l	r32, tr2
1.1  mrg 	movi	7, r30
1.1  mrg 	shlli	r30, 20, r31
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	blink	tr2, r63
1.1  mrg LOCAL(ct_r5_fp_copy):
1.1  mrg 	fmov.dq	dr0, r5
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr2, r5
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr4, r5
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr6, r5
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r6_fph):	/* Copy r6 from a high FP register.  */
1.1  mrg 	/* It must be dr8.  */
1.1  mrg 	fmov.dq	dr8, r6
1.1  mrg 	movi	15, r30
1.1  mrg 	shlli	r30, 16, r31
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r6_fpl):	/* Copy r6 from a low FP register.  */
1.1  mrg 	shlri	r1, 16 - 3, r34
1.1  mrg 	andi	r34, 3 << 3, r33
1.1  mrg 	addi	r33, LOCAL(ct_r6_fp_copy) - datalabel LOCAL(ct_r6_fp_base), r32
1.1  mrg LOCAL(ct_r6_fp_base):
1.1  mrg 	ptrel/l	r32, tr2
1.1  mrg 	movi	7, r30
1.1  mrg 	shlli	r30, 16, r31
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	blink	tr2, r63
1.1  mrg LOCAL(ct_r6_fp_copy):
1.1  mrg 	fmov.dq	dr0, r6
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr2, r6
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr4, r6
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr6, r6
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r7_fph):	/* Copy r7 from a high FP register.  */
1.1  mrg 	/* It is either dr8 or dr10.  */
1.1  mrg 	movi	15 << 12, r31
1.1  mrg 	shlri	r1, 12, r32
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	fmov.dq	dr8, r7
1.1  mrg 	beqi/l	r32, 8, tr1
1.1  mrg 	fmov.dq	dr10, r7
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r7_fpl):	/* Copy r7 from a low FP register.  */
1.1  mrg 	shlri	r1, 12 - 3, r34
1.1  mrg 	andi	r34, 3 << 3, r33
1.1  mrg 	addi	r33, LOCAL(ct_r7_fp_copy) - datalabel LOCAL(ct_r7_fp_base), r32
1.1  mrg LOCAL(ct_r7_fp_base):
1.1  mrg 	ptrel/l	r32, tr2
1.1  mrg 	movi	7 << 12, r31
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	blink	tr2, r63
1.1  mrg LOCAL(ct_r7_fp_copy):
1.1  mrg 	fmov.dq	dr0, r7
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr2, r7
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr4, r7
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr6, r7
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r8_fph):	/* Copy r8 from a high FP register.  */
1.1  mrg 	/* It is either dr8 or dr10.  */
1.1  mrg 	movi	15 << 8, r31
1.1  mrg 	andi	r1, 1 << 8, r32
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	fmov.dq	dr8, r8
1.1  mrg 	beq/l	r32, r63, tr1
1.1  mrg 	fmov.dq	dr10, r8
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r8_fpl):	/* Copy r8 from a low FP register.  */
1.1  mrg 	shlri	r1, 8 - 3, r34
1.1  mrg 	andi	r34, 3 << 3, r33
1.1  mrg 	addi	r33, LOCAL(ct_r8_fp_copy) - datalabel LOCAL(ct_r8_fp_base), r32
1.1  mrg LOCAL(ct_r8_fp_base):
1.1  mrg 	ptrel/l	r32, tr2
1.1  mrg 	movi	7 << 8, r31
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	blink	tr2, r63
1.1  mrg LOCAL(ct_r8_fp_copy):
1.1  mrg 	fmov.dq	dr0, r8
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr2, r8
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr4, r8
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr6, r8
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r9_fph):	/* Copy r9 from a high FP register.  */
1.1  mrg 	/* It is either dr8 or dr10.  */
1.1  mrg 	movi	15 << 4, r31
1.1  mrg 	andi	r1, 1 << 4, r32
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	fmov.dq	dr8, r9
1.1  mrg 	beq/l	r32, r63, tr1
1.1  mrg 	fmov.dq	dr10, r9
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r9_fpl):	/* Copy r9 from a low FP register.  */
1.1  mrg 	shlri	r1, 4 - 3, r34
1.1  mrg 	andi	r34, 3 << 3, r33
1.1  mrg 	addi	r33, LOCAL(ct_r9_fp_copy) - datalabel LOCAL(ct_r9_fp_base), r32
1.1  mrg LOCAL(ct_r9_fp_base):
1.1  mrg 	ptrel/l	r32, tr2
1.1  mrg 	movi	7 << 4, r31
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	blink	tr2, r63
1.1  mrg LOCAL(ct_r9_fp_copy):
1.1  mrg 	fmov.dq	dr0, r9
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr2, r9
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr4, r9
1.1  mrg 	blink	tr1, r63
1.1  mrg 	fmov.dq	dr6, r9
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r2_ld):	/* Copy r2 from a memory address.  */
1.1  mrg 	pt/l	LOCAL(ct_r2_load), tr2
1.1  mrg 	movi	3, r30
1.1  mrg 	shlli	r30, 29, r31
1.1  mrg 	and	r1, r31, r32
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	beq/l	r31, r32, tr2
1.1  mrg 	addi.l	r2, 8, r3
1.1  mrg 	ldx.q	r2, r63, r2
1.1  mrg 	/* Fall through.  */
1.1  mrg LOCAL(ct_r3_ld):	/* Copy r3 from a memory address.  */
1.1  mrg 	pt/l	LOCAL(ct_r3_load), tr2
1.1  mrg 	movi	3, r30
1.1  mrg 	shlli	r30, 26, r31
1.1  mrg 	and	r1, r31, r32
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	beq/l	r31, r32, tr2
1.1  mrg 	addi.l	r3, 8, r4
1.1  mrg 	ldx.q	r3, r63, r3
1.1  mrg LOCAL(ct_r4_ld):	/* Copy r4 from a memory address.  */
1.1  mrg 	pt/l	LOCAL(ct_r4_load), tr2
1.1  mrg 	movi	3, r30
1.1  mrg 	shlli	r30, 23, r31
1.1  mrg 	and	r1, r31, r32
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	beq/l	r31, r32, tr2
1.1  mrg 	addi.l	r4, 8, r5
1.1  mrg 	ldx.q	r4, r63, r4
1.1  mrg LOCAL(ct_r5_ld):	/* Copy r5 from a memory address.  */
1.1  mrg 	pt/l	LOCAL(ct_r5_load), tr2
1.1  mrg 	movi	3, r30
1.1  mrg 	shlli	r30, 20, r31
1.1  mrg 	and	r1, r31, r32
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	beq/l	r31, r32, tr2
1.1  mrg 	addi.l	r5, 8, r6
1.1  mrg 	ldx.q	r5, r63, r5
1.1  mrg LOCAL(ct_r6_ld):	/* Copy r6 from a memory address.  */
1.1  mrg 	pt/l	LOCAL(ct_r6_load), tr2
1.1  mrg 	movi	3 << 16, r31
1.1  mrg 	and	r1, r31, r32
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	beq/l	r31, r32, tr2
1.1  mrg 	addi.l	r6, 8, r7
1.1  mrg 	ldx.q	r6, r63, r6
1.1  mrg LOCAL(ct_r7_ld):	/* Copy r7 from a memory address.  */
1.1  mrg 	pt/l	LOCAL(ct_r7_load), tr2
1.1  mrg 	movi	3 << 12, r31
1.1  mrg 	and	r1, r31, r32
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	beq/l	r31, r32, tr2
1.1  mrg 	addi.l	r7, 8, r8
1.1  mrg 	ldx.q	r7, r63, r7
1.1  mrg LOCAL(ct_r8_ld):	/* Copy r8 from a memory address.  */
1.1  mrg 	pt/l	LOCAL(ct_r8_load), tr2
1.1  mrg 	movi	3 << 8, r31
1.1  mrg 	and	r1, r31, r32
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	beq/l	r31, r32, tr2
1.1  mrg 	addi.l	r8, 8, r9
1.1  mrg 	ldx.q	r8, r63, r8
1.1  mrg LOCAL(ct_r9_ld):	/* Copy r9 from a memory address.  */
1.1  mrg 	pt/l	LOCAL(ct_check_tramp), tr2
1.1  mrg 	ldx.q	r9, r63, r9
1.1  mrg 	blink	tr2, r63
1.1  mrg LOCAL(ct_r2_load):
1.1  mrg 	ldx.q	r2, r63, r2
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r3_load):
1.1  mrg 	ldx.q	r3, r63, r3
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r4_load):
1.1  mrg 	ldx.q	r4, r63, r4
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r5_load):
1.1  mrg 	ldx.q	r5, r63, r5
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r6_load):
1.1  mrg 	ldx.q	r6, r63, r6
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r7_load):
1.1  mrg 	ldx.q	r7, r63, r7
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r8_load):
1.1  mrg 	ldx.q	r8, r63, r8
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r2_pop):	/* Pop r2 from the stack.  */
1.1  mrg 	movi	1, r30
1.1  mrg 	ldx.q	r15, r63, r2
1.1  mrg 	shlli	r30, 29, r31
1.1  mrg 	addi.l	r15, 8, r15
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r3_pop):	/* Pop r3 from the stack.  */
1.1  mrg 	movi	1, r30
1.1  mrg 	ldx.q	r15, r63, r3
1.1  mrg 	shlli	r30, 26, r31
1.1  mrg 	addi.l	r15, 8, r15
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r4_pop):	/* Pop r4 from the stack.  */
1.1  mrg 	movi	1, r30
1.1  mrg 	ldx.q	r15, r63, r4
1.1  mrg 	shlli	r30, 23, r31
1.1  mrg 	addi.l	r15, 8, r15
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r5_pop):	/* Pop r5 from the stack.  */
1.1  mrg 	movi	1, r30
1.1  mrg 	ldx.q	r15, r63, r5
1.1  mrg 	shlli	r30, 20, r31
1.1  mrg 	addi.l	r15, 8, r15
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r6_pop):	/* Pop r6 from the stack.  */
1.1  mrg 	movi	1, r30
1.1  mrg 	ldx.q	r15, r63, r6
1.1  mrg 	shlli	r30, 16, r31
1.1  mrg 	addi.l	r15, 8, r15
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r7_pop):	/* Pop r7 from the stack.  */
1.1  mrg 	ldx.q	r15, r63, r7
1.1  mrg 	movi	1 << 12, r31
1.1  mrg 	addi.l	r15, 8, r15
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_r8_pop):	/* Pop r8 from the stack.  */
1.1  mrg 	ldx.q	r15, r63, r8
1.1  mrg 	movi	1 << 8, r31
1.1  mrg 	addi.l	r15, 8, r15
1.1  mrg 	andc	r1, r31, r1
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ct_pop_seq):	/* Pop a sequence of registers off the stack.  */
1.1  mrg 	andi	r1, 7 << 1, r30
1.1  mrg 	movi	(LOCAL(ct_end_of_pop_seq) >> 16) & 65535, r32
1.1  mrg 	shlli	r30, 2, r31
1.1  mrg 	shori	LOCAL(ct_end_of_pop_seq) & 65535, r32
1.1  mrg 	sub.l	r32, r31, r33
1.1  mrg 	ptabs/l	r33, tr2
1.1  mrg 	blink	tr2, r63
1.1  mrg LOCAL(ct_start_of_pop_seq):	/* Beginning of pop sequence.  */
1.1  mrg 	ldx.q	r15, r63, r3
1.1  mrg 	addi.l	r15, 8, r15
1.1  mrg 	ldx.q	r15, r63, r4
1.1  mrg 	addi.l	r15, 8, r15
1.1  mrg 	ldx.q	r15, r63, r5
1.1  mrg 	addi.l	r15, 8, r15
1.1  mrg 	ldx.q	r15, r63, r6
1.1  mrg 	addi.l	r15, 8, r15
1.1  mrg 	ldx.q	r15, r63, r7
1.1  mrg 	addi.l	r15, 8, r15
1.1  mrg 	ldx.q	r15, r63, r8
1.1  mrg 	addi.l	r15, 8, r15
1.1  mrg LOCAL(ct_r9_pop):	/* Pop r9 from the stack.  */
1.1  mrg 	ldx.q	r15, r63, r9
1.1  mrg 	addi.l	r15, 8, r15
1.1  mrg LOCAL(ct_end_of_pop_seq): /* Label used to compute first pop instruction.  */
1.1  mrg LOCAL(ct_check_tramp):	/* Check whether we need a trampoline.  */
1.1  mrg 	pt/u	LOCAL(ct_ret_wide), tr2
1.1  mrg 	andi	r1, 1, r1
1.1  mrg 	bne/u	r1, r63, tr2
1.1  mrg LOCAL(ct_call_func):	/* Just branch to the function.  */
1.1  mrg 	blink	tr0, r63
1.1  mrg LOCAL(ct_ret_wide):	/* Call the function, so that we can unpack its
1.1  mrg 			   64-bit return value.  */
1.1  mrg 	add.l	r18, r63, r10
1.1  mrg 	blink	tr0, r18
1.1  mrg 	ptabs	r10, tr0
1.1  mrg #if __LITTLE_ENDIAN__
1.1  mrg 	shari	r2, 32, r3
1.1  mrg 	add.l	r2, r63, r2
1.1  mrg #else
1.1  mrg 	add.l	r2, r63, r3
1.1  mrg 	shari	r2, 32, r2
1.1  mrg #endif
1.1  mrg 	blink	tr0, r63
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(GCC_shcompact_call_trampoline))
1.1  mrg #endif /* L_shcompact_call_trampoline */
1.1  mrg
1.1  mrg #ifdef L_shcompact_return_trampoline
1.1  mrg      /* This function does the converse of the code in `ret_wide'
1.1  mrg 	above.  It is tail-called by SHcompact functions returning
1.1  mrg 	64-bit non-floating-point values, to pack the 32-bit values in
1.1  mrg 	r2 and r3 into r2.  */
1.1  mrg
1.1  mrg 	.mode	SHmedia
1.1  mrg 	.section	.text..SHmedia32, "ax"
1.1  mrg 	.align	2
1.1  mrg 	.global	GLOBAL(GCC_shcompact_return_trampoline)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(GCC_shcompact_return_trampoline))
1.1  mrg GLOBAL(GCC_shcompact_return_trampoline):
1.1  mrg 	ptabs/l	r18, tr0
1.1  mrg #if __LITTLE_ENDIAN__
1.1  mrg 	addz.l	r2, r63, r2
1.1  mrg 	shlli	r3, 32, r3
1.1  mrg #else
1.1  mrg 	addz.l	r3, r63, r3
1.1  mrg 	shlli	r2, 32, r2
1.1  mrg #endif
1.1  mrg 	or	r3, r2, r2
1.1  mrg 	blink	tr0, r63
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(GCC_shcompact_return_trampoline))
1.1  mrg #endif /* L_shcompact_return_trampoline */
1.1  mrg
1.1  mrg #ifdef L_shcompact_incoming_args
1.1  mrg 	.section	.rodata
1.1  mrg 	.align	1
1.1  mrg LOCAL(ia_main_table):
1.1  mrg .word	1 /* Invalid, just loop */
1.1  mrg .word	LOCAL(ia_r2_ld) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	LOCAL(ia_r2_push) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	1 /* Invalid, just loop */
1.1  mrg .word	LOCAL(ia_r3_ld) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	LOCAL(ia_r3_push) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	1 /* Invalid, just loop */
1.1  mrg .word	LOCAL(ia_r4_ld) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	LOCAL(ia_r4_push) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	1 /* Invalid, just loop */
1.1  mrg .word	LOCAL(ia_r5_ld) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	LOCAL(ia_r5_push) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	1 /* Invalid, just loop */
1.1  mrg .word	1 /* Invalid, just loop */
1.1  mrg .word	LOCAL(ia_r6_ld) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	LOCAL(ia_r6_push) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	1 /* Invalid, just loop */
1.1  mrg .word	1 /* Invalid, just loop */
1.1  mrg .word	LOCAL(ia_r7_ld) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	LOCAL(ia_r7_push) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	1 /* Invalid, just loop */
1.1  mrg .word	1 /* Invalid, just loop */
1.1  mrg .word	LOCAL(ia_r8_ld) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	LOCAL(ia_r8_push) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	1 /* Invalid, just loop */
1.1  mrg .word	1 /* Invalid, just loop */
1.1  mrg .word	LOCAL(ia_r9_ld) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	LOCAL(ia_r9_push) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	LOCAL(ia_push_seq) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	LOCAL(ia_push_seq) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	LOCAL(ia_r9_push) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	LOCAL(ia_return) - datalabel LOCAL(ia_main_label)
1.1  mrg .word	LOCAL(ia_return) - datalabel LOCAL(ia_main_label)
1.1  mrg 	.mode	SHmedia
1.1  mrg 	.section	.text..SHmedia32, "ax"
1.1  mrg 	.align	2
1.1  mrg
1.1  mrg      /* This function stores 64-bit general-purpose registers back in
1.1  mrg 	the stack, and loads the address in which each register
1.1  mrg 	was stored into itself.  The lower 32 bits of r17 hold the address
1.1  mrg 	to begin storing, and the upper 32 bits of r17 hold the cookie.
1.1  mrg 	Its execution time is linear on the
1.1  mrg 	number of registers that actually have to be copied, and it is
1.1  mrg 	optimized for structures larger than 64 bits, as opposed to
1.1  mrg 	individual `long long' arguments.  See sh.h for details on the
1.1  mrg 	actual bit pattern.  */
1.1  mrg
1.1  mrg 	.global	GLOBAL(GCC_shcompact_incoming_args)
1.1  mrg  	FUNC(GLOBAL(GCC_shcompact_incoming_args))
1.1  mrg GLOBAL(GCC_shcompact_incoming_args):
1.1  mrg 	ptabs/l	r18, tr0	/* Prepare to return.  */
1.1  mrg 	shlri	r17, 32, r0	/* Load the cookie.  */
1.1  mrg 	movi	((datalabel LOCAL(ia_main_table) - 31 * 2) >> 16) & 65535, r43
1.1  mrg 	pt/l	LOCAL(ia_loop), tr1
1.1  mrg 	add.l	r17, r63, r17
1.1  mrg 	shori	((datalabel LOCAL(ia_main_table) - 31 * 2)) & 65535, r43
1.1  mrg LOCAL(ia_loop):
1.1  mrg 	nsb	r0, r36
1.1  mrg 	shlli	r36, 1, r37
1.1  mrg 	ldx.w	r43, r37, r38
1.1  mrg LOCAL(ia_main_label):
1.1  mrg 	ptrel/l	r38, tr2
1.1  mrg 	blink	tr2, r63
1.1  mrg LOCAL(ia_r2_ld):	/* Store r2 and load its address.  */
1.1  mrg 	movi	3, r38
1.1  mrg 	shlli	r38, 29, r39
1.1  mrg 	and	r0, r39, r40
1.1  mrg 	andc	r0, r39, r0
1.1  mrg 	stx.q	r17, r63, r2
1.1  mrg 	add.l	r17, r63, r2
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	beq/u	r39, r40, tr1
1.1  mrg LOCAL(ia_r3_ld):	/* Store r3 and load its address.  */
1.1  mrg 	movi	3, r38
1.1  mrg 	shlli	r38, 26, r39
1.1  mrg 	and	r0, r39, r40
1.1  mrg 	andc	r0, r39, r0
1.1  mrg 	stx.q	r17, r63, r3
1.1  mrg 	add.l	r17, r63, r3
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	beq/u	r39, r40, tr1
1.1  mrg LOCAL(ia_r4_ld):	/* Store r4 and load its address.  */
1.1  mrg 	movi	3, r38
1.1  mrg 	shlli	r38, 23, r39
1.1  mrg 	and	r0, r39, r40
1.1  mrg 	andc	r0, r39, r0
1.1  mrg 	stx.q	r17, r63, r4
1.1  mrg 	add.l	r17, r63, r4
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	beq/u	r39, r40, tr1
1.1  mrg LOCAL(ia_r5_ld):	/* Store r5 and load its address.  */
1.1  mrg 	movi	3, r38
1.1  mrg 	shlli	r38, 20, r39
1.1  mrg 	and	r0, r39, r40
1.1  mrg 	andc	r0, r39, r0
1.1  mrg 	stx.q	r17, r63, r5
1.1  mrg 	add.l	r17, r63, r5
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	beq/u	r39, r40, tr1
1.1  mrg LOCAL(ia_r6_ld):	/* Store r6 and load its address.  */
1.1  mrg 	movi	3, r38
1.1  mrg 	shlli	r38, 16, r39
1.1  mrg 	and	r0, r39, r40
1.1  mrg 	andc	r0, r39, r0
1.1  mrg 	stx.q	r17, r63, r6
1.1  mrg 	add.l	r17, r63, r6
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	beq/u	r39, r40, tr1
1.1  mrg LOCAL(ia_r7_ld):	/* Store r7 and load its address.  */
1.1  mrg 	movi	3 << 12, r39
1.1  mrg 	and	r0, r39, r40
1.1  mrg 	andc	r0, r39, r0
1.1  mrg 	stx.q	r17, r63, r7
1.1  mrg 	add.l	r17, r63, r7
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	beq/u	r39, r40, tr1
1.1  mrg LOCAL(ia_r8_ld):	/* Store r8 and load its address.  */
1.1  mrg 	movi	3 << 8, r39
1.1  mrg 	and	r0, r39, r40
1.1  mrg 	andc	r0, r39, r0
1.1  mrg 	stx.q	r17, r63, r8
1.1  mrg 	add.l	r17, r63, r8
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	beq/u	r39, r40, tr1
1.1  mrg LOCAL(ia_r9_ld):	/* Store r9 and load its address.  */
1.1  mrg 	stx.q	r17, r63, r9
1.1  mrg 	add.l	r17, r63, r9
1.1  mrg 	blink	tr0, r63
1.1  mrg LOCAL(ia_r2_push):	/* Push r2 onto the stack.  */
1.1  mrg 	movi	1, r38
1.1  mrg 	shlli	r38, 29, r39
1.1  mrg 	andc	r0, r39, r0
1.1  mrg 	stx.q	r17, r63, r2
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ia_r3_push):	/* Push r3 onto the stack.  */
1.1  mrg 	movi	1, r38
1.1  mrg 	shlli	r38, 26, r39
1.1  mrg 	andc	r0, r39, r0
1.1  mrg 	stx.q	r17, r63, r3
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ia_r4_push):	/* Push r4 onto the stack.  */
1.1  mrg 	movi	1, r38
1.1  mrg 	shlli	r38, 23, r39
1.1  mrg 	andc	r0, r39, r0
1.1  mrg 	stx.q	r17, r63, r4
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ia_r5_push):	/* Push r5 onto the stack.  */
1.1  mrg 	movi	1, r38
1.1  mrg 	shlli	r38, 20, r39
1.1  mrg 	andc	r0, r39, r0
1.1  mrg 	stx.q	r17, r63, r5
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ia_r6_push):	/* Push r6 onto the stack.  */
1.1  mrg 	movi	1, r38
1.1  mrg 	shlli	r38, 16, r39
1.1  mrg 	andc	r0, r39, r0
1.1  mrg 	stx.q	r17, r63, r6
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ia_r7_push):	/* Push r7 onto the stack.  */
1.1  mrg 	movi	1 << 12, r39
1.1  mrg 	andc	r0, r39, r0
1.1  mrg 	stx.q	r17, r63, r7
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ia_r8_push):	/* Push r8 onto the stack.  */
1.1  mrg 	movi	1 << 8, r39
1.1  mrg 	andc	r0, r39, r0
1.1  mrg 	stx.q	r17, r63, r8
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	blink	tr1, r63
1.1  mrg LOCAL(ia_push_seq):	/* Push a sequence of registers onto the stack.  */
1.1  mrg 	andi	r0, 7 << 1, r38
1.1  mrg 	movi	(LOCAL(ia_end_of_push_seq) >> 16) & 65535, r40
1.1  mrg 	shlli	r38, 2, r39
1.1  mrg 	shori	LOCAL(ia_end_of_push_seq) & 65535, r40
1.1  mrg 	sub.l	r40, r39, r41
1.1  mrg 	ptabs/l	r41, tr2
1.1  mrg 	blink	tr2, r63
1.1  mrg LOCAL(ia_stack_of_push_seq):	 /* Beginning of push sequence.  */
1.1  mrg 	stx.q	r17, r63, r3
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	stx.q	r17, r63, r4
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	stx.q	r17, r63, r5
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	stx.q	r17, r63, r6
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	stx.q	r17, r63, r7
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg 	stx.q	r17, r63, r8
1.1  mrg 	addi.l	r17, 8, r17
1.1  mrg LOCAL(ia_r9_push):	/* Push r9 onto the stack.  */
1.1  mrg 	stx.q	r17, r63, r9
1.1  mrg LOCAL(ia_return):	/* Return.  */
1.1  mrg 	blink	tr0, r63
1.1  mrg LOCAL(ia_end_of_push_seq): /* Label used to compute the first push instruction.  */
1.1  mrg 	ENDFUNC(GLOBAL(GCC_shcompact_incoming_args))
1.1  mrg #endif /* L_shcompact_incoming_args */
1.1  mrg #endif
1.1  mrg #if __SH5__
1.1  mrg #ifdef L_nested_trampoline
1.1  mrg #if __SH5__ == 32
1.1  mrg 	.section	.text..SHmedia32,"ax"
1.1  mrg #else
1.1  mrg 	.text
1.1  mrg #endif
1.1  mrg 	.align	3 /* It is copied in units of 8 bytes in SHmedia mode.  */
1.1  mrg 	.global	GLOBAL(GCC_nested_trampoline)
1.1  mrg 	HIDDEN_FUNC(GLOBAL(GCC_nested_trampoline))
1.1  mrg GLOBAL(GCC_nested_trampoline):
1.1  mrg 	.mode	SHmedia
1.1  mrg 	ptrel/u	r63, tr0
1.1  mrg 	gettr	tr0, r0
1.1  mrg #if __SH5__ == 64
1.1  mrg 	ld.q	r0, 24, r1
1.1  mrg #else
1.1  mrg 	ld.l	r0, 24, r1
1.1  mrg #endif
1.1  mrg 	ptabs/l	r1, tr1
1.1  mrg #if __SH5__ == 64
1.1  mrg 	ld.q	r0, 32, r1
1.1  mrg #else
1.1  mrg 	ld.l	r0, 28, r1
1.1  mrg #endif
1.1  mrg 	blink	tr1, r63
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(GCC_nested_trampoline))
1.1  mrg #endif /* L_nested_trampoline */
1.1  mrg #endif /* __SH5__ */
1.1  mrg #if __SH5__ == 32
1.1  mrg #ifdef L_push_pop_shmedia_regs
1.1  mrg 	.section	.text..SHmedia32,"ax"
1.1  mrg 	.mode	SHmedia
1.1  mrg 	.align	2
1.1  mrg #ifndef __SH4_NOFPU__
1.1  mrg 	.global	GLOBAL(GCC_push_shmedia_regs)
1.1  mrg 	FUNC(GLOBAL(GCC_push_shmedia_regs))
1.1  mrg GLOBAL(GCC_push_shmedia_regs):
1.1  mrg 	addi.l	r15, -14*8, r15
1.1  mrg 	fst.d	r15, 13*8, dr62
1.1  mrg 	fst.d	r15, 12*8, dr60
1.1  mrg 	fst.d	r15, 11*8, dr58
1.1  mrg 	fst.d	r15, 10*8, dr56
1.1  mrg 	fst.d	r15,  9*8, dr54
1.1  mrg 	fst.d	r15,  8*8, dr52
1.1  mrg 	fst.d	r15,  7*8, dr50
1.1  mrg 	fst.d	r15,  6*8, dr48
1.1  mrg 	fst.d	r15,  5*8, dr46
1.1  mrg 	fst.d	r15,  4*8, dr44
1.1  mrg 	fst.d	r15,  3*8, dr42
1.1  mrg 	fst.d	r15,  2*8, dr40
1.1  mrg 	fst.d	r15,  1*8, dr38
1.1  mrg 	fst.d	r15,  0*8, dr36
1.1  mrg #else /* ! __SH4_NOFPU__ */
1.1  mrg 	.global	GLOBAL(GCC_push_shmedia_regs_nofpu)
1.1  mrg 	FUNC(GLOBAL(GCC_push_shmedia_regs_nofpu))
1.1  mrg GLOBAL(GCC_push_shmedia_regs_nofpu):
1.1  mrg #endif /* ! __SH4_NOFPU__ */
1.1  mrg 	ptabs/l	r18, tr0
1.1  mrg 	addi.l	r15, -27*8, r15
1.1  mrg 	gettr	tr7, r62
1.1  mrg 	gettr	tr6, r61
1.1  mrg 	gettr	tr5, r60
1.1  mrg 	st.q	r15, 26*8, r62
1.1  mrg 	st.q	r15, 25*8, r61
1.1  mrg 	st.q	r15, 24*8, r60
1.1  mrg 	st.q	r15, 23*8, r59
1.1  mrg 	st.q	r15, 22*8, r58
1.1  mrg 	st.q	r15, 21*8, r57
1.1  mrg 	st.q	r15, 20*8, r56
1.1  mrg 	st.q	r15, 19*8, r55
1.1  mrg 	st.q	r15, 18*8, r54
1.1  mrg 	st.q	r15, 17*8, r53
1.1  mrg 	st.q	r15, 16*8, r52
1.1  mrg 	st.q	r15, 15*8, r51
1.1  mrg 	st.q	r15, 14*8, r50
1.1  mrg 	st.q	r15, 13*8, r49
1.1  mrg 	st.q	r15, 12*8, r48
1.1  mrg 	st.q	r15, 11*8, r47
1.1  mrg 	st.q	r15, 10*8, r46
1.1  mrg 	st.q	r15,  9*8, r45
1.1  mrg 	st.q	r15,  8*8, r44
1.1  mrg 	st.q	r15,  7*8, r35
1.1  mrg 	st.q	r15,  6*8, r34
1.1  mrg 	st.q	r15,  5*8, r33
1.1  mrg 	st.q	r15,  4*8, r32
1.1  mrg 	st.q	r15,  3*8, r31
1.1  mrg 	st.q	r15,  2*8, r30
1.1  mrg 	st.q	r15,  1*8, r29
1.1  mrg 	st.q	r15,  0*8, r28
1.1  mrg 	blink	tr0, r63
1.1  mrg #ifndef __SH4_NOFPU__
1.1  mrg 	ENDFUNC(GLOBAL(GCC_push_shmedia_regs))
1.1  mrg #else
1.1  mrg 	ENDFUNC(GLOBAL(GCC_push_shmedia_regs_nofpu))
1.1  mrg #endif
1.1  mrg #ifndef __SH4_NOFPU__
1.1  mrg 	.global	GLOBAL(GCC_pop_shmedia_regs)
1.1  mrg 	FUNC(GLOBAL(GCC_pop_shmedia_regs))
1.1  mrg GLOBAL(GCC_pop_shmedia_regs):
1.1  mrg 	pt	.L0, tr1
1.1  mrg 	movi	41*8, r0
1.1  mrg 	fld.d	r15, 40*8, dr62
1.1  mrg 	fld.d	r15, 39*8, dr60
1.1  mrg 	fld.d	r15, 38*8, dr58
1.1  mrg 	fld.d	r15, 37*8, dr56
1.1  mrg 	fld.d	r15, 36*8, dr54
1.1  mrg 	fld.d	r15, 35*8, dr52
1.1  mrg 	fld.d	r15, 34*8, dr50
1.1  mrg 	fld.d	r15, 33*8, dr48
1.1  mrg 	fld.d	r15, 32*8, dr46
1.1  mrg 	fld.d	r15, 31*8, dr44
1.1  mrg 	fld.d	r15, 30*8, dr42
1.1  mrg 	fld.d	r15, 29*8, dr40
1.1  mrg 	fld.d	r15, 28*8, dr38
1.1  mrg 	fld.d	r15, 27*8, dr36
1.1  mrg 	blink	tr1, r63
1.1  mrg #else /* ! __SH4_NOFPU__	*/
1.1  mrg 	.global	GLOBAL(GCC_pop_shmedia_regs_nofpu)
1.1  mrg 	FUNC(GLOBAL(GCC_pop_shmedia_regs_nofpu))
1.1  mrg GLOBAL(GCC_pop_shmedia_regs_nofpu):
1.1  mrg #endif /* ! __SH4_NOFPU__	*/
1.1  mrg 	movi	27*8, r0
1.1  mrg .L0:
1.1  mrg 	ptabs	r18, tr0
1.1  mrg 	ld.q	r15, 26*8, r62
1.1  mrg 	ld.q	r15, 25*8, r61
1.1  mrg 	ld.q	r15, 24*8, r60
1.1  mrg 	ptabs	r62, tr7
1.1  mrg 	ptabs	r61, tr6
1.1  mrg 	ptabs	r60, tr5
1.1  mrg 	ld.q	r15, 23*8, r59
1.1  mrg 	ld.q	r15, 22*8, r58
1.1  mrg 	ld.q	r15, 21*8, r57
1.1  mrg 	ld.q	r15, 20*8, r56
1.1  mrg 	ld.q	r15, 19*8, r55
1.1  mrg 	ld.q	r15, 18*8, r54
1.1  mrg 	ld.q	r15, 17*8, r53
1.1  mrg 	ld.q	r15, 16*8, r52
1.1  mrg 	ld.q	r15, 15*8, r51
1.1  mrg 	ld.q	r15, 14*8, r50
1.1  mrg 	ld.q	r15, 13*8, r49
1.1  mrg 	ld.q	r15, 12*8, r48
1.1  mrg 	ld.q	r15, 11*8, r47
1.1  mrg 	ld.q	r15, 10*8, r46
1.1  mrg 	ld.q	r15,  9*8, r45
1.1  mrg 	ld.q	r15,  8*8, r44
1.1  mrg 	ld.q	r15,  7*8, r35
1.1  mrg 	ld.q	r15,  6*8, r34
1.1  mrg 	ld.q	r15,  5*8, r33
1.1  mrg 	ld.q	r15,  4*8, r32
1.1  mrg 	ld.q	r15,  3*8, r31
1.1  mrg 	ld.q	r15,  2*8, r30
1.1  mrg 	ld.q	r15,  1*8, r29
1.1  mrg 	ld.q	r15,  0*8, r28
1.1  mrg 	add.l	r15, r0, r15
1.1  mrg 	blink	tr0, r63
1.1  mrg
1.1  mrg #ifndef __SH4_NOFPU__
1.1  mrg 	ENDFUNC(GLOBAL(GCC_pop_shmedia_regs))
1.1  mrg #else
1.1  mrg 	ENDFUNC(GLOBAL(GCC_pop_shmedia_regs_nofpu))
1.1  mrg #endif
1.1  mrg #endif /* __SH5__ == 32 */
1.1  mrg #endif /* L_push_pop_shmedia_regs */
1.1  mrg
1.1  mrg #ifdef L_div_table
1.1  mrg #if __SH5__
1.1  mrg #if defined(__pic__) && __SHMEDIA__
1.1  mrg 	.global	GLOBAL(sdivsi3)
1.1  mrg 	FUNC(GLOBAL(sdivsi3))
1.1  mrg #if __SH5__ == 32
1.1  mrg 	.section	.text..SHmedia32,"ax"
1.1  mrg #else
1.1  mrg 	.text
1.1  mrg #endif
1.1  mrg #if 0
1.1  mrg /* ??? FIXME: Presumably due to a linker bug, exporting data symbols
1.1  mrg    in a text section does not work (at least for shared libraries):
1.1  mrg    the linker sets the LSB of the address as if this was SHmedia code.  */
1.1  mrg #define TEXT_DATA_BUG
1.1  mrg #endif
1.1  mrg 	.align	2
1.1  mrg  // inputs: r4,r5
1.1  mrg  // clobbered: r1,r18,r19,r20,r21,r25,tr0
1.1  mrg  // result in r0
1.1  mrg  .global GLOBAL(sdivsi3)
1.1  mrg GLOBAL(sdivsi3):
1.1  mrg #ifdef TEXT_DATA_BUG
1.1  mrg  ptb datalabel Local_div_table,tr0
1.1  mrg #else
1.1  mrg  ptb GLOBAL(div_table_internal),tr0
1.1  mrg #endif
1.1  mrg  nsb r5, r1
1.1  mrg  shlld r5, r1, r25    // normalize; [-2 ..1, 1..2) in s2.62
1.1  mrg  shari r25, 58, r21   // extract 5(6) bit index (s2.4 with hole -1..1)
1.1  mrg  /* bubble */
1.1  mrg  gettr tr0,r20
1.1  mrg  ldx.ub r20, r21, r19 // u0.8
1.1  mrg  shari r25, 32, r25   // normalize to s2.30
1.1  mrg  shlli r21, 1, r21
1.1  mrg  muls.l r25, r19, r19 // s2.38
1.1  mrg  ldx.w r20, r21, r21  // s2.14
1.1  mrg   ptabs r18, tr0
1.1  mrg  shari r19, 24, r19   // truncate to s2.14
1.1  mrg  sub r21, r19, r19    // some 11 bit inverse in s1.14
1.1  mrg  muls.l r19, r19, r21 // u0.28
1.1  mrg   sub r63, r1, r1
1.1  mrg   addi r1, 92, r1
1.1  mrg  muls.l r25, r21, r18 // s2.58
1.1  mrg  shlli r19, 45, r19   // multiply by two and convert to s2.58
1.1  mrg   /* bubble */
1.1  mrg  sub r19, r18, r18
1.1  mrg  shari r18, 28, r18   // some 22 bit inverse in s1.30
1.1  mrg  muls.l r18, r25, r0  // s2.60
1.1  mrg   muls.l r18, r4, r25 // s32.30
1.1  mrg   /* bubble */
1.1  mrg  shari r0, 16, r19   // s-16.44
1.1  mrg  muls.l r19, r18, r19 // s-16.74
1.1  mrg   shari r25, 63, r0
1.1  mrg   shari r4, 14, r18   // s19.-14
1.1  mrg  shari r19, 30, r19   // s-16.44
1.1  mrg  muls.l r19, r18, r19 // s15.30
1.1  mrg   xor r21, r0, r21    // You could also use the constant 1 << 27.
1.1  mrg   add r21, r25, r21
1.1  mrg  sub r21, r19, r21
1.1  mrg  shard r21, r1, r21
1.1  mrg  sub r21, r0, r0
1.1  mrg  blink tr0, r63
1.1  mrg 	ENDFUNC(GLOBAL(sdivsi3))
1.1  mrg /* This table has been generated by divtab.c .
1.1  mrg Defects for bias -330:
1.1  mrg    Max defect: 6.081536e-07 at -1.000000e+00
1.1  mrg    Min defect: 2.849516e-08 at 1.030651e+00
1.1  mrg    Max 2nd step defect: 9.606539e-12 at -1.000000e+00
1.1  mrg    Min 2nd step defect: 0.000000e+00 at 0.000000e+00
1.1  mrg    Defect at 1: 1.238659e-07
1.1  mrg    Defect at -2: 1.061708e-07 */
1.1  mrg #else /* ! __pic__ || ! __SHMEDIA__ */
1.1  mrg 	.section	.rodata
1.1  mrg #endif /* __pic__ */
1.1  mrg #if defined(TEXT_DATA_BUG) && defined(__pic__) && __SHMEDIA__
1.1  mrg 	.balign 2
1.1  mrg 	.type	Local_div_table,@object
1.1  mrg 	.size	Local_div_table,128
1.1  mrg /* negative division constants */
1.1  mrg 	.word	-16638
1.1  mrg 	.word	-17135
1.1  mrg 	.word	-17737
1.1  mrg 	.word	-18433
1.1  mrg 	.word	-19103
1.1  mrg 	.word	-19751
1.1  mrg 	.word	-20583
1.1  mrg 	.word	-21383
1.1  mrg 	.word	-22343
1.1  mrg 	.word	-23353
1.1  mrg 	.word	-24407
1.1  mrg 	.word	-25582
1.1  mrg 	.word	-26863
1.1  mrg 	.word	-28382
1.1  mrg 	.word	-29965
1.1  mrg 	.word	-31800
1.1  mrg /* negative division factors */
1.1  mrg 	.byte	66
1.1  mrg 	.byte	70
1.1  mrg 	.byte	75
1.1  mrg 	.byte	81
1.1  mrg 	.byte	87
1.1  mrg 	.byte	93
1.1  mrg 	.byte	101
1.1  mrg 	.byte	109
1.1  mrg 	.byte	119
1.1  mrg 	.byte	130
1.1  mrg 	.byte	142
1.1  mrg 	.byte	156
1.1  mrg 	.byte	172
1.1  mrg 	.byte	192
1.1  mrg 	.byte	214
1.1  mrg 	.byte	241
1.1  mrg 	.skip 16
1.1  mrg Local_div_table:
1.1  mrg 	.skip 16
1.1  mrg /* positive division factors */
1.1  mrg 	.byte	241
1.1  mrg 	.byte	214
1.1  mrg 	.byte	192
1.1  mrg 	.byte	172
1.1  mrg 	.byte	156
1.1  mrg 	.byte	142
1.1  mrg 	.byte	130
1.1  mrg 	.byte	119
1.1  mrg 	.byte	109
1.1  mrg 	.byte	101
1.1  mrg 	.byte	93
1.1  mrg 	.byte	87
1.1  mrg 	.byte	81
1.1  mrg 	.byte	75
1.1  mrg 	.byte	70
1.1  mrg 	.byte	66
1.1  mrg /* positive division constants */
1.1  mrg 	.word	31801
1.1  mrg 	.word	29966
1.1  mrg 	.word	28383
1.1  mrg 	.word	26864
1.1  mrg 	.word	25583
1.1  mrg 	.word	24408
1.1  mrg 	.word	23354
1.1  mrg 	.word	22344
1.1  mrg 	.word	21384
1.1  mrg 	.word	20584
1.1  mrg 	.word	19752
1.1  mrg 	.word	19104
1.1  mrg 	.word	18434
1.1  mrg 	.word	17738
1.1  mrg 	.word	17136
1.1  mrg 	.word	16639
1.1  mrg 	.section	.rodata
1.1  mrg #endif /* TEXT_DATA_BUG */
1.1  mrg 	.balign 2
1.1  mrg 	.type	GLOBAL(div_table),@object
1.1  mrg 	.size	GLOBAL(div_table),128
1.1  mrg /* negative division constants */
1.1  mrg 	.word	-16638
1.1  mrg 	.word	-17135
1.1  mrg 	.word	-17737
1.1  mrg 	.word	-18433
1.1  mrg 	.word	-19103
1.1  mrg 	.word	-19751
1.1  mrg 	.word	-20583
1.1  mrg 	.word	-21383
1.1  mrg 	.word	-22343
1.1  mrg 	.word	-23353
1.1  mrg 	.word	-24407
1.1  mrg 	.word	-25582
1.1  mrg 	.word	-26863
1.1  mrg 	.word	-28382
1.1  mrg 	.word	-29965
1.1  mrg 	.word	-31800
1.1  mrg /* negative division factors */
1.1  mrg 	.byte	66
1.1  mrg 	.byte	70
1.1  mrg 	.byte	75
1.1  mrg 	.byte	81
1.1  mrg 	.byte	87
1.1  mrg 	.byte	93
1.1  mrg 	.byte	101
1.1  mrg 	.byte	109
1.1  mrg 	.byte	119
1.1  mrg 	.byte	130
1.1  mrg 	.byte	142
1.1  mrg 	.byte	156
1.1  mrg 	.byte	172
1.1  mrg 	.byte	192
1.1  mrg 	.byte	214
1.1  mrg 	.byte	241
1.1  mrg 	.skip 16
1.1  mrg 	.global	GLOBAL(div_table)
1.1  mrg GLOBAL(div_table):
1.1  mrg 	HIDDEN_ALIAS(div_table_internal,div_table)
1.1  mrg 	.skip 16
1.1  mrg /* positive division factors */
1.1  mrg 	.byte	241
1.1  mrg 	.byte	214
1.1  mrg 	.byte	192
1.1  mrg 	.byte	172
1.1  mrg 	.byte	156
1.1  mrg 	.byte	142
1.1  mrg 	.byte	130
1.1  mrg 	.byte	119
1.1  mrg 	.byte	109
1.1  mrg 	.byte	101
1.1  mrg 	.byte	93
1.1  mrg 	.byte	87
1.1  mrg 	.byte	81
1.1  mrg 	.byte	75
1.1  mrg 	.byte	70
1.1  mrg 	.byte	66
1.1  mrg /* positive division constants */
1.1  mrg 	.word	31801
1.1  mrg 	.word	29966
1.1  mrg 	.word	28383
1.1  mrg 	.word	26864
1.1  mrg 	.word	25583
1.1  mrg 	.word	24408
1.1  mrg 	.word	23354
1.1  mrg 	.word	22344
1.1  mrg 	.word	21384
1.1  mrg 	.word	20584
1.1  mrg 	.word	19752
1.1  mrg 	.word	19104
1.1  mrg 	.word	18434
1.1  mrg 	.word	17738
1.1  mrg 	.word	17136
1.1  mrg 	.word	16639
1.1  mrg
1.1  mrg #elif defined (__SH2A__) || defined (__SH3__) || defined (__SH3E__) || defined (__SH4__) || defined (__SH4_SINGLE__) || defined (__SH4_SINGLE_ONLY__) || defined (__SH4_NOFPU__)
1.1  mrg /* This code uses shld, thus is not suitable for SH1 / SH2.  */
1.1  mrg
1.1  mrg /* Signed / unsigned division without use of FPU, optimized for SH4.
1.1  mrg    Uses a lookup table for divisors in the range -128 .. +128, and
1.1  mrg    div1 with case distinction for larger divisors in three more ranges.
1.1  mrg    The code is lumped together with the table to allow the use of mova.  */
1.1  mrg #ifdef __LITTLE_ENDIAN__
1.1  mrg #define L_LSB 0
1.1  mrg #define L_LSWMSB 1
1.1  mrg #define L_MSWLSB 2
1.1  mrg #else
1.1  mrg #define L_LSB 3
1.1  mrg #define L_LSWMSB 2
1.1  mrg #define L_MSWLSB 1
1.1  mrg #endif
1.1  mrg
1.1  mrg 	.balign 4
1.1  mrg 	.global	GLOBAL(udivsi3_i4i)
1.1  mrg 	FUNC(GLOBAL(udivsi3_i4i))
1.1  mrg GLOBAL(udivsi3_i4i):
1.1  mrg 	mov.w LOCAL(c128_w), r1
1.1  mrg 	div0u
1.1  mrg 	mov r4,r0
1.1  mrg 	shlr8 r0
1.1  mrg 	cmp/hi r1,r5
1.1  mrg 	extu.w r5,r1
1.1  mrg 	bf LOCAL(udiv_le128)
1.1  mrg 	cmp/eq r5,r1
1.1  mrg 	bf LOCAL(udiv_ge64k)
1.1  mrg 	shlr r0
1.1  mrg 	mov r5,r1
1.1  mrg 	shll16 r5
1.1  mrg 	mov.l r4,@-r15
1.1  mrg 	div1 r5,r0
1.1  mrg 	mov.l r1,@-r15
1.1  mrg 	div1 r5,r0
1.1  mrg 	div1 r5,r0
1.1  mrg 	bra LOCAL(udiv_25)
1.1  mrg 	div1 r5,r0
1.1  mrg
1.1  mrg LOCAL(div_le128):
1.1  mrg 	mova LOCAL(div_table_ix),r0
1.1  mrg 	bra LOCAL(div_le128_2)
1.1  mrg 	mov.b @(r0,r5),r1
1.1  mrg LOCAL(udiv_le128):
1.1  mrg 	mov.l r4,@-r15
1.1  mrg 	mova LOCAL(div_table_ix),r0
1.1  mrg 	mov.b @(r0,r5),r1
1.1  mrg 	mov.l r5,@-r15
1.1  mrg LOCAL(div_le128_2):
1.1  mrg 	mova LOCAL(div_table_inv),r0
1.1  mrg 	mov.l @(r0,r1),r1
1.1  mrg 	mov r5,r0
1.1  mrg 	tst #0xfe,r0
1.1  mrg 	mova LOCAL(div_table_clz),r0
1.1  mrg 	dmulu.l r1,r4
1.1  mrg 	mov.b @(r0,r5),r1
1.1  mrg 	bt/s LOCAL(div_by_1)
1.1  mrg 	mov r4,r0
1.1  mrg 	mov.l @r15+,r5
1.1  mrg 	sts mach,r0
1.1  mrg 	/* clrt */
1.1  mrg 	addc r4,r0
1.1  mrg 	mov.l @r15+,r4
1.1  mrg 	rotcr r0
1.1  mrg 	rts
1.1  mrg 	shld r1,r0
1.1  mrg
1.1  mrg LOCAL(div_by_1_neg):
1.1  mrg 	neg r4,r0
1.1  mrg LOCAL(div_by_1):
1.1  mrg 	mov.l @r15+,r5
1.1  mrg 	rts
1.1  mrg 	mov.l @r15+,r4
1.1  mrg
1.1  mrg LOCAL(div_ge64k):
1.1  mrg 	bt/s LOCAL(div_r8)
1.1  mrg 	div0u
1.1  mrg 	shll8 r5
1.1  mrg 	bra LOCAL(div_ge64k_2)
1.1  mrg 	div1 r5,r0
1.1  mrg LOCAL(udiv_ge64k):
1.1  mrg 	cmp/hi r0,r5
1.1  mrg 	mov r5,r1
1.1  mrg 	bt LOCAL(udiv_r8)
1.1  mrg 	shll8 r5
1.1  mrg 	mov.l r4,@-r15
1.1  mrg 	div1 r5,r0
1.1  mrg 	mov.l r1,@-r15
1.1  mrg LOCAL(div_ge64k_2):
1.1  mrg 	div1 r5,r0
1.1  mrg 	mov.l LOCAL(zero_l),r1
1.1  mrg 	.rept 4
1.1  mrg 	div1 r5,r0
1.1  mrg 	.endr
1.1  mrg 	mov.l r1,@-r15
1.1  mrg 	div1 r5,r0
1.1  mrg 	mov.w LOCAL(m256_w),r1
1.1  mrg 	div1 r5,r0
1.1  mrg 	mov.b r0,@(L_LSWMSB,r15)
1.1  mrg 	xor r4,r0
1.1  mrg 	and r1,r0
1.1  mrg 	bra LOCAL(div_ge64k_end)
1.1  mrg 	xor r4,r0
1.1  mrg
1.1  mrg LOCAL(div_r8):
1.1  mrg 	shll16 r4
1.1  mrg 	bra LOCAL(div_r8_2)
1.1  mrg 	shll8 r4
1.1  mrg LOCAL(udiv_r8):
1.1  mrg 	mov.l r4,@-r15
1.1  mrg 	shll16 r4
1.1  mrg 	clrt
1.1  mrg 	shll8 r4
1.1  mrg 	mov.l r5,@-r15
1.1  mrg LOCAL(div_r8_2):
1.1  mrg 	rotcl r4
1.1  mrg 	mov r0,r1
1.1  mrg 	div1 r5,r1
1.1  mrg 	mov r4,r0
1.1  mrg 	rotcl r0
1.1  mrg 	mov r5,r4
1.1  mrg 	div1 r5,r1
1.1  mrg 	.rept 5
1.1  mrg 	rotcl r0; div1 r5,r1
1.1  mrg 	.endr
1.1  mrg 	rotcl r0
1.1  mrg 	mov.l @r15+,r5
1.1  mrg 	div1 r4,r1
1.1  mrg 	mov.l @r15+,r4
1.1  mrg 	rts
1.1  mrg 	rotcl r0
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(udivsi3_i4i))
1.1  mrg
1.1  mrg 	.global	GLOBAL(sdivsi3_i4i)
1.1  mrg 	FUNC(GLOBAL(sdivsi3_i4i))
1.1  mrg 	/* This is link-compatible with a GLOBAL(sdivsi3) call,
1.1  mrg 	   but we effectively clobber only r1.  */
1.1  mrg GLOBAL(sdivsi3_i4i):
1.1  mrg 	mov.l r4,@-r15
1.1  mrg 	cmp/pz r5
1.1  mrg 	mov.w LOCAL(c128_w), r1
1.1  mrg 	bt/s LOCAL(pos_divisor)
1.1  mrg 	cmp/pz r4
1.1  mrg 	mov.l r5,@-r15
1.1  mrg 	neg r5,r5
1.1  mrg 	bt/s LOCAL(neg_result)
1.1  mrg 	cmp/hi r1,r5
1.1  mrg 	neg r4,r4
1.1  mrg LOCAL(pos_result):
1.1  mrg 	extu.w r5,r0
1.1  mrg 	bf LOCAL(div_le128)
1.1  mrg 	cmp/eq r5,r0
1.1  mrg 	mov r4,r0
1.1  mrg 	shlr8 r0
1.1  mrg 	bf/s LOCAL(div_ge64k)
1.1  mrg 	cmp/hi r0,r5
1.1  mrg 	div0u
1.1  mrg 	shll16 r5
1.1  mrg 	div1 r5,r0
1.1  mrg 	div1 r5,r0
1.1  mrg 	div1 r5,r0
1.1  mrg LOCAL(udiv_25):
1.1  mrg 	mov.l LOCAL(zero_l),r1
1.1  mrg 	div1 r5,r0
1.1  mrg 	div1 r5,r0
1.1  mrg 	mov.l r1,@-r15
1.1  mrg 	.rept 3
1.1  mrg 	div1 r5,r0
1.1  mrg 	.endr
1.1  mrg 	mov.b r0,@(L_MSWLSB,r15)
1.1  mrg 	xtrct r4,r0
1.1  mrg 	swap.w r0,r0
1.1  mrg 	.rept 8
1.1  mrg 	div1 r5,r0
1.1  mrg 	.endr
1.1  mrg 	mov.b r0,@(L_LSWMSB,r15)
1.1  mrg LOCAL(div_ge64k_end):
1.1  mrg 	.rept 8
1.1  mrg 	div1 r5,r0
1.1  mrg 	.endr
1.1  mrg 	mov.l @r15+,r4 ! zero-extension and swap using LS unit.
1.1  mrg 	extu.b r0,r0
1.1  mrg 	mov.l @r15+,r5
1.1  mrg 	or r4,r0
1.1  mrg 	mov.l @r15+,r4
1.1  mrg 	rts
1.1  mrg 	rotcl r0
1.1  mrg
1.1  mrg LOCAL(div_le128_neg):
1.1  mrg 	tst #0xfe,r0
1.1  mrg 	mova LOCAL(div_table_ix),r0
1.1  mrg 	mov.b @(r0,r5),r1
1.1  mrg 	mova LOCAL(div_table_inv),r0
1.1  mrg 	bt/s LOCAL(div_by_1_neg)
1.1  mrg 	mov.l @(r0,r1),r1
1.1  mrg 	mova LOCAL(div_table_clz),r0
1.1  mrg 	dmulu.l r1,r4
1.1  mrg 	mov.b @(r0,r5),r1
1.1  mrg 	mov.l @r15+,r5
1.1  mrg 	sts mach,r0
1.1  mrg 	/* clrt */
1.1  mrg 	addc r4,r0
1.1  mrg 	mov.l @r15+,r4
1.1  mrg 	rotcr r0
1.1  mrg 	shld r1,r0
1.1  mrg 	rts
1.1  mrg 	neg r0,r0
1.1  mrg
1.1  mrg LOCAL(pos_divisor):
1.1  mrg 	mov.l r5,@-r15
1.1  mrg 	bt/s LOCAL(pos_result)
1.1  mrg 	cmp/hi r1,r5
1.1  mrg 	neg r4,r4
1.1  mrg LOCAL(neg_result):
1.1  mrg 	extu.w r5,r0
1.1  mrg 	bf LOCAL(div_le128_neg)
1.1  mrg 	cmp/eq r5,r0
1.1  mrg 	mov r4,r0
1.1  mrg 	shlr8 r0
1.1  mrg 	bf/s LOCAL(div_ge64k_neg)
1.1  mrg 	cmp/hi r0,r5
1.1  mrg 	div0u
1.1  mrg 	mov.l LOCAL(zero_l),r1
1.1  mrg 	shll16 r5
1.1  mrg 	div1 r5,r0
1.1  mrg 	mov.l r1,@-r15
1.1  mrg 	.rept 7
1.1  mrg 	div1 r5,r0
1.1  mrg 	.endr
1.1  mrg 	mov.b r0,@(L_MSWLSB,r15)
1.1  mrg 	xtrct r4,r0
1.1  mrg 	swap.w r0,r0
1.1  mrg 	.rept 8
1.1  mrg 	div1 r5,r0
1.1  mrg 	.endr
1.1  mrg 	mov.b r0,@(L_LSWMSB,r15)
1.1  mrg LOCAL(div_ge64k_neg_end):
1.1  mrg 	.rept 8
1.1  mrg 	div1 r5,r0
1.1  mrg 	.endr
1.1  mrg 	mov.l @r15+,r4 ! zero-extension and swap using LS unit.
1.1  mrg 	extu.b r0,r1
1.1  mrg 	mov.l @r15+,r5
1.1  mrg 	or r4,r1
1.1  mrg LOCAL(div_r8_neg_end):
1.1  mrg 	mov.l @r15+,r4
1.1  mrg 	rotcl r1
1.1  mrg 	rts
1.1  mrg 	neg r1,r0
1.1  mrg
1.1  mrg LOCAL(div_ge64k_neg):
1.1  mrg 	bt/s LOCAL(div_r8_neg)
1.1  mrg 	div0u
1.1  mrg 	shll8 r5
1.1  mrg 	mov.l LOCAL(zero_l),r1
1.1  mrg 	.rept 6
1.1  mrg 	div1 r5,r0
1.1  mrg 	.endr
1.1  mrg 	mov.l r1,@-r15
1.1  mrg 	div1 r5,r0
1.1  mrg 	mov.w LOCAL(m256_w),r1
1.1  mrg 	div1 r5,r0
1.1  mrg 	mov.b r0,@(L_LSWMSB,r15)
1.1  mrg 	xor r4,r0
1.1  mrg 	and r1,r0
1.1  mrg 	bra LOCAL(div_ge64k_neg_end)
1.1  mrg 	xor r4,r0
1.1  mrg
1.1  mrg LOCAL(c128_w):
1.1  mrg 	.word 128
1.1  mrg
1.1  mrg LOCAL(div_r8_neg):
1.1  mrg 	clrt
1.1  mrg 	shll16 r4
1.1  mrg 	mov r4,r1
1.1  mrg 	shll8 r1
1.1  mrg 	mov r5,r4
1.1  mrg 	.rept 7
1.1  mrg 	rotcl r1; div1 r5,r0
1.1  mrg 	.endr
1.1  mrg 	mov.l @r15+,r5
1.1  mrg 	rotcl r1
1.1  mrg 	bra LOCAL(div_r8_neg_end)
1.1  mrg 	div1 r4,r0
1.1  mrg
1.1  mrg LOCAL(m256_w):
1.1  mrg 	.word 0xff00
1.1  mrg /* This table has been generated by divtab-sh4.c.  */
1.1  mrg 	.balign 4
1.1  mrg LOCAL(div_table_clz):
1.1  mrg 	.byte	0
1.1  mrg 	.byte	1
1.1  mrg 	.byte	0
1.1  mrg 	.byte	-1
1.1  mrg 	.byte	-1
1.1  mrg 	.byte	-2
1.1  mrg 	.byte	-2
1.1  mrg 	.byte	-2
1.1  mrg 	.byte	-2
1.1  mrg 	.byte	-3
1.1  mrg 	.byte	-3
1.1  mrg 	.byte	-3
1.1  mrg 	.byte	-3
1.1  mrg 	.byte	-3
1.1  mrg 	.byte	-3
1.1  mrg 	.byte	-3
1.1  mrg 	.byte	-3
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-5
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-6
1.1  mrg /* Lookup table translating positive divisor to index into table of
1.1  mrg    normalized inverse.  N.B. the '0' entry is also the last entry of the
1.1  mrg  previous table, and causes an unaligned access for division by zero.  */
1.1  mrg LOCAL(div_table_ix):
1.1  mrg 	.byte	-6
1.1  mrg 	.byte	-128
1.1  mrg 	.byte	-128
1.1  mrg 	.byte	0
1.1  mrg 	.byte	-128
1.1  mrg 	.byte	-64
1.1  mrg 	.byte	0
1.1  mrg 	.byte	64
1.1  mrg 	.byte	-128
1.1  mrg 	.byte	-96
1.1  mrg 	.byte	-64
1.1  mrg 	.byte	-32
1.1  mrg 	.byte	0
1.1  mrg 	.byte	32
1.1  mrg 	.byte	64
1.1  mrg 	.byte	96
1.1  mrg 	.byte	-128
1.1  mrg 	.byte	-112
1.1  mrg 	.byte	-96
1.1  mrg 	.byte	-80
1.1  mrg 	.byte	-64
1.1  mrg 	.byte	-48
1.1  mrg 	.byte	-32
1.1  mrg 	.byte	-16
1.1  mrg 	.byte	0
1.1  mrg 	.byte	16
1.1  mrg 	.byte	32
1.1  mrg 	.byte	48
1.1  mrg 	.byte	64
1.1  mrg 	.byte	80
1.1  mrg 	.byte	96
1.1  mrg 	.byte	112
1.1  mrg 	.byte	-128
1.1  mrg 	.byte	-120
1.1  mrg 	.byte	-112
1.1  mrg 	.byte	-104
1.1  mrg 	.byte	-96
1.1  mrg 	.byte	-88
1.1  mrg 	.byte	-80
1.1  mrg 	.byte	-72
1.1  mrg 	.byte	-64
1.1  mrg 	.byte	-56
1.1  mrg 	.byte	-48
1.1  mrg 	.byte	-40
1.1  mrg 	.byte	-32
1.1  mrg 	.byte	-24
1.1  mrg 	.byte	-16
1.1  mrg 	.byte	-8
1.1  mrg 	.byte	0
1.1  mrg 	.byte	8
1.1  mrg 	.byte	16
1.1  mrg 	.byte	24
1.1  mrg 	.byte	32
1.1  mrg 	.byte	40
1.1  mrg 	.byte	48
1.1  mrg 	.byte	56
1.1  mrg 	.byte	64
1.1  mrg 	.byte	72
1.1  mrg 	.byte	80
1.1  mrg 	.byte	88
1.1  mrg 	.byte	96
1.1  mrg 	.byte	104
1.1  mrg 	.byte	112
1.1  mrg 	.byte	120
1.1  mrg 	.byte	-128
1.1  mrg 	.byte	-124
1.1  mrg 	.byte	-120
1.1  mrg 	.byte	-116
1.1  mrg 	.byte	-112
1.1  mrg 	.byte	-108
1.1  mrg 	.byte	-104
1.1  mrg 	.byte	-100
1.1  mrg 	.byte	-96
1.1  mrg 	.byte	-92
1.1  mrg 	.byte	-88
1.1  mrg 	.byte	-84
1.1  mrg 	.byte	-80
1.1  mrg 	.byte	-76
1.1  mrg 	.byte	-72
1.1  mrg 	.byte	-68
1.1  mrg 	.byte	-64
1.1  mrg 	.byte	-60
1.1  mrg 	.byte	-56
1.1  mrg 	.byte	-52
1.1  mrg 	.byte	-48
1.1  mrg 	.byte	-44
1.1  mrg 	.byte	-40
1.1  mrg 	.byte	-36
1.1  mrg 	.byte	-32
1.1  mrg 	.byte	-28
1.1  mrg 	.byte	-24
1.1  mrg 	.byte	-20
1.1  mrg 	.byte	-16
1.1  mrg 	.byte	-12
1.1  mrg 	.byte	-8
1.1  mrg 	.byte	-4
1.1  mrg 	.byte	0
1.1  mrg 	.byte	4
1.1  mrg 	.byte	8
1.1  mrg 	.byte	12
1.1  mrg 	.byte	16
1.1  mrg 	.byte	20
1.1  mrg 	.byte	24
1.1  mrg 	.byte	28
1.1  mrg 	.byte	32
1.1  mrg 	.byte	36
1.1  mrg 	.byte	40
1.1  mrg 	.byte	44
1.1  mrg 	.byte	48
1.1  mrg 	.byte	52
1.1  mrg 	.byte	56
1.1  mrg 	.byte	60
1.1  mrg 	.byte	64
1.1  mrg 	.byte	68
1.1  mrg 	.byte	72
1.1  mrg 	.byte	76
1.1  mrg 	.byte	80
1.1  mrg 	.byte	84
1.1  mrg 	.byte	88
1.1  mrg 	.byte	92
1.1  mrg 	.byte	96
1.1  mrg 	.byte	100
1.1  mrg 	.byte	104
1.1  mrg 	.byte	108
1.1  mrg 	.byte	112
1.1  mrg 	.byte	116
1.1  mrg 	.byte	120
1.1  mrg 	.byte	124
1.1  mrg 	.byte	-128
1.1  mrg /* 1/64 .. 1/127, normalized.  There is an implicit leading 1 in bit 32.  */
1.1  mrg 	.balign 4
1.1  mrg LOCAL(zero_l):
1.1  mrg 	.long	0x0
1.1  mrg 	.long	0xF81F81F9
1.1  mrg 	.long	0xF07C1F08
1.1  mrg 	.long	0xE9131AC0
1.1  mrg 	.long	0xE1E1E1E2
1.1  mrg 	.long	0xDAE6076C
1.1  mrg 	.long	0xD41D41D5
1.1  mrg 	.long	0xCD856891
1.1  mrg 	.long	0xC71C71C8
1.1  mrg 	.long	0xC0E07039
1.1  mrg 	.long	0xBACF914D
1.1  mrg 	.long	0xB4E81B4F
1.1  mrg 	.long	0xAF286BCB
1.1  mrg 	.long	0xA98EF607
1.1  mrg 	.long	0xA41A41A5
1.1  mrg 	.long	0x9EC8E952
1.1  mrg 	.long	0x9999999A
1.1  mrg 	.long	0x948B0FCE
1.1  mrg 	.long	0x8F9C18FA
1.1  mrg 	.long	0x8ACB90F7
1.1  mrg 	.long	0x86186187
1.1  mrg 	.long	0x81818182
1.1  mrg 	.long	0x7D05F418
1.1  mrg 	.long	0x78A4C818
1.1  mrg 	.long	0x745D1746
1.1  mrg 	.long	0x702E05C1
1.1  mrg 	.long	0x6C16C16D
1.1  mrg 	.long	0x68168169
1.1  mrg 	.long	0x642C8591
1.1  mrg 	.long	0x60581606
1.1  mrg 	.long	0x5C9882BA
1.1  mrg 	.long	0x58ED2309
1.1  mrg LOCAL(div_table_inv):
1.1  mrg 	.long	0x55555556
1.1  mrg 	.long	0x51D07EAF
1.1  mrg 	.long	0x4E5E0A73
1.1  mrg 	.long	0x4AFD6A06
1.1  mrg 	.long	0x47AE147B
1.1  mrg 	.long	0x446F8657
1.1  mrg 	.long	0x41414142
1.1  mrg 	.long	0x3E22CBCF
1.1  mrg 	.long	0x3B13B13C
1.1  mrg 	.long	0x38138139
1.1  mrg 	.long	0x3521CFB3
1.1  mrg 	.long	0x323E34A3
1.1  mrg 	.long	0x2F684BDB
1.1  mrg 	.long	0x2C9FB4D9
1.1  mrg 	.long	0x29E4129F
1.1  mrg 	.long	0x27350B89
1.1  mrg 	.long	0x24924925
1.1  mrg 	.long	0x21FB7813
1.1  mrg 	.long	0x1F7047DD
1.1  mrg 	.long	0x1CF06ADB
1.1  mrg 	.long	0x1A7B9612
1.1  mrg 	.long	0x18118119
1.1  mrg 	.long	0x15B1E5F8
1.1  mrg 	.long	0x135C8114
1.1  mrg 	.long	0x11111112
1.1  mrg 	.long	0xECF56BF
1.1  mrg 	.long	0xC9714FC
1.1  mrg 	.long	0xA6810A7
1.1  mrg 	.long	0x8421085
1.1  mrg 	.long	0x624DD30
1.1  mrg 	.long	0x4104105
1.1  mrg 	.long	0x2040811
1.1  mrg 	/* maximum error: 0.987342 scaled: 0.921875*/
1.1  mrg
1.1  mrg 	ENDFUNC(GLOBAL(sdivsi3_i4i))
1.1  mrg #endif /* SH3 / SH4 */
1.1  mrg
1.1  mrg #endif /* L_div_table */
1.1  mrg
1.1  mrg #ifdef L_udiv_qrnnd_16
1.1  mrg #if !__SHMEDIA__
1.1  mrg 	HIDDEN_FUNC(GLOBAL(udiv_qrnnd_16))
1.1  mrg 	/* r0: rn r1: qn */ /* r0: n1 r4: n0 r5: d r6: d1 */ /* r2: __m */
1.1  mrg 	/* n1 < d, but n1 might be larger than d1.  */
1.1  mrg 	.global GLOBAL(udiv_qrnnd_16)
1.1  mrg 	.balign 8
1.1  mrg GLOBAL(udiv_qrnnd_16):
1.1  mrg 	div0u
1.1  mrg 	cmp/hi r6,r0
1.1  mrg 	bt .Lots
1.1  mrg 	.rept 16
1.1  mrg 	div1 r6,r0
1.1  mrg 	.endr
1.1  mrg 	extu.w r0,r1
1.1  mrg 	bt 0f
1.1  mrg 	add r6,r0
1.1  mrg 0:	rotcl r1
1.1  mrg 	mulu.w r1,r5
1.1  mrg 	xtrct r4,r0
1.1  mrg 	swap.w r0,r0
1.1  mrg 	sts macl,r2
1.1  mrg 	cmp/hs r2,r0
1.1  mrg 	sub r2,r0
1.1  mrg 	bt 0f
1.1  mrg 	addc r5,r0
1.1  mrg 	add #-1,r1
1.1  mrg 	bt 0f
1.1  mrg 1:	add #-1,r1
1.1  mrg 	rts
1.1  mrg 	add r5,r0
1.1  mrg 	.balign 8
1.1  mrg .Lots:
1.1  mrg 	sub r5,r0
1.1  mrg 	swap.w r4,r1
1.1  mrg 	xtrct r0,r1
1.1  mrg 	clrt
1.1  mrg 	mov r1,r0
1.1  mrg 	addc r5,r0
1.1  mrg 	mov #-1,r1
1.1  mrg 	SL1(bf, 1b,
1.1  mrg 	shlr16 r1)
1.1  mrg 0:	rts
1.1  mrg 	nop
1.1  mrg 	ENDFUNC(GLOBAL(udiv_qrnnd_16))
1.1  mrg #endif /* !__SHMEDIA__ */
1.1  mrg #endif /* L_udiv_qrnnd_16 */