Home | History | Annotate | Line # | Download | only in ia64
moddi3.S revision 1.2.4.2
      1  1.2.4.2  elad .file "__moddi3.s"
      2  1.2.4.2  elad 
      3  1.2.4.2  elad // $NetBSD: moddi3.S,v 1.2.4.2 2006/04/19 04:36:01 elad Exp $
      4  1.2.4.2  elad 
      5  1.2.4.2  elad //-
      6  1.2.4.2  elad // Copyright (c) 2000, Intel Corporation
      7  1.2.4.2  elad // All rights reserved.
      8  1.2.4.2  elad //
      9  1.2.4.2  elad // Contributed 2/15/2000 by Marius Cornea, John Harrison, Cristina Iordache,
     10  1.2.4.2  elad // Ted Kubaska, Bob Norin, and Shane Story of the Computational Software Lab,
     11  1.2.4.2  elad // Intel Corporation.
     12  1.2.4.2  elad //
     13  1.2.4.2  elad // WARRANTY DISCLAIMER
     14  1.2.4.2  elad //
     15  1.2.4.2  elad // THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
     16  1.2.4.2  elad // "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
     17  1.2.4.2  elad // LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
     18  1.2.4.2  elad // A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL INTEL OR ITS
     19  1.2.4.2  elad // CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
     20  1.2.4.2  elad // EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
     21  1.2.4.2  elad // PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
     22  1.2.4.2  elad // PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY
     23  1.2.4.2  elad // OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY OR TORT (INCLUDING
     24  1.2.4.2  elad // NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
     25  1.2.4.2  elad // SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
     26  1.2.4.2  elad //
     27  1.2.4.2  elad // Intel Corporation is the author of this code, and requests that all
     28  1.2.4.2  elad // problem reports or change requests be submitted to it directly at
     29  1.2.4.2  elad // http://developer.intel.com/opensource.
     30  1.2.4.2  elad //
     31  1.2.4.2  elad 
     32  1.2.4.2  elad .section .text
     33  1.2.4.2  elad 
     34  1.2.4.2  elad // 64-bit signed integer remainder
     35  1.2.4.2  elad 
     36  1.2.4.2  elad .proc __moddi3#
     37  1.2.4.2  elad .align 32
     38  1.2.4.2  elad .global __moddi3#
     39  1.2.4.2  elad .align 32
     40  1.2.4.2  elad 
     41  1.2.4.2  elad __moddi3:
     42  1.2.4.2  elad 
     43  1.2.4.2  elad { .mii
     44  1.2.4.2  elad   alloc r31=ar.pfs,3,0,0,0
     45  1.2.4.2  elad   nop.i 0
     46  1.2.4.2  elad   nop.i 0
     47  1.2.4.2  elad } { .mmb
     48  1.2.4.2  elad 
     49  1.2.4.2  elad   // 64-BIT SIGNED INTEGER REMAINDER BEGINS HERE
     50  1.2.4.2  elad 
     51  1.2.4.2  elad   // general register used:
     52  1.2.4.2  elad   //    r32 - 64-bit signed integer dividend, called a below
     53  1.2.4.2  elad   //    r33 - 64-bit signed integer divisor, called b below
     54  1.2.4.2  elad   //    r8 - 64-bit signed integer result
     55  1.2.4.2  elad   //    r2 - scratch register
     56  1.2.4.2  elad   // floating-point registers used: f6, f7, f8, f9, f10, f11, f12
     57  1.2.4.2  elad   // predicate registers used: p6
     58  1.2.4.2  elad 
     59  1.2.4.2  elad   setf.sig f12=r32  // holds a in integer form
     60  1.2.4.2  elad   setf.sig f7=r33
     61  1.2.4.2  elad   nop.b 0
     62  1.2.4.2  elad } { .mlx
     63  1.2.4.2  elad   nop.m 0
     64  1.2.4.2  elad   //movl r2=0x8000000000000000;;
     65  1.2.4.2  elad   movl r2=0xffffffffffffffff;;
     66  1.2.4.2  elad } { .mfi
     67  1.2.4.2  elad   // get the 2's complement of b
     68  1.2.4.2  elad   sub r33=r0,r33
     69  1.2.4.2  elad   fcvt.xf f6=f12
     70  1.2.4.2  elad   nop.i 0
     71  1.2.4.2  elad } { .mfi
     72  1.2.4.2  elad   nop.m 0
     73  1.2.4.2  elad   fcvt.xf f7=f7
     74  1.2.4.2  elad   nop.i 0;;
     75  1.2.4.2  elad } { .mfi
     76  1.2.4.2  elad   nop.m 0
     77  1.2.4.2  elad   // Step (1)
     78  1.2.4.2  elad   // y0 = 1 / b in f8
     79  1.2.4.2  elad   frcpa.s1 f8,p6=f6,f7
     80  1.2.4.2  elad   nop.i 0;;
     81  1.2.4.2  elad } { .mfi
     82  1.2.4.2  elad   nop.m 0
     83  1.2.4.2  elad   // Step (2)
     84  1.2.4.2  elad   // q0 = a * y0 in f10
     85  1.2.4.2  elad   (p6) fma.s1 f10=f6,f8,f0
     86  1.2.4.2  elad   nop.i 0
     87  1.2.4.2  elad } { .mfi
     88  1.2.4.2  elad   nop.m 0
     89  1.2.4.2  elad   // Step (3)
     90  1.2.4.2  elad   // e0 = 1 - b * y0 in f9
     91  1.2.4.2  elad   (p6) fnma.s1 f9=f7,f8,f1
     92  1.2.4.2  elad   nop.i 0;;
     93  1.2.4.2  elad } { .mfi
     94  1.2.4.2  elad   nop.m 0
     95  1.2.4.2  elad   // Step (4)
     96  1.2.4.2  elad   // q1 = q0 + e0 * q0 in f10
     97  1.2.4.2  elad   (p6) fma.s1 f10=f9,f10,f10
     98  1.2.4.2  elad   nop.i 0
     99  1.2.4.2  elad } { .mfi
    100  1.2.4.2  elad   nop.m 0
    101  1.2.4.2  elad   // Step (5)
    102  1.2.4.2  elad   // e1 = e0 * e0 in f11
    103  1.2.4.2  elad   (p6) fma.s1 f11=f9,f9,f0
    104  1.2.4.2  elad   nop.i 0;;
    105  1.2.4.2  elad } { .mfi
    106  1.2.4.2  elad   nop.m 0
    107  1.2.4.2  elad   // Step (6)
    108  1.2.4.2  elad   // y1 = y0 + e0 * y0 in f8
    109  1.2.4.2  elad   (p6) fma.s1 f8=f9,f8,f8
    110  1.2.4.2  elad   nop.i 0;;
    111  1.2.4.2  elad } { .mfi
    112  1.2.4.2  elad   nop.m 0
    113  1.2.4.2  elad   // Step (7)
    114  1.2.4.2  elad   // q2 = q1 + e1 * q1 in f9
    115  1.2.4.2  elad   (p6) fma.s1 f9=f11,f10,f10
    116  1.2.4.2  elad   nop.i 0;;
    117  1.2.4.2  elad } { .mfi
    118  1.2.4.2  elad   nop.m 0
    119  1.2.4.2  elad   // Step (8)
    120  1.2.4.2  elad   // y2 = y1 + e1 * y1 in f8
    121  1.2.4.2  elad   (p6) fma.s1 f8=f11,f8,f8
    122  1.2.4.2  elad   nop.i 0;;
    123  1.2.4.2  elad } { .mfi
    124  1.2.4.2  elad   nop.m 0
    125  1.2.4.2  elad   // Step (9)
    126  1.2.4.2  elad   // r2 = a - b * q2 in f10
    127  1.2.4.2  elad   (p6) fnma.s1 f10=f7,f9,f6
    128  1.2.4.2  elad   nop.i 0;;
    129  1.2.4.2  elad } { .mfi
    130  1.2.4.2  elad   setf.sig f7=r33
    131  1.2.4.2  elad   // Step (10)
    132  1.2.4.2  elad   // q3 = q2 + r2 * y2 in f8
    133  1.2.4.2  elad   (p6) fma.s1 f8=f10,f8,f9
    134  1.2.4.2  elad   nop.i 0;;
    135  1.2.4.2  elad } { .mfi
    136  1.2.4.2  elad   nop.m 0
    137  1.2.4.2  elad   // (11) q = trunc(q3)
    138  1.2.4.2  elad   fcvt.fx.trunc.s1 f8=f8
    139  1.2.4.2  elad   nop.i 0;;
    140  1.2.4.2  elad } { .mfi
    141  1.2.4.2  elad   nop.m 0
    142  1.2.4.2  elad   // (12) r = a + (-b) * q
    143  1.2.4.2  elad   xma.l f8=f8,f7,f12
    144  1.2.4.2  elad   nop.i 0;;
    145  1.2.4.2  elad }  { .mib
    146  1.2.4.2  elad   getf.sig r8=f8
    147  1.2.4.2  elad   nop.i 0
    148  1.2.4.2  elad   nop.b 0
    149  1.2.4.2  elad }
    150  1.2.4.2  elad 
    151  1.2.4.2  elad   // 64-BIT SIGNED INTEGER REMAINDER ENDS HERE
    152  1.2.4.2  elad 
    153  1.2.4.2  elad { .mib
    154  1.2.4.2  elad   nop.m 0
    155  1.2.4.2  elad   nop.i 0
    156  1.2.4.2  elad   br.ret.sptk b0;;
    157  1.2.4.2  elad }
    158  1.2.4.2  elad 
    159  1.2.4.2  elad .endp __moddi3
    160