Home | History | Annotate | Line # | Download | only in i386
fma4intrin.h revision 1.1.1.1.8.2
      1  1.1.1.1.8.2  tls /* Copyright (C) 2007, 2008, 2009 Free Software Foundation, Inc.
      2  1.1.1.1.8.2  tls 
      3  1.1.1.1.8.2  tls    This file is part of GCC.
      4  1.1.1.1.8.2  tls 
      5  1.1.1.1.8.2  tls    GCC is free software; you can redistribute it and/or modify
      6  1.1.1.1.8.2  tls    it under the terms of the GNU General Public License as published by
      7  1.1.1.1.8.2  tls    the Free Software Foundation; either version 3, or (at your option)
      8  1.1.1.1.8.2  tls    any later version.
      9  1.1.1.1.8.2  tls 
     10  1.1.1.1.8.2  tls    GCC is distributed in the hope that it will be useful,
     11  1.1.1.1.8.2  tls    but WITHOUT ANY WARRANTY; without even the implied warranty of
     12  1.1.1.1.8.2  tls    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
     13  1.1.1.1.8.2  tls    GNU General Public License for more details.
     14  1.1.1.1.8.2  tls 
     15  1.1.1.1.8.2  tls    Under Section 7 of GPL version 3, you are granted additional
     16  1.1.1.1.8.2  tls    permissions described in the GCC Runtime Library Exception, version
     17  1.1.1.1.8.2  tls    3.1, as published by the Free Software Foundation.
     18  1.1.1.1.8.2  tls 
     19  1.1.1.1.8.2  tls    You should have received a copy of the GNU General Public License and
     20  1.1.1.1.8.2  tls    a copy of the GCC Runtime Library Exception along with this program;
     21  1.1.1.1.8.2  tls    see the files COPYING3 and COPYING.RUNTIME respectively.  If not, see
     22  1.1.1.1.8.2  tls    <http://www.gnu.org/licenses/>.  */
     23  1.1.1.1.8.2  tls 
     24  1.1.1.1.8.2  tls #ifndef _X86INTRIN_H_INCLUDED
     25  1.1.1.1.8.2  tls # error "Never use <fma4intrin.h> directly; include <x86intrin.h> instead."
     26  1.1.1.1.8.2  tls #endif
     27  1.1.1.1.8.2  tls 
     28  1.1.1.1.8.2  tls #ifndef _FMA4INTRIN_H_INCLUDED
     29  1.1.1.1.8.2  tls #define _FMA4INTRIN_H_INCLUDED
     30  1.1.1.1.8.2  tls 
     31  1.1.1.1.8.2  tls #ifndef __FMA4__
     32  1.1.1.1.8.2  tls # error "FMA4 instruction set not enabled"
     33  1.1.1.1.8.2  tls #else
     34  1.1.1.1.8.2  tls 
     35  1.1.1.1.8.2  tls /* We need definitions from the SSE4A, SSE3, SSE2 and SSE header files.  */
     36  1.1.1.1.8.2  tls #include <ammintrin.h>
     37  1.1.1.1.8.2  tls 
     38  1.1.1.1.8.2  tls /* 128b Floating point multiply/add type instructions.  */
     39  1.1.1.1.8.2  tls extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
     40  1.1.1.1.8.2  tls _mm_macc_ps (__m128 __A, __m128 __B, __m128 __C)
     41  1.1.1.1.8.2  tls {
     42  1.1.1.1.8.2  tls   return (__m128) __builtin_ia32_vfmaddps ((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
     43  1.1.1.1.8.2  tls }
     44  1.1.1.1.8.2  tls 
     45  1.1.1.1.8.2  tls extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
     46  1.1.1.1.8.2  tls _mm_macc_pd (__m128d __A, __m128d __B, __m128d __C)
     47  1.1.1.1.8.2  tls {
     48  1.1.1.1.8.2  tls   return (__m128d) __builtin_ia32_vfmaddpd ((__v2df)__A, (__v2df)__B, (__v2df)__C);
     49  1.1.1.1.8.2  tls }
     50  1.1.1.1.8.2  tls 
     51  1.1.1.1.8.2  tls extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
     52  1.1.1.1.8.2  tls _mm_macc_ss (__m128 __A, __m128 __B, __m128 __C)
     53  1.1.1.1.8.2  tls {
     54  1.1.1.1.8.2  tls   return (__m128) __builtin_ia32_vfmaddss ((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
     55  1.1.1.1.8.2  tls }
     56  1.1.1.1.8.2  tls 
     57  1.1.1.1.8.2  tls extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
     58  1.1.1.1.8.2  tls _mm_macc_sd (__m128d __A, __m128d __B, __m128d __C)
     59  1.1.1.1.8.2  tls {
     60  1.1.1.1.8.2  tls   return (__m128d) __builtin_ia32_vfmaddsd ((__v2df)__A, (__v2df)__B, (__v2df)__C);
     61  1.1.1.1.8.2  tls }
     62  1.1.1.1.8.2  tls 
     63  1.1.1.1.8.2  tls extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
     64  1.1.1.1.8.2  tls _mm_msub_ps (__m128 __A, __m128 __B, __m128 __C)
     65  1.1.1.1.8.2  tls 
     66  1.1.1.1.8.2  tls {
     67  1.1.1.1.8.2  tls   return (__m128) __builtin_ia32_vfmsubps ((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
     68  1.1.1.1.8.2  tls }
     69  1.1.1.1.8.2  tls 
     70  1.1.1.1.8.2  tls extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
     71  1.1.1.1.8.2  tls _mm_msub_pd (__m128d __A, __m128d __B, __m128d __C)
     72  1.1.1.1.8.2  tls {
     73  1.1.1.1.8.2  tls   return (__m128d) __builtin_ia32_vfmsubpd ((__v2df)__A, (__v2df)__B, (__v2df)__C);
     74  1.1.1.1.8.2  tls }
     75  1.1.1.1.8.2  tls 
     76  1.1.1.1.8.2  tls extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
     77  1.1.1.1.8.2  tls _mm_msub_ss (__m128 __A, __m128 __B, __m128 __C)
     78  1.1.1.1.8.2  tls {
     79  1.1.1.1.8.2  tls   return (__m128) __builtin_ia32_vfmsubss ((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
     80  1.1.1.1.8.2  tls }
     81  1.1.1.1.8.2  tls 
     82  1.1.1.1.8.2  tls extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
     83  1.1.1.1.8.2  tls _mm_msub_sd (__m128d __A, __m128d __B, __m128d __C)
     84  1.1.1.1.8.2  tls {
     85  1.1.1.1.8.2  tls   return (__m128d) __builtin_ia32_vfmsubsd ((__v2df)__A, (__v2df)__B, (__v2df)__C);
     86  1.1.1.1.8.2  tls }
     87  1.1.1.1.8.2  tls 
     88  1.1.1.1.8.2  tls extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
     89  1.1.1.1.8.2  tls _mm_nmacc_ps (__m128 __A, __m128 __B, __m128 __C)
     90  1.1.1.1.8.2  tls {
     91  1.1.1.1.8.2  tls   return (__m128) __builtin_ia32_vfnmaddps ((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
     92  1.1.1.1.8.2  tls }
     93  1.1.1.1.8.2  tls 
     94  1.1.1.1.8.2  tls extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
     95  1.1.1.1.8.2  tls _mm_nmacc_pd (__m128d __A, __m128d __B, __m128d __C)
     96  1.1.1.1.8.2  tls {
     97  1.1.1.1.8.2  tls   return (__m128d) __builtin_ia32_vfnmaddpd ((__v2df)__A, (__v2df)__B, (__v2df)__C);
     98  1.1.1.1.8.2  tls }
     99  1.1.1.1.8.2  tls 
    100  1.1.1.1.8.2  tls extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    101  1.1.1.1.8.2  tls _mm_nmacc_ss (__m128 __A, __m128 __B, __m128 __C)
    102  1.1.1.1.8.2  tls {
    103  1.1.1.1.8.2  tls   return (__m128) __builtin_ia32_vfnmaddss ((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
    104  1.1.1.1.8.2  tls }
    105  1.1.1.1.8.2  tls 
    106  1.1.1.1.8.2  tls extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    107  1.1.1.1.8.2  tls _mm_nmacc_sd (__m128d __A, __m128d __B, __m128d __C)
    108  1.1.1.1.8.2  tls {
    109  1.1.1.1.8.2  tls   return (__m128d) __builtin_ia32_vfnmaddsd ((__v2df)__A, (__v2df)__B, (__v2df)__C);
    110  1.1.1.1.8.2  tls }
    111  1.1.1.1.8.2  tls 
    112  1.1.1.1.8.2  tls extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    113  1.1.1.1.8.2  tls _mm_nmsub_ps (__m128 __A, __m128 __B, __m128 __C)
    114  1.1.1.1.8.2  tls {
    115  1.1.1.1.8.2  tls   return (__m128) __builtin_ia32_vfnmsubps ((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
    116  1.1.1.1.8.2  tls }
    117  1.1.1.1.8.2  tls 
    118  1.1.1.1.8.2  tls extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    119  1.1.1.1.8.2  tls _mm_nmsub_pd (__m128d __A, __m128d __B, __m128d __C)
    120  1.1.1.1.8.2  tls {
    121  1.1.1.1.8.2  tls   return (__m128d) __builtin_ia32_vfnmsubpd ((__v2df)__A, (__v2df)__B, (__v2df)__C);
    122  1.1.1.1.8.2  tls }
    123  1.1.1.1.8.2  tls 
    124  1.1.1.1.8.2  tls extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    125  1.1.1.1.8.2  tls _mm_nmsub_ss (__m128 __A, __m128 __B, __m128 __C)
    126  1.1.1.1.8.2  tls {
    127  1.1.1.1.8.2  tls   return (__m128) __builtin_ia32_vfnmsubss ((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
    128  1.1.1.1.8.2  tls }
    129  1.1.1.1.8.2  tls 
    130  1.1.1.1.8.2  tls extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    131  1.1.1.1.8.2  tls _mm_nmsub_sd (__m128d __A, __m128d __B, __m128d __C)
    132  1.1.1.1.8.2  tls {
    133  1.1.1.1.8.2  tls   return (__m128d) __builtin_ia32_vfnmsubsd ((__v2df)__A, (__v2df)__B, (__v2df)__C);
    134  1.1.1.1.8.2  tls }
    135  1.1.1.1.8.2  tls 
    136  1.1.1.1.8.2  tls extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    137  1.1.1.1.8.2  tls _mm_maddsub_ps (__m128 __A, __m128 __B, __m128 __C)
    138  1.1.1.1.8.2  tls {
    139  1.1.1.1.8.2  tls   return (__m128) __builtin_ia32_vfmaddsubps ((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
    140  1.1.1.1.8.2  tls }
    141  1.1.1.1.8.2  tls 
    142  1.1.1.1.8.2  tls extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    143  1.1.1.1.8.2  tls _mm_maddsub_pd (__m128d __A, __m128d __B, __m128d __C)
    144  1.1.1.1.8.2  tls {
    145  1.1.1.1.8.2  tls   return (__m128d) __builtin_ia32_vfmaddsubpd ((__v2df)__A, (__v2df)__B, (__v2df)__C);
    146  1.1.1.1.8.2  tls }
    147  1.1.1.1.8.2  tls 
    148  1.1.1.1.8.2  tls extern __inline __m128 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    149  1.1.1.1.8.2  tls _mm_msubadd_ps (__m128 __A, __m128 __B, __m128 __C)
    150  1.1.1.1.8.2  tls {
    151  1.1.1.1.8.2  tls   return (__m128) __builtin_ia32_vfmsubaddps ((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
    152  1.1.1.1.8.2  tls }
    153  1.1.1.1.8.2  tls 
    154  1.1.1.1.8.2  tls extern __inline __m128d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    155  1.1.1.1.8.2  tls _mm_msubadd_pd (__m128d __A, __m128d __B, __m128d __C)
    156  1.1.1.1.8.2  tls {
    157  1.1.1.1.8.2  tls   return (__m128d) __builtin_ia32_vfmsubaddpd ((__v2df)__A, (__v2df)__B, (__v2df)__C);
    158  1.1.1.1.8.2  tls }
    159  1.1.1.1.8.2  tls 
    160  1.1.1.1.8.2  tls /* 256b Floating point multiply/add type instructions.  */
    161  1.1.1.1.8.2  tls extern __inline __m256 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    162  1.1.1.1.8.2  tls _mm256_macc_ps (__m256 __A, __m256 __B, __m256 __C)
    163  1.1.1.1.8.2  tls {
    164  1.1.1.1.8.2  tls   return (__m256) __builtin_ia32_vfmaddps256 ((__v8sf)__A, (__v8sf)__B, (__v8sf)__C);
    165  1.1.1.1.8.2  tls }
    166  1.1.1.1.8.2  tls 
    167  1.1.1.1.8.2  tls extern __inline __m256d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    168  1.1.1.1.8.2  tls _mm256_macc_pd (__m256d __A, __m256d __B, __m256d __C)
    169  1.1.1.1.8.2  tls {
    170  1.1.1.1.8.2  tls   return (__m256d) __builtin_ia32_vfmaddpd256 ((__v4df)__A, (__v4df)__B, (__v4df)__C);
    171  1.1.1.1.8.2  tls }
    172  1.1.1.1.8.2  tls 
    173  1.1.1.1.8.2  tls extern __inline __m256 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    174  1.1.1.1.8.2  tls _mm256_msub_ps (__m256 __A, __m256 __B, __m256 __C)
    175  1.1.1.1.8.2  tls 
    176  1.1.1.1.8.2  tls {
    177  1.1.1.1.8.2  tls   return (__m256) __builtin_ia32_vfmsubps256 ((__v8sf)__A, (__v8sf)__B, (__v8sf)__C);
    178  1.1.1.1.8.2  tls }
    179  1.1.1.1.8.2  tls 
    180  1.1.1.1.8.2  tls extern __inline __m256d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    181  1.1.1.1.8.2  tls _mm256_msub_pd (__m256d __A, __m256d __B, __m256d __C)
    182  1.1.1.1.8.2  tls {
    183  1.1.1.1.8.2  tls   return (__m256d) __builtin_ia32_vfmsubpd256 ((__v4df)__A, (__v4df)__B, (__v4df)__C);
    184  1.1.1.1.8.2  tls }
    185  1.1.1.1.8.2  tls 
    186  1.1.1.1.8.2  tls extern __inline __m256 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    187  1.1.1.1.8.2  tls _mm256_nmacc_ps (__m256 __A, __m256 __B, __m256 __C)
    188  1.1.1.1.8.2  tls {
    189  1.1.1.1.8.2  tls   return (__m256) __builtin_ia32_vfnmaddps256 ((__v8sf)__A, (__v8sf)__B, (__v8sf)__C);
    190  1.1.1.1.8.2  tls }
    191  1.1.1.1.8.2  tls 
    192  1.1.1.1.8.2  tls extern __inline __m256d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    193  1.1.1.1.8.2  tls _mm256_nmacc_pd (__m256d __A, __m256d __B, __m256d __C)
    194  1.1.1.1.8.2  tls {
    195  1.1.1.1.8.2  tls   return (__m256d) __builtin_ia32_vfnmaddpd256 ((__v4df)__A, (__v4df)__B, (__v4df)__C);
    196  1.1.1.1.8.2  tls }
    197  1.1.1.1.8.2  tls 
    198  1.1.1.1.8.2  tls extern __inline __m256 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    199  1.1.1.1.8.2  tls _mm256_nmsub_ps (__m256 __A, __m256 __B, __m256 __C)
    200  1.1.1.1.8.2  tls {
    201  1.1.1.1.8.2  tls   return (__m256) __builtin_ia32_vfnmsubps256 ((__v8sf)__A, (__v8sf)__B, (__v8sf)__C);
    202  1.1.1.1.8.2  tls }
    203  1.1.1.1.8.2  tls 
    204  1.1.1.1.8.2  tls extern __inline __m256d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    205  1.1.1.1.8.2  tls _mm256_nmsub_pd (__m256d __A, __m256d __B, __m256d __C)
    206  1.1.1.1.8.2  tls {
    207  1.1.1.1.8.2  tls   return (__m256d) __builtin_ia32_vfnmsubpd256 ((__v4df)__A, (__v4df)__B, (__v4df)__C);
    208  1.1.1.1.8.2  tls }
    209  1.1.1.1.8.2  tls 
    210  1.1.1.1.8.2  tls extern __inline __m256 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    211  1.1.1.1.8.2  tls _mm256_maddsub_ps (__m256 __A, __m256 __B, __m256 __C)
    212  1.1.1.1.8.2  tls {
    213  1.1.1.1.8.2  tls   return (__m256) __builtin_ia32_vfmaddsubps256 ((__v8sf)__A, (__v8sf)__B, (__v8sf)__C);
    214  1.1.1.1.8.2  tls }
    215  1.1.1.1.8.2  tls 
    216  1.1.1.1.8.2  tls extern __inline __m256d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    217  1.1.1.1.8.2  tls _mm256_maddsub_pd (__m256d __A, __m256d __B, __m256d __C)
    218  1.1.1.1.8.2  tls {
    219  1.1.1.1.8.2  tls   return (__m256d) __builtin_ia32_vfmaddsubpd256 ((__v4df)__A, (__v4df)__B, (__v4df)__C);
    220  1.1.1.1.8.2  tls }
    221  1.1.1.1.8.2  tls 
    222  1.1.1.1.8.2  tls extern __inline __m256 __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    223  1.1.1.1.8.2  tls _mm256_msubadd_ps (__m256 __A, __m256 __B, __m256 __C)
    224  1.1.1.1.8.2  tls {
    225  1.1.1.1.8.2  tls   return (__m256) __builtin_ia32_vfmsubaddps256 ((__v8sf)__A, (__v8sf)__B, (__v8sf)__C);
    226  1.1.1.1.8.2  tls }
    227  1.1.1.1.8.2  tls 
    228  1.1.1.1.8.2  tls extern __inline __m256d __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    229  1.1.1.1.8.2  tls _mm256_msubadd_pd (__m256d __A, __m256d __B, __m256d __C)
    230  1.1.1.1.8.2  tls {
    231  1.1.1.1.8.2  tls   return (__m256d) __builtin_ia32_vfmsubaddpd256 ((__v4df)__A, (__v4df)__B, (__v4df)__C);
    232  1.1.1.1.8.2  tls }
    233  1.1.1.1.8.2  tls 
    234  1.1.1.1.8.2  tls #endif
    235  1.1.1.1.8.2  tls 
    236  1.1.1.1.8.2  tls #endif
    237