config/rs6000/smmintrin.h

1.1.1.3  mrg /* Copyright (C) 2018-2022 Free Software Foundation, Inc.
    1.1  mrg
    1.1  mrg    This file is part of GCC.
    1.1  mrg
    1.1  mrg    GCC is free software; you can redistribute it and/or modify
    1.1  mrg    it under the terms of the GNU General Public License as published by
    1.1  mrg    the Free Software Foundation; either version 3, or (at your option)
    1.1  mrg    any later version.
    1.1  mrg
    1.1  mrg    GCC is distributed in the hope that it will be useful,
    1.1  mrg    but WITHOUT ANY WARRANTY; without even the implied warranty of
    1.1  mrg    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
    1.1  mrg    GNU General Public License for more details.
    1.1  mrg
    1.1  mrg    Under Section 7 of GPL version 3, you are granted additional
    1.1  mrg    permissions described in the GCC Runtime Library Exception, version
    1.1  mrg    3.1, as published by the Free Software Foundation.
    1.1  mrg
    1.1  mrg    You should have received a copy of the GNU General Public License and
    1.1  mrg    a copy of the GCC Runtime Library Exception along with this program;
    1.1  mrg    see the files COPYING3 and COPYING.RUNTIME respectively.  If not, see
    1.1  mrg    <http://www.gnu.org/licenses/>.  */
    1.1  mrg
    1.1  mrg /* Implemented from the specification included in the Intel C++ Compiler
    1.1  mrg    User Guide and Reference, version 9.0.
    1.1  mrg
    1.1  mrg    NOTE: This is NOT a complete implementation of the SSE4 intrinsics!  */
    1.1  mrg
    1.1  mrg #ifndef NO_WARN_X86_INTRINSICS
    1.1  mrg /* This header is distributed to simplify porting x86_64 code that
    1.1  mrg    makes explicit use of Intel intrinsics to powerpc64le.
    1.1  mrg    It is the user's responsibility to determine if the results are
    1.1  mrg    acceptable and make additional changes as necessary.
    1.1  mrg    Note that much code that uses Intel intrinsics can be rewritten in
    1.1  mrg    standard C or GNU C extensions, which are more portable and better
    1.1  mrg    optimized across multiple targets.  */
    1.1  mrg #endif
    1.1  mrg
    1.1  mrg #ifndef SMMINTRIN_H_
    1.1  mrg #define SMMINTRIN_H_
    1.1  mrg
    1.1  mrg #include <altivec.h>
    1.1  mrg #include <tmmintrin.h>
    1.1  mrg
1.1.1.3  mrg /* Rounding mode macros. */
1.1.1.3  mrg #define _MM_FROUND_TO_NEAREST_INT       0x00
1.1.1.3  mrg #define _MM_FROUND_TO_ZERO              0x01
1.1.1.3  mrg #define _MM_FROUND_TO_POS_INF           0x02
1.1.1.3  mrg #define _MM_FROUND_TO_NEG_INF           0x03
1.1.1.3  mrg #define _MM_FROUND_CUR_DIRECTION        0x04
1.1.1.3  mrg
1.1.1.3  mrg #define _MM_FROUND_NINT		\
1.1.1.3  mrg   (_MM_FROUND_TO_NEAREST_INT | _MM_FROUND_RAISE_EXC)
1.1.1.3  mrg #define _MM_FROUND_FLOOR	\
1.1.1.3  mrg   (_MM_FROUND_TO_NEG_INF | _MM_FROUND_RAISE_EXC)
1.1.1.3  mrg #define _MM_FROUND_CEIL		\
1.1.1.3  mrg   (_MM_FROUND_TO_POS_INF | _MM_FROUND_RAISE_EXC)
1.1.1.3  mrg #define _MM_FROUND_TRUNC	\
1.1.1.3  mrg   (_MM_FROUND_TO_ZERO | _MM_FROUND_RAISE_EXC)
1.1.1.3  mrg #define _MM_FROUND_RINT		\
1.1.1.3  mrg   (_MM_FROUND_CUR_DIRECTION | _MM_FROUND_RAISE_EXC)
1.1.1.3  mrg #define _MM_FROUND_NEARBYINT	\
1.1.1.3  mrg   (_MM_FROUND_CUR_DIRECTION | _MM_FROUND_NO_EXC)
1.1.1.3  mrg
1.1.1.3  mrg #define _MM_FROUND_RAISE_EXC            0x00
1.1.1.3  mrg #define _MM_FROUND_NO_EXC               0x08
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128d
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_round_pd (__m128d __A, int __rounding)
1.1.1.3  mrg {
1.1.1.3  mrg   __v2df __r;
1.1.1.3  mrg   union {
1.1.1.3  mrg     double __fr;
1.1.1.3  mrg     long long __fpscr;
1.1.1.3  mrg   } __enables_save, __fpscr_save;
1.1.1.3  mrg
1.1.1.3  mrg   if (__rounding & _MM_FROUND_NO_EXC)
1.1.1.3  mrg     {
1.1.1.3  mrg       /* Save enabled exceptions, disable all exceptions,
1.1.1.3  mrg 	 and preserve the rounding mode.  */
1.1.1.3  mrg #ifdef _ARCH_PWR9
1.1.1.3  mrg       __asm__ ("mffsce %0" : "=f" (__fpscr_save.__fr));
1.1.1.3  mrg       __enables_save.__fpscr = __fpscr_save.__fpscr & 0xf8;
1.1.1.3  mrg #else
1.1.1.3  mrg       __fpscr_save.__fr = __builtin_mffs ();
1.1.1.3  mrg       __enables_save.__fpscr = __fpscr_save.__fpscr & 0xf8;
1.1.1.3  mrg       __fpscr_save.__fpscr &= ~0xf8;
1.1.1.3  mrg       __builtin_mtfsf (0b00000011, __fpscr_save.__fr);
1.1.1.3  mrg #endif
1.1.1.3  mrg       /* Insert an artificial "read/write" reference to the variable
1.1.1.3  mrg 	 read below, to ensure the compiler does not schedule
1.1.1.3  mrg 	 a read/use of the variable before the FPSCR is modified, above.
1.1.1.3  mrg 	 This can be removed if and when GCC PR102783 is fixed.
1.1.1.3  mrg        */
1.1.1.3  mrg       __asm__ ("" : "+wa" (__A));
1.1.1.3  mrg     }
1.1.1.3  mrg
1.1.1.3  mrg   switch (__rounding)
1.1.1.3  mrg     {
1.1.1.3  mrg       case _MM_FROUND_TO_NEAREST_INT:
1.1.1.3  mrg 	__fpscr_save.__fr = __builtin_mffsl ();
1.1.1.3  mrg 	__attribute__ ((fallthrough));
1.1.1.3  mrg       case _MM_FROUND_TO_NEAREST_INT | _MM_FROUND_NO_EXC:
1.1.1.3  mrg 	__builtin_set_fpscr_rn (0b00);
1.1.1.3  mrg 	/* Insert an artificial "read/write" reference to the variable
1.1.1.3  mrg 	   read below, to ensure the compiler does not schedule
1.1.1.3  mrg 	   a read/use of the variable before the FPSCR is modified, above.
1.1.1.3  mrg 	   This can be removed if and when GCC PR102783 is fixed.
1.1.1.3  mrg 	 */
1.1.1.3  mrg 	__asm__ ("" : "+wa" (__A));
1.1.1.3  mrg
1.1.1.3  mrg 	__r = vec_rint ((__v2df) __A);
1.1.1.3  mrg
1.1.1.3  mrg 	/* Insert an artificial "read" reference to the variable written
1.1.1.3  mrg 	   above, to ensure the compiler does not schedule the computation
1.1.1.3  mrg 	   of the value after the manipulation of the FPSCR, below.
1.1.1.3  mrg 	   This can be removed if and when GCC PR102783 is fixed.
1.1.1.3  mrg 	 */
1.1.1.3  mrg 	__asm__ ("" : : "wa" (__r));
1.1.1.3  mrg 	__builtin_set_fpscr_rn (__fpscr_save.__fpscr);
1.1.1.3  mrg 	break;
1.1.1.3  mrg       case _MM_FROUND_TO_NEG_INF:
1.1.1.3  mrg       case _MM_FROUND_TO_NEG_INF | _MM_FROUND_NO_EXC:
1.1.1.3  mrg 	__r = vec_floor ((__v2df) __A);
1.1.1.3  mrg 	break;
1.1.1.3  mrg       case _MM_FROUND_TO_POS_INF:
1.1.1.3  mrg       case _MM_FROUND_TO_POS_INF | _MM_FROUND_NO_EXC:
1.1.1.3  mrg 	__r = vec_ceil ((__v2df) __A);
1.1.1.3  mrg 	break;
1.1.1.3  mrg       case _MM_FROUND_TO_ZERO:
1.1.1.3  mrg       case _MM_FROUND_TO_ZERO | _MM_FROUND_NO_EXC:
1.1.1.3  mrg 	__r = vec_trunc ((__v2df) __A);
1.1.1.3  mrg 	break;
1.1.1.3  mrg       case _MM_FROUND_CUR_DIRECTION:
1.1.1.3  mrg 	__r = vec_rint ((__v2df) __A);
1.1.1.3  mrg 	break;
1.1.1.3  mrg     }
1.1.1.3  mrg   if (__rounding & _MM_FROUND_NO_EXC)
1.1.1.3  mrg     {
1.1.1.3  mrg       /* Insert an artificial "read" reference to the variable written
1.1.1.3  mrg 	 above, to ensure the compiler does not schedule the computation
1.1.1.3  mrg 	 of the value after the manipulation of the FPSCR, below.
1.1.1.3  mrg 	 This can be removed if and when GCC PR102783 is fixed.
1.1.1.3  mrg        */
1.1.1.3  mrg       __asm__ ("" : : "wa" (__r));
1.1.1.3  mrg       /* Restore enabled exceptions.  */
1.1.1.3  mrg       __fpscr_save.__fr = __builtin_mffsl ();
1.1.1.3  mrg       __fpscr_save.__fpscr |= __enables_save.__fpscr;
1.1.1.3  mrg       __builtin_mtfsf (0b00000011, __fpscr_save.__fr);
1.1.1.3  mrg     }
1.1.1.3  mrg   return (__m128d) __r;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128d
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_round_sd (__m128d __A, __m128d __B, int __rounding)
1.1.1.3  mrg {
1.1.1.3  mrg   __B = _mm_round_pd (__B, __rounding);
1.1.1.3  mrg   __v2df __r = { ((__v2df) __B)[0], ((__v2df) __A)[1] };
1.1.1.3  mrg   return (__m128d) __r;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_round_ps (__m128 __A, int __rounding)
1.1.1.3  mrg {
1.1.1.3  mrg   __v4sf __r;
1.1.1.3  mrg   union {
1.1.1.3  mrg     double __fr;
1.1.1.3  mrg     long long __fpscr;
1.1.1.3  mrg   } __enables_save, __fpscr_save;
1.1.1.3  mrg
1.1.1.3  mrg   if (__rounding & _MM_FROUND_NO_EXC)
1.1.1.3  mrg     {
1.1.1.3  mrg       /* Save enabled exceptions, disable all exceptions,
1.1.1.3  mrg 	 and preserve the rounding mode.  */
1.1.1.3  mrg #ifdef _ARCH_PWR9
1.1.1.3  mrg       __asm__ ("mffsce %0" : "=f" (__fpscr_save.__fr));
1.1.1.3  mrg       __enables_save.__fpscr = __fpscr_save.__fpscr & 0xf8;
1.1.1.3  mrg #else
1.1.1.3  mrg       __fpscr_save.__fr = __builtin_mffs ();
1.1.1.3  mrg       __enables_save.__fpscr = __fpscr_save.__fpscr & 0xf8;
1.1.1.3  mrg       __fpscr_save.__fpscr &= ~0xf8;
1.1.1.3  mrg       __builtin_mtfsf (0b00000011, __fpscr_save.__fr);
1.1.1.3  mrg #endif
1.1.1.3  mrg       /* Insert an artificial "read/write" reference to the variable
1.1.1.3  mrg 	 read below, to ensure the compiler does not schedule
1.1.1.3  mrg 	 a read/use of the variable before the FPSCR is modified, above.
1.1.1.3  mrg 	 This can be removed if and when GCC PR102783 is fixed.
1.1.1.3  mrg        */
1.1.1.3  mrg       __asm__ ("" : "+wa" (__A));
1.1.1.3  mrg     }
1.1.1.3  mrg
1.1.1.3  mrg   switch (__rounding)
1.1.1.3  mrg     {
1.1.1.3  mrg       case _MM_FROUND_TO_NEAREST_INT:
1.1.1.3  mrg 	__fpscr_save.__fr = __builtin_mffsl ();
1.1.1.3  mrg 	__attribute__ ((fallthrough));
1.1.1.3  mrg       case _MM_FROUND_TO_NEAREST_INT | _MM_FROUND_NO_EXC:
1.1.1.3  mrg 	__builtin_set_fpscr_rn (0b00);
1.1.1.3  mrg 	/* Insert an artificial "read/write" reference to the variable
1.1.1.3  mrg 	   read below, to ensure the compiler does not schedule
1.1.1.3  mrg 	   a read/use of the variable before the FPSCR is modified, above.
1.1.1.3  mrg 	   This can be removed if and when GCC PR102783 is fixed.
1.1.1.3  mrg 	 */
1.1.1.3  mrg 	__asm__ ("" : "+wa" (__A));
1.1.1.3  mrg
1.1.1.3  mrg 	__r = vec_rint ((__v4sf) __A);
1.1.1.3  mrg
1.1.1.3  mrg 	/* Insert an artificial "read" reference to the variable written
1.1.1.3  mrg 	   above, to ensure the compiler does not schedule the computation
1.1.1.3  mrg 	   of the value after the manipulation of the FPSCR, below.
1.1.1.3  mrg 	   This can be removed if and when GCC PR102783 is fixed.
1.1.1.3  mrg 	 */
1.1.1.3  mrg 	__asm__ ("" : : "wa" (__r));
1.1.1.3  mrg 	__builtin_set_fpscr_rn (__fpscr_save.__fpscr);
1.1.1.3  mrg 	break;
1.1.1.3  mrg       case _MM_FROUND_TO_NEG_INF:
1.1.1.3  mrg       case _MM_FROUND_TO_NEG_INF | _MM_FROUND_NO_EXC:
1.1.1.3  mrg 	__r = vec_floor ((__v4sf) __A);
1.1.1.3  mrg 	break;
1.1.1.3  mrg       case _MM_FROUND_TO_POS_INF:
1.1.1.3  mrg       case _MM_FROUND_TO_POS_INF | _MM_FROUND_NO_EXC:
1.1.1.3  mrg 	__r = vec_ceil ((__v4sf) __A);
1.1.1.3  mrg 	break;
1.1.1.3  mrg       case _MM_FROUND_TO_ZERO:
1.1.1.3  mrg       case _MM_FROUND_TO_ZERO | _MM_FROUND_NO_EXC:
1.1.1.3  mrg 	__r = vec_trunc ((__v4sf) __A);
1.1.1.3  mrg 	break;
1.1.1.3  mrg       case _MM_FROUND_CUR_DIRECTION:
1.1.1.3  mrg 	__r = vec_rint ((__v4sf) __A);
1.1.1.3  mrg 	break;
1.1.1.3  mrg     }
1.1.1.3  mrg   if (__rounding & _MM_FROUND_NO_EXC)
1.1.1.3  mrg     {
1.1.1.3  mrg       /* Insert an artificial "read" reference to the variable written
1.1.1.3  mrg 	 above, to ensure the compiler does not schedule the computation
1.1.1.3  mrg 	 of the value after the manipulation of the FPSCR, below.
1.1.1.3  mrg 	 This can be removed if and when GCC PR102783 is fixed.
1.1.1.3  mrg        */
1.1.1.3  mrg       __asm__ ("" : : "wa" (__r));
1.1.1.3  mrg       /* Restore enabled exceptions.  */
1.1.1.3  mrg       __fpscr_save.__fr = __builtin_mffsl ();
1.1.1.3  mrg       __fpscr_save.__fpscr |= __enables_save.__fpscr;
1.1.1.3  mrg       __builtin_mtfsf (0b00000011, __fpscr_save.__fr);
1.1.1.3  mrg     }
1.1.1.3  mrg   return (__m128) __r;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_round_ss (__m128 __A, __m128 __B, int __rounding)
1.1.1.3  mrg {
1.1.1.3  mrg   __B = _mm_round_ps (__B, __rounding);
1.1.1.3  mrg   __v4sf __r = (__v4sf) __A;
1.1.1.3  mrg   __r[0] = ((__v4sf) __B)[0];
1.1.1.3  mrg   return (__m128) __r;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg #define _mm_ceil_pd(V)	   _mm_round_pd ((V), _MM_FROUND_CEIL)
1.1.1.3  mrg #define _mm_ceil_sd(D, V)  _mm_round_sd ((D), (V), _MM_FROUND_CEIL)
1.1.1.3  mrg
1.1.1.3  mrg #define _mm_floor_pd(V)	   _mm_round_pd((V), _MM_FROUND_FLOOR)
1.1.1.3  mrg #define _mm_floor_sd(D, V) _mm_round_sd ((D), (V), _MM_FROUND_FLOOR)
1.1.1.3  mrg
1.1.1.3  mrg #define _mm_ceil_ps(V)	   _mm_round_ps ((V), _MM_FROUND_CEIL)
1.1.1.3  mrg #define _mm_ceil_ss(D, V)  _mm_round_ss ((D), (V), _MM_FROUND_CEIL)
1.1.1.3  mrg
1.1.1.3  mrg #define _mm_floor_ps(V)	   _mm_round_ps ((V), _MM_FROUND_FLOOR)
1.1.1.3  mrg #define _mm_floor_ss(D, V) _mm_round_ss ((D), (V), _MM_FROUND_FLOOR)
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_insert_epi8 (__m128i const __A, int const __D, int const __N)
1.1.1.3  mrg {
1.1.1.3  mrg   __v16qi __result = (__v16qi)__A;
1.1.1.3  mrg
1.1.1.3  mrg   __result [__N & 0xf] = __D;
1.1.1.3  mrg
1.1.1.3  mrg   return (__m128i) __result;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_insert_epi32 (__m128i const __A, int const __D, int const __N)
1.1.1.3  mrg {
1.1.1.3  mrg   __v4si __result = (__v4si)__A;
1.1.1.3  mrg
1.1.1.3  mrg   __result [__N & 3] = __D;
1.1.1.3  mrg
1.1.1.3  mrg   return (__m128i) __result;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_insert_epi64 (__m128i const __A, long long const __D, int const __N)
1.1.1.3  mrg {
1.1.1.3  mrg   __v2di __result = (__v2di)__A;
1.1.1.3  mrg
1.1.1.3  mrg   __result [__N & 1] = __D;
1.1.1.3  mrg
1.1.1.3  mrg   return (__m128i) __result;
1.1.1.3  mrg }
1.1.1.3  mrg
    1.1  mrg extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    1.1  mrg _mm_extract_epi8 (__m128i __X, const int __N)
    1.1  mrg {
    1.1  mrg   return (unsigned char) ((__v16qi)__X)[__N & 15];
    1.1  mrg }
    1.1  mrg
    1.1  mrg extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    1.1  mrg _mm_extract_epi32 (__m128i __X, const int __N)
    1.1  mrg {
    1.1  mrg   return ((__v4si)__X)[__N & 3];
    1.1  mrg }
    1.1  mrg
    1.1  mrg extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    1.1  mrg _mm_extract_epi64 (__m128i __X, const int __N)
    1.1  mrg {
    1.1  mrg   return ((__v2di)__X)[__N & 1];
    1.1  mrg }
    1.1  mrg
    1.1  mrg extern __inline int __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    1.1  mrg _mm_extract_ps (__m128 __X, const int __N)
    1.1  mrg {
    1.1  mrg   return ((__v4si)__X)[__N & 3];
    1.1  mrg }
    1.1  mrg
1.1.1.3  mrg #ifdef _ARCH_PWR8
    1.1  mrg extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    1.1  mrg _mm_blend_epi16 (__m128i __A, __m128i __B, const int __imm8)
    1.1  mrg {
    1.1  mrg   __v16qi __charmask = vec_splats ((signed char) __imm8);
    1.1  mrg   __charmask = vec_gb (__charmask);
    1.1  mrg   __v8hu __shortmask = (__v8hu) vec_unpackh (__charmask);
    1.1  mrg   #ifdef __BIG_ENDIAN__
    1.1  mrg   __shortmask = vec_reve (__shortmask);
    1.1  mrg   #endif
    1.1  mrg   return (__m128i) vec_sel ((__v8hu) __A, (__v8hu) __B, __shortmask);
    1.1  mrg }
1.1.1.3  mrg #endif
    1.1  mrg
    1.1  mrg extern __inline __m128i __attribute__((__gnu_inline__, __always_inline__, __artificial__))
    1.1  mrg _mm_blendv_epi8 (__m128i __A, __m128i __B, __m128i __mask)
    1.1  mrg {
1.1.1.3  mrg #ifdef _ARCH_PWR10
1.1.1.3  mrg   return (__m128i) vec_blendv ((__v16qi) __A, (__v16qi) __B, (__v16qu) __mask);
1.1.1.3  mrg #else
    1.1  mrg   const __v16qu __seven = vec_splats ((unsigned char) 0x07);
    1.1  mrg   __v16qu __lmask = vec_sra ((__v16qu) __mask, __seven);
1.1.1.3  mrg   return (__m128i) vec_sel ((__v16qi) __A, (__v16qi) __B, __lmask);
1.1.1.3  mrg #endif
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_blend_ps (__m128 __A, __m128 __B, const int __imm8)
1.1.1.3  mrg {
1.1.1.3  mrg   __v16qu __pcv[] =
1.1.1.3  mrg     {
1.1.1.3  mrg       {  0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15 },
1.1.1.3  mrg       { 16, 17, 18, 19,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15 },
1.1.1.3  mrg       {  0,  1,  2,  3, 20, 21, 22, 23,  8,  9, 10, 11, 12, 13, 14, 15 },
1.1.1.3  mrg       { 16, 17, 18, 19, 20, 21, 22, 23,  8,  9, 10, 11, 12, 13, 14, 15 },
1.1.1.3  mrg       {  0,  1,  2,  3,  4,  5,  6,  7, 24, 25, 26, 27, 12, 13, 14, 15 },
1.1.1.3  mrg       { 16, 17, 18, 19,  4,  5,  6,  7, 24, 25, 26, 27, 12, 13, 14, 15 },
1.1.1.3  mrg       {  0,  1,  2,  3, 20, 21, 22, 23, 24, 25, 26, 27, 12, 13, 14, 15 },
1.1.1.3  mrg       { 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 12, 13, 14, 15 },
1.1.1.3  mrg       {  0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 28, 29, 30, 31 },
1.1.1.3  mrg       { 16, 17, 18, 19,  4,  5,  6,  7,  8,  9, 10, 11, 28, 29, 30, 31 },
1.1.1.3  mrg       {  0,  1,  2,  3, 20, 21, 22, 23,  8,  9, 10, 11, 28, 29, 30, 31 },
1.1.1.3  mrg       { 16, 17, 18, 19, 20, 21, 22, 23,  8,  9, 10, 11, 28, 29, 30, 31 },
1.1.1.3  mrg       {  0,  1,  2,  3,  4,  5,  6,  7, 24, 25, 26, 27, 28, 29, 30, 31 },
1.1.1.3  mrg       { 16, 17, 18, 19,  4,  5,  6,  7, 24, 25, 26, 27, 28, 29, 30, 31 },
1.1.1.3  mrg       {  0,  1,  2,  3, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 },
1.1.1.3  mrg       { 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 },
1.1.1.3  mrg     };
1.1.1.3  mrg   __v16qu __r = vec_perm ((__v16qu) __A, (__v16qu)__B, __pcv[__imm8]);
1.1.1.3  mrg   return (__m128) __r;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_blendv_ps (__m128 __A, __m128 __B, __m128 __mask)
1.1.1.3  mrg {
1.1.1.3  mrg #ifdef _ARCH_PWR10
1.1.1.3  mrg   return (__m128) vec_blendv ((__v4sf) __A, (__v4sf) __B, (__v4su) __mask);
1.1.1.3  mrg #else
1.1.1.3  mrg   const __v4si __zero = {0};
1.1.1.3  mrg   const __vector __bool int __boolmask = vec_cmplt ((__v4si) __mask, __zero);
1.1.1.3  mrg   return (__m128) vec_sel ((__v4su) __A, (__v4su) __B, (__v4su) __boolmask);
1.1.1.3  mrg #endif
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128d
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_blend_pd (__m128d __A, __m128d __B, const int __imm8)
1.1.1.3  mrg {
1.1.1.3  mrg   __v16qu __pcv[] =
1.1.1.3  mrg     {
1.1.1.3  mrg       {  0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15 },
1.1.1.3  mrg       { 16, 17, 18, 19, 20, 21, 22, 23,  8,  9, 10, 11, 12, 13, 14, 15 },
1.1.1.3  mrg       {  0,  1,  2,  3,  4,  5,  6,  7, 24, 25, 26, 27, 28, 29, 30, 31 },
1.1.1.3  mrg       { 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31 }
1.1.1.3  mrg     };
1.1.1.3  mrg   __v16qu __r = vec_perm ((__v16qu) __A, (__v16qu)__B, __pcv[__imm8]);
1.1.1.3  mrg   return (__m128d) __r;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg #ifdef _ARCH_PWR8
1.1.1.3  mrg extern __inline __m128d
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_blendv_pd (__m128d __A, __m128d __B, __m128d __mask)
1.1.1.3  mrg {
1.1.1.3  mrg #ifdef _ARCH_PWR10
1.1.1.3  mrg   return (__m128d) vec_blendv ((__v2df) __A, (__v2df) __B, (__v2du) __mask);
1.1.1.3  mrg #else
1.1.1.3  mrg   const __v2di __zero = {0};
1.1.1.3  mrg   const __vector __bool long long __boolmask = vec_cmplt ((__v2di) __mask, __zero);
1.1.1.3  mrg   return (__m128d) vec_sel ((__v2du) __A, (__v2du) __B, (__v2du) __boolmask);
1.1.1.3  mrg #endif
1.1.1.3  mrg }
1.1.1.3  mrg #endif
1.1.1.3  mrg
1.1.1.3  mrg extern __inline int
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_testz_si128 (__m128i __A, __m128i __B)
1.1.1.3  mrg {
1.1.1.3  mrg   /* Note: This implementation does NOT set "zero" or "carry" flags.  */
1.1.1.3  mrg   const __v16qu __zero = {0};
1.1.1.3  mrg   return vec_all_eq (vec_and ((__v16qu) __A, (__v16qu) __B), __zero);
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline int
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_testc_si128 (__m128i __A, __m128i __B)
1.1.1.3  mrg {
1.1.1.3  mrg   /* Note: This implementation does NOT set "zero" or "carry" flags.  */
1.1.1.3  mrg   const __v16qu __zero = {0};
1.1.1.3  mrg   const __v16qu __notA = vec_nor ((__v16qu) __A, (__v16qu) __A);
1.1.1.3  mrg   return vec_all_eq (vec_and ((__v16qu) __notA, (__v16qu) __B), __zero);
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline int
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_testnzc_si128 (__m128i __A, __m128i __B)
1.1.1.3  mrg {
1.1.1.3  mrg   /* Note: This implementation does NOT set "zero" or "carry" flags.  */
1.1.1.3  mrg   return _mm_testz_si128 (__A, __B) == 0 && _mm_testc_si128 (__A, __B) == 0;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg #define _mm_test_all_zeros(M, V) _mm_testz_si128 ((M), (V))
1.1.1.3  mrg
1.1.1.3  mrg #define _mm_test_all_ones(V) \
1.1.1.3  mrg   _mm_testc_si128 ((V), _mm_cmpeq_epi32 ((V), (V)))
1.1.1.3  mrg
1.1.1.3  mrg #define _mm_test_mix_ones_zeros(M, V) _mm_testnzc_si128 ((M), (V))
1.1.1.3  mrg
1.1.1.3  mrg #ifdef _ARCH_PWR8
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_cmpeq_epi64 (__m128i __X, __m128i __Y)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_cmpeq ((__v2di) __X, (__v2di) __Y);
1.1.1.3  mrg }
1.1.1.3  mrg #endif
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_min_epi8 (__m128i __X, __m128i __Y)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_min ((__v16qi)__X, (__v16qi)__Y);
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_min_epu16 (__m128i __X, __m128i __Y)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_min ((__v8hu)__X, (__v8hu)__Y);
    1.1  mrg }
    1.1  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_min_epi32 (__m128i __X, __m128i __Y)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_min ((__v4si)__X, (__v4si)__Y);
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_min_epu32 (__m128i __X, __m128i __Y)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_min ((__v4su)__X, (__v4su)__Y);
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_max_epi8 (__m128i __X, __m128i __Y)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_max ((__v16qi)__X, (__v16qi)__Y);
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_max_epu16 (__m128i __X, __m128i __Y)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_max ((__v8hu)__X, (__v8hu)__Y);
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_max_epi32 (__m128i __X, __m128i __Y)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_max ((__v4si)__X, (__v4si)__Y);
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_max_epu32 (__m128i __X, __m128i __Y)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_max ((__v4su)__X, (__v4su)__Y);
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_mullo_epi32 (__m128i __X, __m128i __Y)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_mul ((__v4su) __X, (__v4su) __Y);
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg #ifdef _ARCH_PWR8
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_mul_epi32 (__m128i __X, __m128i __Y)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_mule ((__v4si) __X, (__v4si) __Y);
1.1.1.3  mrg }
1.1.1.3  mrg #endif
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_cvtepi8_epi16 (__m128i __A)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_unpackh ((__v16qi) __A);
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_cvtepi8_epi32 (__m128i __A)
1.1.1.3  mrg {
1.1.1.3  mrg   __A = (__m128i) vec_unpackh ((__v16qi) __A);
1.1.1.3  mrg   return (__m128i) vec_unpackh ((__v8hi) __A);
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg #ifdef _ARCH_PWR8
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_cvtepi8_epi64 (__m128i __A)
1.1.1.3  mrg {
1.1.1.3  mrg   __A = (__m128i) vec_unpackh ((__v16qi) __A);
1.1.1.3  mrg   __A = (__m128i) vec_unpackh ((__v8hi) __A);
1.1.1.3  mrg   return (__m128i) vec_unpackh ((__v4si) __A);
1.1.1.3  mrg }
1.1.1.3  mrg #endif
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_cvtepi16_epi32 (__m128i __A)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_unpackh ((__v8hi) __A);
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg #ifdef _ARCH_PWR8
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_cvtepi16_epi64 (__m128i __A)
1.1.1.3  mrg {
1.1.1.3  mrg   __A = (__m128i) vec_unpackh ((__v8hi) __A);
1.1.1.3  mrg   return (__m128i) vec_unpackh ((__v4si) __A);
1.1.1.3  mrg }
1.1.1.3  mrg #endif
1.1.1.3  mrg
1.1.1.3  mrg #ifdef _ARCH_PWR8
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_cvtepi32_epi64 (__m128i __A)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_unpackh ((__v4si) __A);
1.1.1.3  mrg }
1.1.1.3  mrg #endif
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_cvtepu8_epi16 (__m128i __A)
1.1.1.3  mrg {
1.1.1.3  mrg   const __v16qu __zero = {0};
1.1.1.3  mrg #ifdef __LITTLE_ENDIAN__
1.1.1.3  mrg   __A = (__m128i) vec_mergeh ((__v16qu) __A, __zero);
1.1.1.3  mrg #else /* __BIG_ENDIAN__.  */
1.1.1.3  mrg   __A = (__m128i) vec_mergeh (__zero, (__v16qu) __A);
1.1.1.3  mrg #endif /* __BIG_ENDIAN__.  */
1.1.1.3  mrg   return __A;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_cvtepu8_epi32 (__m128i __A)
1.1.1.3  mrg {
1.1.1.3  mrg   const __v16qu __zero = {0};
1.1.1.3  mrg #ifdef __LITTLE_ENDIAN__
1.1.1.3  mrg   __A = (__m128i) vec_mergeh ((__v16qu) __A, __zero);
1.1.1.3  mrg   __A = (__m128i) vec_mergeh ((__v8hu) __A, (__v8hu) __zero);
1.1.1.3  mrg #else /* __BIG_ENDIAN__.  */
1.1.1.3  mrg   __A = (__m128i) vec_mergeh (__zero, (__v16qu) __A);
1.1.1.3  mrg   __A = (__m128i) vec_mergeh ((__v8hu) __zero, (__v8hu) __A);
1.1.1.3  mrg #endif /* __BIG_ENDIAN__.  */
1.1.1.3  mrg   return __A;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_cvtepu8_epi64 (__m128i __A)
1.1.1.3  mrg {
1.1.1.3  mrg   const __v16qu __zero = {0};
1.1.1.3  mrg #ifdef __LITTLE_ENDIAN__
1.1.1.3  mrg   __A = (__m128i) vec_mergeh ((__v16qu) __A, __zero);
1.1.1.3  mrg   __A = (__m128i) vec_mergeh ((__v8hu) __A, (__v8hu) __zero);
1.1.1.3  mrg   __A = (__m128i) vec_mergeh ((__v4su) __A, (__v4su) __zero);
1.1.1.3  mrg #else /* __BIG_ENDIAN__.  */
1.1.1.3  mrg   __A = (__m128i) vec_mergeh (__zero, (__v16qu) __A);
1.1.1.3  mrg   __A = (__m128i) vec_mergeh ((__v8hu) __zero, (__v8hu) __A);
1.1.1.3  mrg   __A = (__m128i) vec_mergeh ((__v4su) __zero, (__v4su) __A);
1.1.1.3  mrg #endif /* __BIG_ENDIAN__.  */
1.1.1.3  mrg   return __A;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_cvtepu16_epi32 (__m128i __A)
1.1.1.3  mrg {
1.1.1.3  mrg   const __v8hu __zero = {0};
1.1.1.3  mrg #ifdef __LITTLE_ENDIAN__
1.1.1.3  mrg   __A = (__m128i) vec_mergeh ((__v8hu) __A, __zero);
1.1.1.3  mrg #else /* __BIG_ENDIAN__.  */
1.1.1.3  mrg   __A = (__m128i) vec_mergeh (__zero, (__v8hu) __A);
1.1.1.3  mrg #endif /* __BIG_ENDIAN__.  */
1.1.1.3  mrg   return __A;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_cvtepu16_epi64 (__m128i __A)
1.1.1.3  mrg {
1.1.1.3  mrg   const __v8hu __zero = {0};
1.1.1.3  mrg #ifdef __LITTLE_ENDIAN__
1.1.1.3  mrg   __A = (__m128i) vec_mergeh ((__v8hu) __A, __zero);
1.1.1.3  mrg   __A = (__m128i) vec_mergeh ((__v4su) __A, (__v4su) __zero);
1.1.1.3  mrg #else /* __BIG_ENDIAN__.  */
1.1.1.3  mrg   __A = (__m128i) vec_mergeh (__zero, (__v8hu) __A);
1.1.1.3  mrg   __A = (__m128i) vec_mergeh ((__v4su) __zero, (__v4su) __A);
1.1.1.3  mrg #endif /* __BIG_ENDIAN__.  */
1.1.1.3  mrg   return __A;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_cvtepu32_epi64 (__m128i __A)
1.1.1.3  mrg {
1.1.1.3  mrg   const __v4su __zero = {0};
1.1.1.3  mrg #ifdef __LITTLE_ENDIAN__
1.1.1.3  mrg   __A = (__m128i) vec_mergeh ((__v4su) __A, __zero);
1.1.1.3  mrg #else /* __BIG_ENDIAN__.  */
1.1.1.3  mrg   __A = (__m128i) vec_mergeh (__zero, (__v4su) __A);
1.1.1.3  mrg #endif /* __BIG_ENDIAN__.  */
1.1.1.3  mrg   return __A;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg /* Return horizontal packed word minimum and its index in bits [15:0]
1.1.1.3  mrg    and bits [18:16] respectively.  */
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_minpos_epu16 (__m128i __A)
1.1.1.3  mrg {
1.1.1.3  mrg   union __u
1.1.1.3  mrg     {
1.1.1.3  mrg       __m128i __m;
1.1.1.3  mrg       __v8hu __uh;
1.1.1.3  mrg     };
1.1.1.3  mrg   union __u __u = { .__m = __A }, __r = { .__m = {0} };
1.1.1.3  mrg   unsigned short __ridx = 0;
1.1.1.3  mrg   unsigned short __rmin = __u.__uh[__ridx];
1.1.1.3  mrg   unsigned long __i;
1.1.1.3  mrg   for (__i = 1; __i < 8; __i++)
1.1.1.3  mrg     {
1.1.1.3  mrg       if (__u.__uh[__i] < __rmin)
1.1.1.3  mrg 	{
1.1.1.3  mrg 	  __rmin = __u.__uh[__i];
1.1.1.3  mrg 	  __ridx = __i;
1.1.1.3  mrg 	}
1.1.1.3  mrg     }
1.1.1.3  mrg   __r.__uh[0] = __rmin;
1.1.1.3  mrg   __r.__uh[1] = __ridx;
1.1.1.3  mrg   return __r.__m;
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_packus_epi32 (__m128i __X, __m128i __Y)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_packsu ((__v4si) __X, (__v4si) __Y);
1.1.1.3  mrg }
1.1.1.3  mrg
1.1.1.3  mrg #ifdef _ARCH_PWR8
1.1.1.3  mrg extern __inline __m128i
1.1.1.3  mrg __attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
1.1.1.3  mrg _mm_cmpgt_epi64 (__m128i __X, __m128i __Y)
1.1.1.3  mrg {
1.1.1.3  mrg   return (__m128i) vec_cmpgt ((__v2di) __X, (__v2di) __Y);
1.1.1.3  mrg }
1.1.1.3  mrg #endif
1.1.1.3  mrg
    1.1  mrg #endif