config/rs6000/spu2vmx.h

 1.1  mrg /* Cell SPU 2 VMX intrinsics header
1.12  mrg    Copyright (C) 2007-2022 Free Software Foundation, Inc.
 1.1  mrg
 1.1  mrg    This file is free software; you can redistribute it and/or modify it under
 1.1  mrg    the terms of the GNU General Public License as published by the Free
 1.1  mrg    Software Foundation; either version 3 of the License, or (at your option)
 1.1  mrg    any later version.
 1.1  mrg
 1.1  mrg    This file is distributed in the hope that it will be useful, but WITHOUT
 1.1  mrg    ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
 1.1  mrg    FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License
 1.1  mrg    for more details.
 1.1  mrg
 1.1  mrg    Under Section 7 of GPL version 3, you are granted additional
 1.1  mrg    permissions described in the GCC Runtime Library Exception, version
 1.1  mrg    3.1, as published by the Free Software Foundation.
 1.1  mrg
 1.1  mrg    You should have received a copy of the GNU General Public License and
 1.1  mrg    a copy of the GCC Runtime Library Exception along with this program;
 1.1  mrg    see the files COPYING3 and COPYING.RUNTIME respectively.  If not, see
 1.1  mrg    <http://www.gnu.org/licenses/>.  */
 1.1  mrg
 1.1  mrg #ifndef _SPU2VMX_H_
 1.1  mrg #define _SPU2VMX_H_	1
 1.1  mrg
 1.1  mrg #ifdef __cplusplus
 1.1  mrg
 1.1  mrg #ifndef __SPU__
 1.1  mrg
 1.1  mrg #include <si2vmx.h>
 1.1  mrg
 1.1  mrg /* spu_absd (absolute difference)
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_absd(vec_uchar16 a, vec_uchar16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_absdb((qword)(a), (qword)(b))));
 1.1  mrg
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_add
 1.1  mrg  * =======
 1.1  mrg  */
 1.1  mrg static __inline vec_uint4 spu_add(vec_uint4 a, vec_uint4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_a((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_add(vec_int4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_a((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_add(vec_ushort8 a, vec_ushort8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_ah((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_add(vec_short8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_ah((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_add(vec_uint4 a, unsigned int b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_ai((qword)(a), (int)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_add(vec_int4 a, int b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_ai((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_add(vec_ushort8 a, unsigned short b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_ahi((qword)(a), (short)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_add(vec_short8 a, short b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_ahi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_add(vec_float4 a, vec_float4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_fa((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_add(vec_double2 a, vec_double2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_dfa((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_addx
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_uint4 spu_addx(vec_uint4 a, vec_uint4 b, vec_uint4 c)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_addx((qword)(a), (qword)(b), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_addx(vec_int4 a, vec_int4 b, vec_int4 c)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_addx((qword)(a), (qword)(b), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_and
 1.1  mrg  * =======
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_and(vec_uchar16 a, vec_uchar16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_and((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_and(vec_char16 a, vec_char16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_and((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_and(vec_ushort8 a, vec_ushort8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_and((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_and(vec_short8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_and((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_and(vec_uint4 a, vec_uint4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_and((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_and(vec_int4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_and((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_and(vec_float4 a, vec_float4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_and((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_and(vec_ullong2 a, vec_ullong2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_and((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_and(vec_llong2 a, vec_llong2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_and((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_and(vec_double2 a, vec_double2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_and((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uchar16 spu_and(vec_uchar16 a, unsigned char b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_andbi((qword)(a), (signed char)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_and(vec_char16 a, signed char b)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_andbi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_and(vec_ushort8 a, unsigned short b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_andhi((qword)(a), (signed short)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_and(vec_short8 a, signed short b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_andhi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_and(vec_uint4 a, unsigned int b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_andi((qword)(a), (signed int)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_and(vec_int4 a, signed int b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_andi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_andc
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg #define spu_andc(_a, _b)	vec_andc(_a, _b)
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_avg
 1.1  mrg  * =======
 1.1  mrg  */
 1.1  mrg #define spu_avg(_a, _b)		vec_avg(_a, _b)
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_bisled
 1.1  mrg  * spu_bisled_d
 1.1  mrg  * spu_bisled_e
 1.1  mrg  * ============
 1.1  mrg  */
 1.1  mrg #define spu_bisled(_func)	/* not mappable */
 1.1  mrg #define spu_bisled_d(_func)	/* not mappable */
 1.1  mrg #define spu_bisled_e(_func)	/* not mappable */
 1.1  mrg
 1.1  mrg /* spu_cmpabseq
 1.1  mrg  * ============
 1.1  mrg  */
 1.1  mrg static __inline vec_uint4 spu_cmpabseq(vec_float4 a, vec_float4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_fcmeq((qword)(a), (qword)(b))));
 1.1  mrg
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_cmpabseq(vec_double2 a, vec_double2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_dfcmeq((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_cmpabsgt
 1.1  mrg  * ============
 1.1  mrg  */
 1.1  mrg static __inline vec_uint4 spu_cmpabsgt(vec_float4 a, vec_float4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_fcmgt((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_cmpabsgt(vec_double2 a, vec_double2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_dfcmgt((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_cmpeq
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_cmpeq(vec_uchar16 a, vec_uchar16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_ceqb((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uchar16 spu_cmpeq(vec_char16 a, vec_char16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_ceqb((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_cmpeq(vec_ushort8 a, vec_ushort8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_ceqh((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_cmpeq(vec_short8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_ceqh((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_cmpeq(vec_uint4 a, vec_uint4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_ceq((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_cmpeq(vec_int4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_ceq((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_cmpeq(vec_float4 a, vec_float4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_fceq((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uchar16 spu_cmpeq(vec_uchar16 a, unsigned char b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_ceqbi((qword)(a), (signed char)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uchar16 spu_cmpeq(vec_char16 a, signed char b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_ceqbi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_cmpeq(vec_ushort8 a, unsigned short b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_ceqhi((qword)(a), (signed short)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_cmpeq(vec_short8 a, signed short b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_ceqhi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_cmpeq(vec_uint4 a, unsigned int b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_ceqi((qword)(a), (signed int)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_cmpeq(vec_int4 a, signed int b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_ceqi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_cmpeq(vec_double2 a, vec_double2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_dfceq((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_cmpgt
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_cmpgt(vec_uchar16 a, vec_uchar16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_clgtb((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uchar16 spu_cmpgt(vec_char16 a, vec_char16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_cgtb((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_cmpgt(vec_ushort8 a, vec_ushort8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_clgth((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_cmpgt(vec_short8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_cgth((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_cmpgt(vec_uint4 a, vec_uint4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_clgt((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_cmpgt(vec_int4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_cgt((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_cmpgt(vec_float4 a, vec_float4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_fcgt((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uchar16 spu_cmpgt(vec_uchar16 a, unsigned char b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_clgtbi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uchar16 spu_cmpgt(vec_char16 a, signed char b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_cgtbi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_cmpgt(vec_ushort8 a, unsigned short b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_clgthi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_cmpgt(vec_short8 a, signed short b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_cgthi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_cmpgt(vec_uint4 a, unsigned int b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_clgti((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_cmpgt(vec_int4 a, signed int b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_cgti((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_cmpgt(vec_double2 a, vec_double2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_dfcgt((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_cntb
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_cntb(vec_uchar16 a)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_cntb((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg static __inline vec_uchar16 spu_cntb(vec_char16 a)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_cntb((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_cntlz
 1.1  mrg  * =========
 1.1  mrg  */
 1.1  mrg static __inline vec_uint4 spu_cntlz(vec_uint4 a)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_clz((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_cntlz(vec_int4 a)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_clz((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_cntlz(vec_float4 a)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_clz((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_testsv
 1.1  mrg  * ==========
 1.1  mrg  */
 1.1  mrg static __inline vec_ullong2 spu_testsv(vec_double2 a, char b)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_dftsv((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_convtf
 1.1  mrg  * ==========
 1.1  mrg  */
 1.1  mrg #define spu_convtf(_a, _b)	(vec_ctf(_a, _b))
 1.1  mrg
 1.1  mrg /* spu_convts
 1.1  mrg  * ==========
 1.1  mrg  */
 1.1  mrg #define spu_convts(_a, _b)	(vec_cts(_a, _b))
 1.1  mrg
 1.1  mrg /* spu_convtu
 1.1  mrg  * ==========
 1.1  mrg  */
 1.1  mrg #define spu_convtu(_a, _b)	(vec_ctu(_a, _b))
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_dsync
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg #define spu_dsync()
 1.1  mrg
 1.1  mrg /* spu_eqv
 1.1  mrg  * =======
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_eqv(vec_uchar16 a, vec_uchar16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_eqv((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_eqv(vec_char16 a, vec_char16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_eqv((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_eqv(vec_ushort8 a, vec_ushort8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_eqv((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_eqv(vec_short8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_eqv((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_eqv(vec_uint4 a, vec_uint4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_eqv((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_eqv(vec_int4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_eqv((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_eqv(vec_float4 a, vec_float4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_eqv((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_eqv(vec_ullong2 a, vec_ullong2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_eqv((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_eqv(vec_llong2 a, vec_llong2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_eqv((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_eqv(vec_double2 a, vec_double2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_eqv((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_extend
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_short8 spu_extend(vec_char16 a)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_xsbh((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_extend(vec_short8 a)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_xshw((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_extend(vec_int4 a)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_xswd((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_extend(vec_float4 a)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_fesd((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_extract
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline unsigned char spu_extract(vec_uchar16 a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_uchar16 v;
 1.1  mrg     unsigned char c[16];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = a;
 1.1  mrg   return (in.c[element & 15]);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline signed char spu_extract(vec_char16 a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_char16 v;
 1.1  mrg     signed char c[16];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = a;
 1.1  mrg   return (in.c[element & 15]);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline unsigned short spu_extract(vec_ushort8 a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_ushort8 v;
 1.1  mrg     unsigned short s[8];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = a;
 1.1  mrg   return (in.s[element & 7]);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline signed short spu_extract(vec_short8 a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_short8 v;
 1.1  mrg     signed short s[8];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = a;
 1.1  mrg   return (in.s[element & 7]);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline unsigned int spu_extract(vec_uint4 a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_uint4 v;
 1.1  mrg     unsigned int i[4];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = a;
 1.1  mrg   return (in.i[element & 3]);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline signed int spu_extract(vec_int4 a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_int4 v;
 1.1  mrg     signed int i[4];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = a;
 1.1  mrg   return (in.i[element & 3]);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline float spu_extract(vec_float4 a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_float4 v;
 1.1  mrg     float f[4];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = a;
 1.1  mrg   return (in.f[element & 3]);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline unsigned long long  spu_extract(vec_ullong2 a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_ullong2 v;
 1.1  mrg     unsigned long long l[2];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = a;
 1.1  mrg   return (in.l[element & 1]);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline signed long long  spu_extract(vec_llong2 a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_llong2 v;
 1.1  mrg     signed long long l[2];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = a;
 1.1  mrg   return (in.l[element & 1]);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline double spu_extract(vec_double2 a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_double2 v;
 1.1  mrg     double d[2];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = a;
 1.1  mrg   return (in.d[element & 1]);
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_gather
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_uint4 spu_gather(vec_uchar16 a)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_gbb((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_gather(vec_char16 a)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_gbb((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_gather(vec_ushort8 a)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_gbh((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_gather(vec_short8 a)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_gbh((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_gather(vec_uint4 a)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_gb((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_gather(vec_int4 a)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_gb((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_gather(vec_float4 a)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_gb((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_genb
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_uint4 spu_genb(vec_uint4 a, vec_uint4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_bg((qword)(b), (qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_genb(vec_int4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_bg((qword)(b), (qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_genbx
 1.1  mrg  * =========
 1.1  mrg  */
 1.1  mrg static __inline vec_uint4 spu_genbx(vec_uint4 a, vec_uint4 b, vec_uint4 c)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_bgx((qword)(b), (qword)(a), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_genbx(vec_int4 a, vec_int4 b, vec_int4 c)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_bgx((qword)(b), (qword)(a), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_genc
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_uint4 spu_genc(vec_uint4 a, vec_uint4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_cg((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_genc(vec_int4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_cg((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_gencx
 1.1  mrg  * =========
 1.1  mrg  */
 1.1  mrg static __inline vec_uint4 spu_gencx(vec_uint4 a, vec_uint4 b, vec_uint4 c)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_cgx((qword)(a), (qword)(b), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_gencx(vec_int4 a, vec_int4 b, vec_int4 c)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_cgx((qword)(a), (qword)(b), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_hcmpeq
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg #define spu_hcmpeq(_a, _b)	if (_a == _b) { SPU_HALT_ACTION; };
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_hcmpgt
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg #define spu_hcmpgt(_a, _b)	if (_a > _b) { SPU_HALT_ACTION; };
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_idisable
 1.1  mrg  * ============
 1.1  mrg  */
 1.1  mrg #define spu_idisable()		SPU_UNSUPPORTED_ACTION
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_ienable
 1.1  mrg  * ===========
 1.1  mrg  */
 1.1  mrg #define spu_ienable()		SPU_UNSUPPORTED_ACTION
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_insert
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_insert(unsigned char a, vec_uchar16 b, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_uchar16 v;
 1.1  mrg     unsigned char c[16];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = b;
 1.1  mrg   in.c[element & 15] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_insert(signed char a, vec_char16 b, int element)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)spu_insert((unsigned char)(a), (vec_uchar16)(b), element));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_insert(unsigned short a, vec_ushort8 b, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_ushort8 v;
 1.1  mrg     unsigned short s[8];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = b;
 1.1  mrg   in.s[element & 7] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_insert(signed short a, vec_short8 b, int element)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)spu_insert((unsigned short)(a), (vec_ushort8)(b), element));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_insert(unsigned int a, vec_uint4 b, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_uint4 v;
 1.1  mrg     unsigned int i[4];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = b;
 1.1  mrg   in.i[element & 3] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_insert(signed int a, vec_int4 b, int element)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)spu_insert((unsigned int)(a), (vec_uint4)(b), element));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_insert(float a, vec_float4 b, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_float4 v;
 1.1  mrg     float f[4];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = b;
 1.1  mrg   in.f[element & 3] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_insert(unsigned long long a, vec_ullong2 b, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_ullong2 v;
 1.1  mrg     unsigned long long l[2];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = b;
 1.1  mrg   in.l[element & 1] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_insert(signed long long a, vec_llong2 b, int element)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)spu_insert((unsigned long long)(a), (vec_ullong2)(b), element));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_insert(double a, vec_double2 b, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_double2 v;
 1.1  mrg     double d[2];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.v = b;
 1.1  mrg   in.d[element & 1] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_madd
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_int4 spu_madd(vec_short8 a, vec_short8 b, vec_int4 c)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_mpya((qword)(a), (qword)(b), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_madd(vec_float4 a, vec_float4 b, vec_float4 c)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_fma((qword)(a), (qword)(b), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_madd(vec_double2 a, vec_double2 b, vec_double2 c)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_dfma((qword)(a), (qword)(b), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_maskb
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg #define spu_maskb(_a)	(vec_uchar16)(si_fsmb(si_from_int((int)(_a))))
 1.1  mrg
 1.1  mrg /* spu_maskh
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg #define spu_maskh(_a)	(vec_ushort8)(si_fsmh(si_from_int((int)(_a))))
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_maskw
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg #define spu_maskw(_a)	(vec_uint4)(si_fsm(si_from_int((int)(_a))))
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_mfcdma32
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg #define spu_mfcdma32(_ls, _ea, _size, _tagid, _cmd)
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_mfcdma64
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg #define spu_mfcdma64(_ls, _eahi, _ealow,  _size, _tagid, _cmd)
 1.1  mrg
 1.1  mrg /* spu_mfcstat
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg #define spu_mfcstat(_type)	0xFFFFFFFF
 1.1  mrg
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_mffpscr
 1.1  mrg  * ===========
 1.1  mrg  */
 1.1  mrg #define spu_mffpscr()		(vec_uint4)(si_fscrrd())
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_mfspr
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg
 1.1  mrg #define spu_mfspr(_reg)		si_to_uint(si_mfspr(_reg))
 1.1  mrg
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_mhhadd
 1.1  mrg  * ==========
 1.1  mrg  */
 1.1  mrg static __inline vec_int4 spu_mhhadd(vec_short8 a, vec_short8 b, vec_int4 c)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_mpyhha((qword)(a), (qword)(b), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_mhhadd(vec_ushort8 a, vec_ushort8 b, vec_uint4 c)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_mpyhhau((qword)(a), (qword)(b), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_msub
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_float4 spu_msub(vec_float4 a, vec_float4 b, vec_float4 c)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_fms((qword)(a), (qword)(b), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_msub(vec_double2 a, vec_double2 b, vec_double2 c)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_dfms((qword)(a), (qword)(b), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_mtfpscr
 1.1  mrg  * ===========
 1.1  mrg  */
 1.1  mrg #define spu_mtfpscr(_a)
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_mtspr
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg #define spu_mtspr(_reg, _a)
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_mul
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_float4 spu_mul(vec_float4 a, vec_float4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_fm((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_mul(vec_double2 a, vec_double2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_dfm((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_mulh
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_int4 spu_mulh(vec_short8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_mpyh((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_mule
 1.1  mrg  * =========
 1.1  mrg  */
 1.1  mrg #define spu_mule(_a, _b)	vec_mule(_a, _b)
 1.1  mrg
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_mulo
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_int4 spu_mulo(vec_short8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_mpy((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_mulo(vec_ushort8 a, vec_ushort8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_mpyu((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_mulo(vec_short8 a, short b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_mpyi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_mulo(vec_ushort8 a, unsigned short b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_mpyui((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_mulsr
 1.1  mrg  * =========
 1.1  mrg  */
 1.1  mrg static __inline vec_int4 spu_mulsr(vec_short8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_mpys((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_nand
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_nand(vec_uchar16 a, vec_uchar16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_nand((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_nand(vec_char16 a, vec_char16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_nand((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_nand(vec_ushort8 a, vec_ushort8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_nand((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_nand(vec_short8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_nand((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_nand(vec_uint4 a, vec_uint4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_nand((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_nand(vec_int4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_nand((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_nand(vec_float4 a, vec_float4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_nand((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_nand(vec_ullong2 a, vec_ullong2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_nand((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_nand(vec_llong2 a, vec_llong2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_nand((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_nand(vec_double2 a, vec_double2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_nand((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_nmadd
 1.1  mrg  * =========
 1.1  mrg  */
 1.1  mrg static __inline vec_double2 spu_nmadd(vec_double2 a, vec_double2 b, vec_double2 c)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_dfnma((qword)(a), (qword)(b), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_nmsub
 1.1  mrg  * =========
 1.1  mrg  */
 1.1  mrg static __inline vec_float4 spu_nmsub(vec_float4 a, vec_float4 b, vec_float4 c)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_fnms((qword)(a), (qword)(b), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_nmsub(vec_double2 a, vec_double2 b, vec_double2 c)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_dfnms((qword)(a), (qword)(b), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_nor
 1.1  mrg  * =======
 1.1  mrg  */
 1.1  mrg #define spu_nor(_a, _b)		vec_nor(_a, _b)
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_or
 1.1  mrg  * ======
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_or(vec_uchar16 a, vec_uchar16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_or((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_or(vec_char16 a, vec_char16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_or((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_or(vec_ushort8 a, vec_ushort8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_or((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_or(vec_short8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_or((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_or(vec_uint4 a, vec_uint4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_or((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_or(vec_int4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_or((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_or(vec_float4 a, vec_float4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_or((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_or(vec_ullong2 a, vec_ullong2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_or((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_or(vec_llong2 a, vec_llong2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_or((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_or(vec_double2 a, vec_double2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_or((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg static __inline vec_uchar16 spu_or(vec_uchar16 a, unsigned char b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_orbi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_or(vec_char16 a, signed char b)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_orbi((qword)(a), (unsigned char)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_or(vec_ushort8 a, unsigned short b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_orhi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_or(vec_short8 a, signed short b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_orhi((qword)(a), (unsigned short)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_or(vec_uint4 a, unsigned int b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_ori((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_or(vec_int4 a, signed int b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_ori((qword)(a), (unsigned int)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_orc
 1.1  mrg  * =======
 1.1  mrg  */
 1.1  mrg #define spu_orc(_a, _b)		vec_or(_a, vec_nor(_b, _b))
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_orx
 1.1  mrg  * =======
 1.1  mrg  */
 1.1  mrg static __inline vec_uint4 spu_orx(vec_uint4 a)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_orx((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_orx(vec_int4 a)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_orx((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_promote
 1.1  mrg  * ===========
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_promote(unsigned char a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_uchar16 v;
 1.1  mrg     unsigned char c[16];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.c[element & 15] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_promote(signed char a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_char16 v;
 1.1  mrg     signed char c[16];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.c[element & 15] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_promote(unsigned short a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_ushort8 v;
 1.1  mrg     unsigned short s[8];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.s[element & 7] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_promote(signed short a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_short8 v;
 1.1  mrg     signed short s[8];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.s[element & 7] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_promote(unsigned int a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_uint4 v;
 1.1  mrg     unsigned int i[4];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.i[element & 3] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_promote(signed int a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_int4 v;
 1.1  mrg     signed int i[4];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.i[element & 3] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_promote(float a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_float4 v;
 1.1  mrg     float f[4];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.f[element & 3] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_promote(unsigned long long a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_ullong2 v;
 1.1  mrg     unsigned long long l[2];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.l[element & 1] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_promote(signed long long a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_llong2 v;
 1.1  mrg     signed long long l[2];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.l[element & 1] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_promote(double a, int element)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_double2 v;
 1.1  mrg     double d[2];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.d[element & 1] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_re
 1.1  mrg  * ======
 1.1  mrg  */
 1.1  mrg #define spu_re(_a)		vec_re(_a)
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_readch
 1.1  mrg  * ==========
 1.1  mrg  */
 1.1  mrg #define spu_readch(_channel)		0	/* not mappable */
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_readchcnt
 1.1  mrg  * =============
 1.1  mrg  */
 1.1  mrg #define spu_readchcnt(_channel)		0	/* not mappable */
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_readchqw
 1.1  mrg  * ============
 1.1  mrg  */
 1.1  mrg #define spu_readchqw(_channel) __extension__ ({ vec_uint4 result = { 0, 0, 0, 0 }; result; })
 1.1  mrg
 1.1  mrg /* spu_rl
 1.1  mrg  * ======
 1.1  mrg  */
 1.1  mrg static __inline vec_ushort8 spu_rl(vec_ushort8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_roth((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_rl(vec_short8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_roth((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_rl(vec_uint4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_rot((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_rl(vec_int4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_rot((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_rl(vec_ushort8 a, int b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_rothi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_rl(vec_short8 a, int b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_rothi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_rl(vec_uint4 a, int b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_roti((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_rl(vec_int4 a, int b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_roti((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_rlmask
 1.1  mrg  * ==========
 1.1  mrg  */
 1.1  mrg static __inline vec_ushort8 spu_rlmask(vec_ushort8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_rothm((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_rlmask(vec_short8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_rothm((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_rlmask(vec_uint4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_rotm((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_rlmask(vec_int4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_rotm((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_rlmask(vec_ushort8 a, int b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_rothmi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_rlmask(vec_short8 a, int b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_rothmi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_rlmask(vec_uint4 a, int b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_rotmi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_rlmask(vec_int4 a, int b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_rotmi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_rlmaska
 1.1  mrg  * ===========
 1.1  mrg  */
 1.1  mrg static __inline vec_short8 spu_rlmaska(vec_short8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_rotmah((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_rlmaska(vec_ushort8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_rotmah((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_rlmaska(vec_int4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_rotma((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_rlmaska(vec_uint4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_rotma((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_rlmaska(vec_ushort8 a, int b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_rotmahi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_rlmaska(vec_short8 a, int b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_rotmahi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_rlmaska(vec_uint4 a, int b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_rotmai((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_rlmaska(vec_int4 a, int b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_rotmai((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_rlmaskqw
 1.1  mrg  * ============
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_rlmaskqw(vec_uchar16 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_rotqmbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_rlmaskqw(vec_char16 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_rotqmbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_rlmaskqw(vec_ushort8 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_rotqmbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_rlmaskqw(vec_short8 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_rotqmbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_rlmaskqw(vec_uint4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_rotqmbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_rlmaskqw(vec_int4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_rotqmbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_rlmaskqw(vec_float4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_rotqmbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_rlmaskqw(vec_ullong2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_rotqmbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_rlmaskqw(vec_llong2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_rotqmbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_rlmaskqw(vec_double2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_rotqmbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_rlmaskqwbyte
 1.1  mrg  * ================
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_rlmaskqwbyte(vec_uchar16 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_rotqmby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_rlmaskqwbyte(vec_char16 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_rotqmby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_rlmaskqwbyte(vec_ushort8 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_rotqmby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_rlmaskqwbyte(vec_short8 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_rotqmby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_rlmaskqwbyte(vec_uint4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_rotqmby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_rlmaskqwbyte(vec_int4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_rotqmby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_rlmaskqwbyte(vec_float4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_rotqmby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_rlmaskqwbyte(vec_ullong2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_rotqmby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_rlmaskqwbyte(vec_llong2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_rotqmby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_rlmaskqwbyte(vec_double2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_rotqmby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_rlmaskqwbytebc
 1.1  mrg  * ==================
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_rlmaskqwbytebc(vec_uchar16 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_rotqmbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_rlmaskqwbytebc(vec_char16 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_rotqmbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_rlmaskqwbytebc(vec_ushort8 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_rotqmbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_rlmaskqwbytebc(vec_short8 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_rotqmbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_rlmaskqwbytebc(vec_uint4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_rotqmbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_rlmaskqwbytebc(vec_int4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_rotqmbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_rlmaskqwbytebc(vec_float4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_rotqmbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_rlmaskqwbytebc(vec_ullong2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_rotqmbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_rlmaskqwbytebc(vec_llong2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_rotqmbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_rlmaskqwbytebc(vec_double2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_rotqmbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_rlqwbyte
 1.1  mrg  * ============
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_rlqwbyte(vec_uchar16 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_rotqby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_rlqwbyte(vec_char16 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_rotqby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_rlqwbyte(vec_ushort8 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_rotqby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_rlqwbyte(vec_short8 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_rotqby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_rlqwbyte(vec_uint4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_rotqby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_rlqwbyte(vec_int4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_rotqby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_rlqwbyte(vec_float4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_rotqby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_rlqwbyte(vec_ullong2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_rotqby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_rlqwbyte(vec_llong2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_rotqby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_rlqwbyte(vec_double2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_rotqby((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_rlqwbytebc
 1.1  mrg  * ==============
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_rlqwbytebc(vec_uchar16 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_rotqbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_rlqwbytebc(vec_char16 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_rotqbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_rlqwbytebc(vec_ushort8 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_rotqbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_rlqwbytebc(vec_short8 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_rotqbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_rlqwbytebc(vec_uint4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_rotqbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_rlqwbytebc(vec_int4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_rotqbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_rlqwbytebc(vec_float4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_rotqbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_rlqwbytebc(vec_ullong2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_rotqbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_rlqwbytebc(vec_llong2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_rotqbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_rlqwbytebc(vec_double2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_rotqbybi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_rlqw
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_rlqw(vec_uchar16 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_rotqbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_rlqw(vec_char16 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_rotqbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_rlqw(vec_ushort8 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_rotqbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_rlqw(vec_short8 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_rotqbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_rlqw(vec_uint4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_rotqbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_rlqw(vec_int4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_rotqbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_rlqw(vec_float4 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_rotqbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_rlqw(vec_ullong2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_rotqbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_rlqw(vec_llong2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_rotqbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_rlqw(vec_double2 a, int count)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_rotqbi((qword)(a), si_from_int(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_roundtf
 1.1  mrg  * ===========
 1.1  mrg  */
 1.1  mrg static __inline vec_float4 spu_roundtf(vec_double2 a)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_frds((qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_rsqrte
 1.1  mrg  * ==========
 1.1  mrg  */
 1.1  mrg #define spu_rsqrte(_a)		vec_rsqrte(_a)
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_sel
 1.1  mrg  * =======
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_sel(vec_uchar16 a, vec_uchar16 b, vec_uchar16 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_selb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_sel(vec_char16 a, vec_char16 b, vec_uchar16 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_selb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_sel(vec_ushort8 a, vec_ushort8 b, vec_ushort8 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_selb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_sel(vec_short8 a, vec_short8 b, vec_ushort8 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_selb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_sel(vec_uint4 a, vec_uint4 b, vec_uint4 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_selb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_sel(vec_int4 a, vec_int4 b, vec_uint4 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_selb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_sel(vec_float4 a, vec_float4 b, vec_uint4 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_selb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_sel(vec_ullong2 a, vec_ullong2 b, vec_ullong2 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_selb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_sel(vec_llong2 a, vec_llong2 b, vec_ullong2 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_selb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_sel(vec_double2 a, vec_double2 b, vec_ullong2 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_selb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_shuffle
 1.1  mrg  * ===========
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_shuffle(vec_uchar16 a, vec_uchar16 b, vec_uchar16 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_shufb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_shuffle(vec_char16 a, vec_char16 b, vec_uchar16 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_shufb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_shuffle(vec_ushort8 a, vec_ushort8 b, vec_uchar16 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_shufb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_shuffle(vec_short8 a, vec_short8 b, vec_uchar16 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_shufb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_shuffle(vec_uint4 a, vec_uint4 b, vec_uchar16 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_shufb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_shuffle(vec_int4 a, vec_int4 b, vec_uchar16 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_shufb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_shuffle(vec_float4 a, vec_float4 b, vec_uchar16 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_shufb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_shuffle(vec_ullong2 a, vec_ullong2 b, vec_uchar16 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_shufb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_shuffle(vec_llong2 a, vec_llong2 b, vec_uchar16 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_shufb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_shuffle(vec_double2 a, vec_double2 b, vec_uchar16 pattern)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_shufb((qword)(a), (qword)(b), (qword)(pattern))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_sl
 1.1  mrg  * ======
 1.1  mrg  */
 1.1  mrg static __inline vec_ushort8 spu_sl(vec_ushort8 a, vec_ushort8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_shlh((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_sl(vec_short8 a, vec_ushort8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_shlh((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_sl(vec_uint4 a, vec_uint4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_shl((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_sl(vec_int4 a, vec_uint4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_shl((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_sl(vec_ushort8 a, unsigned int b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_shlhi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_sl(vec_short8 a, unsigned int b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_shlhi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_sl(vec_uint4 a, unsigned int b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_shli((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_sl(vec_int4 a, unsigned int b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_shli((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_slqw
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_slqw(vec_uchar16 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_shlqbi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_slqw(vec_char16 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_shlqbi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_slqw(vec_ushort8 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_shlqbi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_slqw(vec_short8 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_shlqbi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_slqw(vec_uint4 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_shlqbi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_slqw(vec_int4 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_shlqbi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_slqw(vec_float4 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_shlqbi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_slqw(vec_ullong2 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_shlqbi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_slqw(vec_llong2 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_shlqbi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_slqw(vec_double2 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_shlqbi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_slqwbyte
 1.1  mrg  * ============
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_slqwbyte(vec_uchar16 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_shlqby((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_slqwbyte(vec_char16 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_shlqby((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_slqwbyte(vec_ushort8 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_shlqby((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_slqwbyte(vec_short8 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_shlqby((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_slqwbyte(vec_uint4 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_shlqby((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_slqwbyte(vec_int4 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_shlqby((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_slqwbyte(vec_float4 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_shlqby((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_slqwbyte(vec_ullong2 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_shlqby((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_slqwbyte(vec_llong2 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_shlqby((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_slqwbyte(vec_double2 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_shlqby((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_slqwbytebc
 1.1  mrg  * ==============
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_slqwbytebc(vec_uchar16 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_shlqbybi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_slqwbytebc(vec_char16 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_shlqbybi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_slqwbytebc(vec_ushort8 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_shlqbybi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_slqwbytebc(vec_short8 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_shlqbybi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_slqwbytebc(vec_uint4 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_shlqbybi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_slqwbytebc(vec_int4 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_shlqbybi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_slqwbytebc(vec_float4 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_shlqbybi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_slqwbytebc(vec_ullong2 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_shlqbybi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_slqwbytebc(vec_llong2 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_shlqbybi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_slqwbytebc(vec_double2 a, unsigned int count)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_shlqbybi((qword)(a), si_from_uint(count))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_splats
 1.1  mrg  * ==========
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_splats(unsigned char a)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_uchar16 v;
 1.1  mrg     unsigned char c[16];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.c[0] = a;
 1.1  mrg   return (vec_splat(in.v, 0));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_splats(signed char a)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)spu_splats((unsigned char)(a)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_splats(unsigned short a)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_ushort8 v;
 1.1  mrg     unsigned short s[8];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.s[0] = a;
 1.1  mrg   return (vec_splat(in.v, 0));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_splats(signed short a)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)spu_splats((unsigned short)(a)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_splats(unsigned int a)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_uint4 v;
 1.1  mrg     unsigned int i[4];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.i[0] = a;
 1.1  mrg   return (vec_splat(in.v, 0));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_splats(signed int a)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)spu_splats((unsigned int)(a)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_splats(float a)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_float4 v;
 1.1  mrg     float f[4];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.f[0] = a;
 1.1  mrg   return (vec_splat(in.v, 0));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_splats(unsigned long long a)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_ullong2 v;
 1.1  mrg     unsigned long long l[2];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.l[0] = a;
 1.1  mrg   in.l[1] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_splats(signed long long a)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)spu_splats((unsigned long long)(a)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_splats(double a)
 1.1  mrg {
 1.1  mrg   union {
 1.1  mrg     vec_double2 v;
 1.1  mrg     double d[2];
 1.1  mrg   } in;
 1.1  mrg
 1.1  mrg   in.d[0] = a;
 1.1  mrg   in.d[1] = a;
 1.1  mrg   return (in.v);
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_stop
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg #define spu_stop(_type)	si_stop(_type)
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_sub
 1.1  mrg  * =======
 1.1  mrg  */
 1.1  mrg static __inline vec_ushort8 spu_sub(vec_ushort8 a, vec_ushort8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_sfh((qword)(b), (qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_sub(vec_short8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_sfh((qword)(b), (qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_sub(vec_uint4 a, vec_uint4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_sf((qword)(b), (qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_sub(vec_int4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_sf((qword)(b), (qword)(a))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_sub(vec_float4 a, vec_float4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_fs((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_sub(vec_double2 a, vec_double2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_dfs((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_sub(unsigned int a, vec_uint4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_sfi((qword)b, (int)a)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_sub(signed int a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_sfi((qword)b, (int)a)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_sub(unsigned short a, vec_ushort8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_sfhi((qword)b, (short)a)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_sub(signed short a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_sfhi((qword)b, (short)a)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_subx
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_uint4 spu_subx(vec_uint4 a, vec_uint4 b, vec_uint4 c)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_sfx((qword)(b), (qword)(a), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_subx(vec_int4 a, vec_int4 b, vec_int4 c)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_sfx((qword)(b), (qword)(a), (qword)(c))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg /* spu_sumb
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg static __inline vec_ushort8 spu_sumb(vec_uchar16 a, vec_uchar16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_sumb((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_sync
 1.1  mrg  * spu_sync_c
 1.1  mrg  * ========
 1.1  mrg  */
 1.1  mrg #define spu_sync()	/* do nothing */
 1.1  mrg
 1.1  mrg #define spu_sync_c()	/* do nothing */
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_writech
 1.1  mrg  * ===========
 1.1  mrg  */
 1.1  mrg #define spu_writech(_channel, _a)	/* not mappable */
 1.1  mrg
 1.1  mrg /* spu_writechqw
 1.1  mrg  * =============
 1.1  mrg  */
 1.1  mrg #define spu_writechqw(_channel, _a)	/* not mappable */
 1.1  mrg
 1.1  mrg
 1.1  mrg /* spu_xor
 1.1  mrg  * =======
 1.1  mrg  */
 1.1  mrg static __inline vec_uchar16 spu_xor(vec_uchar16 a, vec_uchar16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_xor((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_xor(vec_char16 a, vec_char16 b)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_xor((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_xor(vec_ushort8 a, vec_ushort8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_xor((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_xor(vec_short8 a, vec_short8 b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_xor((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_xor(vec_uint4 a, vec_uint4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_xor((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_xor(vec_int4 a, vec_int4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_xor((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_float4 spu_xor(vec_float4 a, vec_float4 b)
 1.1  mrg {
 1.1  mrg   return ((vec_float4)(si_xor((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ullong2 spu_xor(vec_ullong2 a, vec_ullong2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_ullong2)(si_xor((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_llong2 spu_xor(vec_llong2 a, vec_llong2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_llong2)(si_xor((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_double2 spu_xor(vec_double2 a, vec_double2 b)
 1.1  mrg {
 1.1  mrg   return ((vec_double2)(si_xor((qword)(a), (qword)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uchar16 spu_xor(vec_uchar16 a, unsigned char b)
 1.1  mrg {
 1.1  mrg   return ((vec_uchar16)(si_xorbi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_char16 spu_xor(vec_char16 a, signed char b)
 1.1  mrg {
 1.1  mrg   return ((vec_char16)(si_xorbi((qword)(a), (unsigned char)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_ushort8 spu_xor(vec_ushort8 a, unsigned short b)
 1.1  mrg {
 1.1  mrg   return ((vec_ushort8)(si_xorhi((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_short8 spu_xor(vec_short8 a, signed short b)
 1.1  mrg {
 1.1  mrg   return ((vec_short8)(si_xorhi((qword)(a), (unsigned short)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_uint4 spu_xor(vec_uint4 a, unsigned int b)
 1.1  mrg {
 1.1  mrg   return ((vec_uint4)(si_xori((qword)(a), b)));
 1.1  mrg }
 1.1  mrg
 1.1  mrg static __inline vec_int4 spu_xor(vec_int4 a, signed int b)
 1.1  mrg {
 1.1  mrg   return ((vec_int4)(si_xori((qword)(a), (unsigned int)(b))));
 1.1  mrg }
 1.1  mrg
 1.1  mrg #endif /* !__SPU__ */
 1.1  mrg #endif /* __cplusplus */
 1.1  mrg #endif /* !_SPU2VMX_H_ */