intel/compiler/brw_clip_util.c

b8e80941Smrg/*
b8e80941Smrg Copyright (C) Intel Corp.  2006.  All Rights Reserved.
b8e80941Smrg Intel funded Tungsten Graphics to
b8e80941Smrg develop this 3D driver.
b8e80941Smrg
b8e80941Smrg Permission is hereby granted, free of charge, to any person obtaining
b8e80941Smrg a copy of this software and associated documentation files (the
b8e80941Smrg "Software"), to deal in the Software without restriction, including
b8e80941Smrg without limitation the rights to use, copy, modify, merge, publish,
b8e80941Smrg distribute, sublicense, and/or sell copies of the Software, and to
b8e80941Smrg permit persons to whom the Software is furnished to do so, subject to
b8e80941Smrg the following conditions:
b8e80941Smrg
b8e80941Smrg The above copyright notice and this permission notice (including the
b8e80941Smrg next paragraph) shall be included in all copies or substantial
b8e80941Smrg portions of the Software.
b8e80941Smrg
b8e80941Smrg THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
b8e80941Smrg EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
b8e80941Smrg MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.
b8e80941Smrg IN NO EVENT SHALL THE COPYRIGHT OWNER(S) AND/OR ITS SUPPLIERS BE
b8e80941Smrg LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION
b8e80941Smrg OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION
b8e80941Smrg WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
b8e80941Smrg
b8e80941Smrg **********************************************************************/
b8e80941Smrg /*
b8e80941Smrg  * Authors:
b8e80941Smrg  *   Keith Whitwell <keithw@vmware.com>
b8e80941Smrg  */
b8e80941Smrg
b8e80941Smrg
b8e80941Smrg#include "main/macros.h"
b8e80941Smrg#include "main/enums.h"
b8e80941Smrg#include "program/program.h"
b8e80941Smrg
b8e80941Smrg#include "brw_clip.h"
b8e80941Smrg
b8e80941Smrg
b8e80941Smrgstruct brw_reg get_tmp( struct brw_clip_compile *c )
b8e80941Smrg{
b8e80941Smrg   struct brw_reg tmp = brw_vec4_grf(c->last_tmp, 0);
b8e80941Smrg
b8e80941Smrg   if (++c->last_tmp > c->prog_data.total_grf)
b8e80941Smrg      c->prog_data.total_grf = c->last_tmp;
b8e80941Smrg
b8e80941Smrg   return tmp;
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgstatic void release_tmp( struct brw_clip_compile *c, struct brw_reg tmp )
b8e80941Smrg{
b8e80941Smrg   if (tmp.nr == c->last_tmp-1)
b8e80941Smrg      c->last_tmp--;
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrg
b8e80941Smrgstatic struct brw_reg make_plane_ud(GLuint x, GLuint y, GLuint z, GLuint w)
b8e80941Smrg{
b8e80941Smrg   return brw_imm_ud((w<<24) | (z<<16) | (y<<8) | x);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrg
b8e80941Smrgvoid brw_clip_init_planes( struct brw_clip_compile *c )
b8e80941Smrg{
b8e80941Smrg   struct brw_codegen *p = &c->func;
b8e80941Smrg
b8e80941Smrg   if (!c->key.nr_userclip) {
b8e80941Smrg      brw_MOV(p, get_element_ud(c->reg.fixed_planes, 0), make_plane_ud( 0,    0, 0xff, 1));
b8e80941Smrg      brw_MOV(p, get_element_ud(c->reg.fixed_planes, 1), make_plane_ud( 0,    0,    1, 1));
b8e80941Smrg      brw_MOV(p, get_element_ud(c->reg.fixed_planes, 2), make_plane_ud( 0, 0xff,    0, 1));
b8e80941Smrg      brw_MOV(p, get_element_ud(c->reg.fixed_planes, 3), make_plane_ud( 0,    1,    0, 1));
b8e80941Smrg      brw_MOV(p, get_element_ud(c->reg.fixed_planes, 4), make_plane_ud(0xff,  0,    0, 1));
b8e80941Smrg      brw_MOV(p, get_element_ud(c->reg.fixed_planes, 5), make_plane_ud( 1,    0,    0, 1));
b8e80941Smrg   }
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrg
b8e80941Smrg
b8e80941Smrg#define W 3
b8e80941Smrg
b8e80941Smrg/* Project 'pos' to screen space (or back again), overwrite with results:
b8e80941Smrg */
b8e80941Smrgvoid brw_clip_project_position(struct brw_clip_compile *c, struct brw_reg pos )
b8e80941Smrg{
b8e80941Smrg   struct brw_codegen *p = &c->func;
b8e80941Smrg
b8e80941Smrg   /* calc rhw
b8e80941Smrg    */
b8e80941Smrg   brw_math_invert(p, get_element(pos, W), get_element(pos, W));
b8e80941Smrg
b8e80941Smrg   /* value.xyz *= value.rhw
b8e80941Smrg    */
b8e80941Smrg   brw_set_default_access_mode(p, BRW_ALIGN_16);
b8e80941Smrg   brw_MUL(p, brw_writemask(pos, WRITEMASK_XYZ), pos,
b8e80941Smrg           brw_swizzle(pos, BRW_SWIZZLE_WWWW));
b8e80941Smrg   brw_set_default_access_mode(p, BRW_ALIGN_1);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrg
b8e80941Smrgstatic void brw_clip_project_vertex( struct brw_clip_compile *c,
b8e80941Smrg				     struct brw_indirect vert_addr )
b8e80941Smrg{
b8e80941Smrg   struct brw_codegen *p = &c->func;
b8e80941Smrg   struct brw_reg tmp = get_tmp(c);
b8e80941Smrg   GLuint hpos_offset = brw_varying_to_offset(&c->vue_map, VARYING_SLOT_POS);
b8e80941Smrg   GLuint ndc_offset = brw_varying_to_offset(&c->vue_map,
b8e80941Smrg                                             BRW_VARYING_SLOT_NDC);
b8e80941Smrg
b8e80941Smrg   /* Fixup position.  Extract from the original vertex and re-project
b8e80941Smrg    * to screen space:
b8e80941Smrg    */
b8e80941Smrg   brw_MOV(p, tmp, deref_4f(vert_addr, hpos_offset));
b8e80941Smrg   brw_clip_project_position(c, tmp);
b8e80941Smrg   brw_MOV(p, deref_4f(vert_addr, ndc_offset), tmp);
b8e80941Smrg
b8e80941Smrg   release_tmp(c, tmp);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrg
b8e80941Smrg
b8e80941Smrg
b8e80941Smrg/* Interpolate between two vertices and put the result into a0.0.
b8e80941Smrg * Increment a0.0 accordingly.
b8e80941Smrg *
b8e80941Smrg * Beware that dest_ptr can be equal to v0_ptr!
b8e80941Smrg */
b8e80941Smrgvoid brw_clip_interp_vertex( struct brw_clip_compile *c,
b8e80941Smrg			     struct brw_indirect dest_ptr,
b8e80941Smrg			     struct brw_indirect v0_ptr, /* from */
b8e80941Smrg			     struct brw_indirect v1_ptr, /* to */
b8e80941Smrg			     struct brw_reg t0,
b8e80941Smrg			     bool force_edgeflag)
b8e80941Smrg{
b8e80941Smrg   struct brw_codegen *p = &c->func;
b8e80941Smrg   struct brw_reg t_nopersp, v0_ndc_copy;
b8e80941Smrg   GLuint slot;
b8e80941Smrg
b8e80941Smrg   /* Just copy the vertex header:
b8e80941Smrg    */
b8e80941Smrg   /*
b8e80941Smrg    * After CLIP stage, only first 256 bits of the VUE are read
b8e80941Smrg    * back on Ironlake, so needn't change it
b8e80941Smrg    */
b8e80941Smrg   brw_copy_indirect_to_indirect(p, dest_ptr, v0_ptr, 1);
b8e80941Smrg
b8e80941Smrg
b8e80941Smrg   /* First handle the 3D and NDC interpolation, in case we
b8e80941Smrg    * need noperspective interpolation. Doing it early has no
b8e80941Smrg    * performance impact in any case.
b8e80941Smrg    */
b8e80941Smrg
b8e80941Smrg   /* Take a copy of the v0 NDC coordinates, in case dest == v0. */
b8e80941Smrg   if (c->key.contains_noperspective_varying) {
b8e80941Smrg      GLuint offset = brw_varying_to_offset(&c->vue_map,
b8e80941Smrg                                                 BRW_VARYING_SLOT_NDC);
b8e80941Smrg      v0_ndc_copy = get_tmp(c);
b8e80941Smrg      brw_MOV(p, v0_ndc_copy, deref_4f(v0_ptr, offset));
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   /* Compute the new 3D position
b8e80941Smrg    *
b8e80941Smrg    * dest_hpos = v0_hpos * (1 - t0) + v1_hpos * t0
b8e80941Smrg    */
b8e80941Smrg   {
b8e80941Smrg      GLuint delta = brw_varying_to_offset(&c->vue_map, VARYING_SLOT_POS);
b8e80941Smrg      struct brw_reg tmp = get_tmp(c);
b8e80941Smrg      brw_MUL(p, vec4(brw_null_reg()), deref_4f(v1_ptr, delta), t0);
b8e80941Smrg      brw_MAC(p, tmp, negate(deref_4f(v0_ptr, delta)), t0);
b8e80941Smrg      brw_ADD(p, deref_4f(dest_ptr, delta), deref_4f(v0_ptr, delta), tmp);
b8e80941Smrg      release_tmp(c, tmp);
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   /* Recreate the projected (NDC) coordinate in the new vertex header */
b8e80941Smrg   brw_clip_project_vertex(c, dest_ptr);
b8e80941Smrg
b8e80941Smrg   /* If we have noperspective attributes,
b8e80941Smrg    * we need to compute the screen-space t
b8e80941Smrg    */
b8e80941Smrg   if (c->key.contains_noperspective_varying) {
b8e80941Smrg      GLuint delta = brw_varying_to_offset(&c->vue_map,
b8e80941Smrg                                                BRW_VARYING_SLOT_NDC);
b8e80941Smrg      struct brw_reg tmp = get_tmp(c);
b8e80941Smrg      t_nopersp = get_tmp(c);
b8e80941Smrg
b8e80941Smrg      /* t_nopersp = vec4(v1.xy, dest.xy) */
b8e80941Smrg      brw_MOV(p, t_nopersp, deref_4f(v1_ptr, delta));
b8e80941Smrg      brw_MOV(p, tmp, deref_4f(dest_ptr, delta));
b8e80941Smrg      brw_set_default_access_mode(p, BRW_ALIGN_16);
b8e80941Smrg      brw_MOV(p,
b8e80941Smrg              brw_writemask(t_nopersp, WRITEMASK_ZW),
b8e80941Smrg              brw_swizzle(tmp, BRW_SWIZZLE_XYXY));
b8e80941Smrg
b8e80941Smrg      /* t_nopersp = vec4(v1.xy, dest.xy) - v0.xyxy */
b8e80941Smrg      brw_ADD(p, t_nopersp, t_nopersp,
b8e80941Smrg              negate(brw_swizzle(v0_ndc_copy, BRW_SWIZZLE_XYXY)));
b8e80941Smrg
b8e80941Smrg      /* Add the absolute values of the X and Y deltas so that if
b8e80941Smrg       * the points aren't in the same place on the screen we get
b8e80941Smrg       * nonzero values to divide.
b8e80941Smrg       *
b8e80941Smrg       * After that, we have vert1 - vert0 in t_nopersp.x and
b8e80941Smrg       * vertnew - vert0 in t_nopersp.y
b8e80941Smrg       *
b8e80941Smrg       * t_nopersp = vec2(|v1.x  -v0.x| + |v1.y  -v0.y|,
b8e80941Smrg       *                  |dest.x-v0.x| + |dest.y-v0.y|)
b8e80941Smrg       */
b8e80941Smrg      brw_ADD(p,
b8e80941Smrg              brw_writemask(t_nopersp, WRITEMASK_XY),
b8e80941Smrg              brw_abs(brw_swizzle(t_nopersp, BRW_SWIZZLE_XZXZ)),
b8e80941Smrg              brw_abs(brw_swizzle(t_nopersp, BRW_SWIZZLE_YWYW)));
b8e80941Smrg      brw_set_default_access_mode(p, BRW_ALIGN_1);
b8e80941Smrg
b8e80941Smrg      /* If the points are in the same place, just substitute a
b8e80941Smrg       * value to avoid divide-by-zero
b8e80941Smrg       */
b8e80941Smrg      brw_CMP(p, vec1(brw_null_reg()), BRW_CONDITIONAL_EQ,
b8e80941Smrg              vec1(t_nopersp),
b8e80941Smrg              brw_imm_f(0));
b8e80941Smrg      brw_IF(p, BRW_EXECUTE_1);
b8e80941Smrg      brw_MOV(p, t_nopersp, brw_imm_vf4(brw_float_to_vf(1.0),
b8e80941Smrg                                        brw_float_to_vf(0.0),
b8e80941Smrg                                        brw_float_to_vf(0.0),
b8e80941Smrg                                        brw_float_to_vf(0.0)));
b8e80941Smrg      brw_ENDIF(p);
b8e80941Smrg
b8e80941Smrg      /* Now compute t_nopersp = t_nopersp.y/t_nopersp.x and broadcast it. */
b8e80941Smrg      brw_math_invert(p, get_element(t_nopersp, 0), get_element(t_nopersp, 0));
b8e80941Smrg      brw_MUL(p, vec1(t_nopersp), vec1(t_nopersp),
b8e80941Smrg            vec1(suboffset(t_nopersp, 1)));
b8e80941Smrg      brw_set_default_access_mode(p, BRW_ALIGN_16);
b8e80941Smrg      brw_MOV(p, t_nopersp, brw_swizzle(t_nopersp, BRW_SWIZZLE_XXXX));
b8e80941Smrg      brw_set_default_access_mode(p, BRW_ALIGN_1);
b8e80941Smrg
b8e80941Smrg      release_tmp(c, tmp);
b8e80941Smrg      release_tmp(c, v0_ndc_copy);
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   /* Now we can iterate over each attribute
b8e80941Smrg    * (could be done in pairs?)
b8e80941Smrg    */
b8e80941Smrg   for (slot = 0; slot < c->vue_map.num_slots; slot++) {
b8e80941Smrg      int varying = c->vue_map.slot_to_varying[slot];
b8e80941Smrg      GLuint delta = brw_vue_slot_to_offset(slot);
b8e80941Smrg
b8e80941Smrg      /* HPOS, NDC already handled above */
b8e80941Smrg      if (varying == VARYING_SLOT_POS || varying == BRW_VARYING_SLOT_NDC)
b8e80941Smrg         continue;
b8e80941Smrg
b8e80941Smrg
b8e80941Smrg      if (varying == VARYING_SLOT_EDGE) {
b8e80941Smrg	 if (force_edgeflag)
b8e80941Smrg	    brw_MOV(p, deref_4f(dest_ptr, delta), brw_imm_f(1));
b8e80941Smrg	 else
b8e80941Smrg	    brw_MOV(p, deref_4f(dest_ptr, delta), deref_4f(v0_ptr, delta));
b8e80941Smrg      } else if (varying == VARYING_SLOT_PSIZ) {
b8e80941Smrg         /* PSIZ doesn't need interpolation because it isn't used by the
b8e80941Smrg          * fragment shader.
b8e80941Smrg          */
b8e80941Smrg      } else if (varying < VARYING_SLOT_MAX) {
b8e80941Smrg	 /* This is a true vertex result (and not a special value for the VUE
b8e80941Smrg	  * header), so interpolate:
b8e80941Smrg	  *
b8e80941Smrg	  *        New = attr0 + t*attr1 - t*attr0
b8e80941Smrg          *
b8e80941Smrg          * Unless the attribute is flat shaded -- in which case just copy
b8e80941Smrg          * from one of the sources (doesn't matter which; already copied from pv)
b8e80941Smrg	  */
b8e80941Smrg         GLuint interp = c->key.interp_mode[slot];
b8e80941Smrg
b8e80941Smrg         if (interp != INTERP_MODE_FLAT) {
b8e80941Smrg            struct brw_reg tmp = get_tmp(c);
b8e80941Smrg            struct brw_reg t =
b8e80941Smrg               interp == INTERP_MODE_NOPERSPECTIVE ? t_nopersp : t0;
b8e80941Smrg
b8e80941Smrg            brw_MUL(p,
b8e80941Smrg                  vec4(brw_null_reg()),
b8e80941Smrg                  deref_4f(v1_ptr, delta),
b8e80941Smrg                  t);
b8e80941Smrg
b8e80941Smrg            brw_MAC(p,
b8e80941Smrg                  tmp,
b8e80941Smrg                  negate(deref_4f(v0_ptr, delta)),
b8e80941Smrg                  t);
b8e80941Smrg
b8e80941Smrg            brw_ADD(p,
b8e80941Smrg                  deref_4f(dest_ptr, delta),
b8e80941Smrg                  deref_4f(v0_ptr, delta),
b8e80941Smrg                  tmp);
b8e80941Smrg
b8e80941Smrg            release_tmp(c, tmp);
b8e80941Smrg         }
b8e80941Smrg         else {
b8e80941Smrg            brw_MOV(p,
b8e80941Smrg                  deref_4f(dest_ptr, delta),
b8e80941Smrg                  deref_4f(v0_ptr, delta));
b8e80941Smrg         }
b8e80941Smrg      }
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   if (c->vue_map.num_slots % 2) {
b8e80941Smrg      GLuint delta = brw_vue_slot_to_offset(c->vue_map.num_slots);
b8e80941Smrg
b8e80941Smrg      brw_MOV(p, deref_4f(dest_ptr, delta), brw_imm_f(0));
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   if (c->key.contains_noperspective_varying)
b8e80941Smrg      release_tmp(c, t_nopersp);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgvoid brw_clip_emit_vue(struct brw_clip_compile *c,
b8e80941Smrg		       struct brw_indirect vert,
b8e80941Smrg                       enum brw_urb_write_flags flags,
b8e80941Smrg		       GLuint header)
b8e80941Smrg{
b8e80941Smrg   struct brw_codegen *p = &c->func;
b8e80941Smrg   bool allocate = flags & BRW_URB_WRITE_ALLOCATE;
b8e80941Smrg
b8e80941Smrg   brw_clip_ff_sync(c);
b8e80941Smrg
b8e80941Smrg   /* Any URB entry that is allocated must subsequently be used or discarded,
b8e80941Smrg    * so it doesn't make sense to mark EOT and ALLOCATE at the same time.
b8e80941Smrg    */
b8e80941Smrg   assert(!(allocate && (flags & BRW_URB_WRITE_EOT)));
b8e80941Smrg
b8e80941Smrg   /* Copy the vertex from vertn into m1..mN+1:
b8e80941Smrg    */
b8e80941Smrg   brw_copy_from_indirect(p, brw_message_reg(1), vert, c->nr_regs);
b8e80941Smrg
b8e80941Smrg   /* Overwrite PrimType and PrimStart in the message header, for
b8e80941Smrg    * each vertex in turn:
b8e80941Smrg    */
b8e80941Smrg   brw_MOV(p, get_element_ud(c->reg.R0, 2), brw_imm_ud(header));
b8e80941Smrg
b8e80941Smrg
b8e80941Smrg   /* Send each vertex as a separate write to the urb.  This
b8e80941Smrg    * is different to the concept in brw_sf_emit.c, where
b8e80941Smrg    * subsequent writes are used to build up a single urb
b8e80941Smrg    * entry.  Each of these writes instantiates a separate
b8e80941Smrg    * urb entry - (I think... what about 'allocate'?)
b8e80941Smrg    */
b8e80941Smrg   brw_urb_WRITE(p,
b8e80941Smrg		 allocate ? c->reg.R0 : retype(brw_null_reg(), BRW_REGISTER_TYPE_UD),
b8e80941Smrg		 0,
b8e80941Smrg		 c->reg.R0,
b8e80941Smrg                 flags,
b8e80941Smrg		 c->nr_regs + 1, /* msg length */
b8e80941Smrg		 allocate ? 1 : 0, /* response_length */
b8e80941Smrg		 0,		/* urb offset */
b8e80941Smrg		 BRW_URB_SWIZZLE_NONE);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrg
b8e80941Smrg
b8e80941Smrgvoid brw_clip_kill_thread(struct brw_clip_compile *c)
b8e80941Smrg{
b8e80941Smrg   struct brw_codegen *p = &c->func;
b8e80941Smrg
b8e80941Smrg   brw_clip_ff_sync(c);
b8e80941Smrg   /* Send an empty message to kill the thread and release any
b8e80941Smrg    * allocated urb entry:
b8e80941Smrg    */
b8e80941Smrg   brw_urb_WRITE(p,
b8e80941Smrg		 retype(brw_null_reg(), BRW_REGISTER_TYPE_UD),
b8e80941Smrg		 0,
b8e80941Smrg		 c->reg.R0,
b8e80941Smrg                 BRW_URB_WRITE_UNUSED | BRW_URB_WRITE_EOT_COMPLETE,
b8e80941Smrg		 1, 		/* msg len */
b8e80941Smrg		 0, 		/* response len */
b8e80941Smrg		 0,
b8e80941Smrg		 BRW_URB_SWIZZLE_NONE);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrg
b8e80941Smrg
b8e80941Smrg
b8e80941Smrgstruct brw_reg brw_clip_plane0_address( struct brw_clip_compile *c )
b8e80941Smrg{
b8e80941Smrg   return brw_address(c->reg.fixed_planes);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrg
b8e80941Smrgstruct brw_reg brw_clip_plane_stride( struct brw_clip_compile *c )
b8e80941Smrg{
b8e80941Smrg   if (c->key.nr_userclip) {
b8e80941Smrg      return brw_imm_uw(16);
b8e80941Smrg   }
b8e80941Smrg   else {
b8e80941Smrg      return brw_imm_uw(4);
b8e80941Smrg   }
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrg
b8e80941Smrg/* Distribute flatshaded attributes from provoking vertex prior to
b8e80941Smrg * clipping.
b8e80941Smrg */
b8e80941Smrgvoid brw_clip_copy_flatshaded_attributes( struct brw_clip_compile *c,
b8e80941Smrg			   GLuint to, GLuint from )
b8e80941Smrg{
b8e80941Smrg   struct brw_codegen *p = &c->func;
b8e80941Smrg
b8e80941Smrg   for (int i = 0; i < c->vue_map.num_slots; i++) {
b8e80941Smrg      if (c->key.interp_mode[i] == INTERP_MODE_FLAT) {
b8e80941Smrg         brw_MOV(p,
b8e80941Smrg                 byte_offset(c->reg.vertex[to], brw_vue_slot_to_offset(i)),
b8e80941Smrg                 byte_offset(c->reg.vertex[from], brw_vue_slot_to_offset(i)));
b8e80941Smrg      }
b8e80941Smrg   }
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrg
b8e80941Smrg
b8e80941Smrgvoid brw_clip_init_clipmask( struct brw_clip_compile *c )
b8e80941Smrg{
b8e80941Smrg   struct brw_codegen *p = &c->func;
b8e80941Smrg   struct brw_reg incoming = get_element_ud(c->reg.R0, 2);
b8e80941Smrg
b8e80941Smrg   /* Shift so that lowest outcode bit is rightmost:
b8e80941Smrg    */
b8e80941Smrg   brw_SHR(p, c->reg.planemask, incoming, brw_imm_ud(26));
b8e80941Smrg
b8e80941Smrg   if (c->key.nr_userclip) {
b8e80941Smrg      struct brw_reg tmp = retype(vec1(get_tmp(c)), BRW_REGISTER_TYPE_UD);
b8e80941Smrg
b8e80941Smrg      /* Rearrange userclip outcodes so that they come directly after
b8e80941Smrg       * the fixed plane bits.
b8e80941Smrg       */
b8e80941Smrg      if (p->devinfo->gen == 5 || p->devinfo->is_g4x)
b8e80941Smrg         brw_AND(p, tmp, incoming, brw_imm_ud(0xff<<14));
b8e80941Smrg      else
b8e80941Smrg         brw_AND(p, tmp, incoming, brw_imm_ud(0x3f<<14));
b8e80941Smrg
b8e80941Smrg      brw_SHR(p, tmp, tmp, brw_imm_ud(8));
b8e80941Smrg      brw_OR(p, c->reg.planemask, c->reg.planemask, tmp);
b8e80941Smrg
b8e80941Smrg      release_tmp(c, tmp);
b8e80941Smrg   }
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgvoid brw_clip_ff_sync(struct brw_clip_compile *c)
b8e80941Smrg{
b8e80941Smrg    struct brw_codegen *p = &c->func;
b8e80941Smrg
b8e80941Smrg    if (p->devinfo->gen == 5) {
b8e80941Smrg        brw_AND(p, brw_null_reg(), c->reg.ff_sync, brw_imm_ud(0x1));
b8e80941Smrg        brw_inst_set_cond_modifier(p->devinfo, brw_last_inst, BRW_CONDITIONAL_Z);
b8e80941Smrg        brw_IF(p, BRW_EXECUTE_1);
b8e80941Smrg        {
b8e80941Smrg            brw_OR(p, c->reg.ff_sync, c->reg.ff_sync, brw_imm_ud(0x1));
b8e80941Smrg            brw_ff_sync(p,
b8e80941Smrg			c->reg.R0,
b8e80941Smrg			0,
b8e80941Smrg			c->reg.R0,
b8e80941Smrg			1, /* allocate */
b8e80941Smrg			1, /* response length */
b8e80941Smrg			0 /* eot */);
b8e80941Smrg        }
b8e80941Smrg        brw_ENDIF(p);
b8e80941Smrg        brw_set_default_predicate_control(p, BRW_PREDICATE_NONE);
b8e80941Smrg    }
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgvoid brw_clip_init_ff_sync(struct brw_clip_compile *c)
b8e80941Smrg{
b8e80941Smrg    struct brw_codegen *p = &c->func;
b8e80941Smrg
b8e80941Smrg    if (p->devinfo->gen == 5) {
b8e80941Smrg        brw_MOV(p, c->reg.ff_sync, brw_imm_ud(0));
b8e80941Smrg    }
b8e80941Smrg}