intel/compiler/brw_clip_util.c

01e04c3fSmrg/*
01e04c3fSmrg Copyright (C) Intel Corp.  2006.  All Rights Reserved.
01e04c3fSmrg Intel funded Tungsten Graphics to
01e04c3fSmrg develop this 3D driver.
01e04c3fSmrg
01e04c3fSmrg Permission is hereby granted, free of charge, to any person obtaining
01e04c3fSmrg a copy of this software and associated documentation files (the
01e04c3fSmrg "Software"), to deal in the Software without restriction, including
01e04c3fSmrg without limitation the rights to use, copy, modify, merge, publish,
01e04c3fSmrg distribute, sublicense, and/or sell copies of the Software, and to
01e04c3fSmrg permit persons to whom the Software is furnished to do so, subject to
01e04c3fSmrg the following conditions:
01e04c3fSmrg
01e04c3fSmrg The above copyright notice and this permission notice (including the
01e04c3fSmrg next paragraph) shall be included in all copies or substantial
01e04c3fSmrg portions of the Software.
01e04c3fSmrg
01e04c3fSmrg THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
01e04c3fSmrg EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
01e04c3fSmrg MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.
01e04c3fSmrg IN NO EVENT SHALL THE COPYRIGHT OWNER(S) AND/OR ITS SUPPLIERS BE
01e04c3fSmrg LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION
01e04c3fSmrg OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION
01e04c3fSmrg WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
01e04c3fSmrg
01e04c3fSmrg **********************************************************************/
01e04c3fSmrg /*
01e04c3fSmrg  * Authors:
01e04c3fSmrg  *   Keith Whitwell <keithw@vmware.com>
01e04c3fSmrg  */
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrg#include "main/macros.h"
01e04c3fSmrg#include "main/enums.h"
01e04c3fSmrg#include "program/program.h"
01e04c3fSmrg
01e04c3fSmrg#include "brw_clip.h"
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrgstruct brw_reg get_tmp( struct brw_clip_compile *c )
01e04c3fSmrg{
01e04c3fSmrg   struct brw_reg tmp = brw_vec4_grf(c->last_tmp, 0);
01e04c3fSmrg
01e04c3fSmrg   if (++c->last_tmp > c->prog_data.total_grf)
01e04c3fSmrg      c->prog_data.total_grf = c->last_tmp;
01e04c3fSmrg
01e04c3fSmrg   return tmp;
01e04c3fSmrg}
01e04c3fSmrg
01e04c3fSmrgstatic void release_tmp( struct brw_clip_compile *c, struct brw_reg tmp )
01e04c3fSmrg{
01e04c3fSmrg   if (tmp.nr == c->last_tmp-1)
01e04c3fSmrg      c->last_tmp--;
01e04c3fSmrg}
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrgstatic struct brw_reg make_plane_ud(GLuint x, GLuint y, GLuint z, GLuint w)
01e04c3fSmrg{
01e04c3fSmrg   return brw_imm_ud((w<<24) | (z<<16) | (y<<8) | x);
01e04c3fSmrg}
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrgvoid brw_clip_init_planes( struct brw_clip_compile *c )
01e04c3fSmrg{
01e04c3fSmrg   struct brw_codegen *p = &c->func;
01e04c3fSmrg
01e04c3fSmrg   if (!c->key.nr_userclip) {
01e04c3fSmrg      brw_MOV(p, get_element_ud(c->reg.fixed_planes, 0), make_plane_ud( 0,    0, 0xff, 1));
01e04c3fSmrg      brw_MOV(p, get_element_ud(c->reg.fixed_planes, 1), make_plane_ud( 0,    0,    1, 1));
01e04c3fSmrg      brw_MOV(p, get_element_ud(c->reg.fixed_planes, 2), make_plane_ud( 0, 0xff,    0, 1));
01e04c3fSmrg      brw_MOV(p, get_element_ud(c->reg.fixed_planes, 3), make_plane_ud( 0,    1,    0, 1));
01e04c3fSmrg      brw_MOV(p, get_element_ud(c->reg.fixed_planes, 4), make_plane_ud(0xff,  0,    0, 1));
01e04c3fSmrg      brw_MOV(p, get_element_ud(c->reg.fixed_planes, 5), make_plane_ud( 1,    0,    0, 1));
01e04c3fSmrg   }
01e04c3fSmrg}
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrg#define W 3
01e04c3fSmrg
01e04c3fSmrg/* Project 'pos' to screen space (or back again), overwrite with results:
01e04c3fSmrg */
01e04c3fSmrgvoid brw_clip_project_position(struct brw_clip_compile *c, struct brw_reg pos )
01e04c3fSmrg{
01e04c3fSmrg   struct brw_codegen *p = &c->func;
01e04c3fSmrg
01e04c3fSmrg   /* calc rhw
01e04c3fSmrg    */
01e04c3fSmrg   brw_math_invert(p, get_element(pos, W), get_element(pos, W));
01e04c3fSmrg
01e04c3fSmrg   /* value.xyz *= value.rhw
01e04c3fSmrg    */
01e04c3fSmrg   brw_set_default_access_mode(p, BRW_ALIGN_16);
01e04c3fSmrg   brw_MUL(p, brw_writemask(pos, WRITEMASK_XYZ), pos,
01e04c3fSmrg           brw_swizzle(pos, BRW_SWIZZLE_WWWW));
01e04c3fSmrg   brw_set_default_access_mode(p, BRW_ALIGN_1);
01e04c3fSmrg}
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrgstatic void brw_clip_project_vertex( struct brw_clip_compile *c,
01e04c3fSmrg				     struct brw_indirect vert_addr )
01e04c3fSmrg{
01e04c3fSmrg   struct brw_codegen *p = &c->func;
01e04c3fSmrg   struct brw_reg tmp = get_tmp(c);
01e04c3fSmrg   GLuint hpos_offset = brw_varying_to_offset(&c->vue_map, VARYING_SLOT_POS);
01e04c3fSmrg   GLuint ndc_offset = brw_varying_to_offset(&c->vue_map,
01e04c3fSmrg                                             BRW_VARYING_SLOT_NDC);
01e04c3fSmrg
01e04c3fSmrg   /* Fixup position.  Extract from the original vertex and re-project
01e04c3fSmrg    * to screen space:
01e04c3fSmrg    */
01e04c3fSmrg   brw_MOV(p, tmp, deref_4f(vert_addr, hpos_offset));
01e04c3fSmrg   brw_clip_project_position(c, tmp);
01e04c3fSmrg   brw_MOV(p, deref_4f(vert_addr, ndc_offset), tmp);
01e04c3fSmrg
01e04c3fSmrg   release_tmp(c, tmp);
01e04c3fSmrg}
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrg/* Interpolate between two vertices and put the result into a0.0.
01e04c3fSmrg * Increment a0.0 accordingly.
01e04c3fSmrg *
01e04c3fSmrg * Beware that dest_ptr can be equal to v0_ptr!
01e04c3fSmrg */
01e04c3fSmrgvoid brw_clip_interp_vertex( struct brw_clip_compile *c,
01e04c3fSmrg			     struct brw_indirect dest_ptr,
01e04c3fSmrg			     struct brw_indirect v0_ptr, /* from */
01e04c3fSmrg			     struct brw_indirect v1_ptr, /* to */
01e04c3fSmrg			     struct brw_reg t0,
01e04c3fSmrg			     bool force_edgeflag)
01e04c3fSmrg{
01e04c3fSmrg   struct brw_codegen *p = &c->func;
01e04c3fSmrg   struct brw_reg t_nopersp, v0_ndc_copy;
01e04c3fSmrg   GLuint slot;
01e04c3fSmrg
01e04c3fSmrg   /* Just copy the vertex header:
01e04c3fSmrg    */
01e04c3fSmrg   /*
01e04c3fSmrg    * After CLIP stage, only first 256 bits of the VUE are read
01e04c3fSmrg    * back on Ironlake, so needn't change it
01e04c3fSmrg    */
01e04c3fSmrg   brw_copy_indirect_to_indirect(p, dest_ptr, v0_ptr, 1);
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrg   /* First handle the 3D and NDC interpolation, in case we
01e04c3fSmrg    * need noperspective interpolation. Doing it early has no
01e04c3fSmrg    * performance impact in any case.
01e04c3fSmrg    */
01e04c3fSmrg
01e04c3fSmrg   /* Take a copy of the v0 NDC coordinates, in case dest == v0. */
01e04c3fSmrg   if (c->key.contains_noperspective_varying) {
01e04c3fSmrg      GLuint offset = brw_varying_to_offset(&c->vue_map,
01e04c3fSmrg                                                 BRW_VARYING_SLOT_NDC);
01e04c3fSmrg      v0_ndc_copy = get_tmp(c);
01e04c3fSmrg      brw_MOV(p, v0_ndc_copy, deref_4f(v0_ptr, offset));
01e04c3fSmrg   }
01e04c3fSmrg
01e04c3fSmrg   /* Compute the new 3D position
01e04c3fSmrg    *
01e04c3fSmrg    * dest_hpos = v0_hpos * (1 - t0) + v1_hpos * t0
01e04c3fSmrg    */
01e04c3fSmrg   {
01e04c3fSmrg      GLuint delta = brw_varying_to_offset(&c->vue_map, VARYING_SLOT_POS);
01e04c3fSmrg      struct brw_reg tmp = get_tmp(c);
01e04c3fSmrg      brw_MUL(p, vec4(brw_null_reg()), deref_4f(v1_ptr, delta), t0);
01e04c3fSmrg      brw_MAC(p, tmp, negate(deref_4f(v0_ptr, delta)), t0);
01e04c3fSmrg      brw_ADD(p, deref_4f(dest_ptr, delta), deref_4f(v0_ptr, delta), tmp);
01e04c3fSmrg      release_tmp(c, tmp);
01e04c3fSmrg   }
01e04c3fSmrg
01e04c3fSmrg   /* Recreate the projected (NDC) coordinate in the new vertex header */
01e04c3fSmrg   brw_clip_project_vertex(c, dest_ptr);
01e04c3fSmrg
01e04c3fSmrg   /* If we have noperspective attributes,
01e04c3fSmrg    * we need to compute the screen-space t
01e04c3fSmrg    */
01e04c3fSmrg   if (c->key.contains_noperspective_varying) {
01e04c3fSmrg      GLuint delta = brw_varying_to_offset(&c->vue_map,
01e04c3fSmrg                                                BRW_VARYING_SLOT_NDC);
01e04c3fSmrg      struct brw_reg tmp = get_tmp(c);
01e04c3fSmrg      t_nopersp = get_tmp(c);
01e04c3fSmrg
01e04c3fSmrg      /* t_nopersp = vec4(v1.xy, dest.xy) */
01e04c3fSmrg      brw_MOV(p, t_nopersp, deref_4f(v1_ptr, delta));
01e04c3fSmrg      brw_MOV(p, tmp, deref_4f(dest_ptr, delta));
01e04c3fSmrg      brw_set_default_access_mode(p, BRW_ALIGN_16);
01e04c3fSmrg      brw_MOV(p,
01e04c3fSmrg              brw_writemask(t_nopersp, WRITEMASK_ZW),
01e04c3fSmrg              brw_swizzle(tmp, BRW_SWIZZLE_XYXY));
01e04c3fSmrg
01e04c3fSmrg      /* t_nopersp = vec4(v1.xy, dest.xy) - v0.xyxy */
01e04c3fSmrg      brw_ADD(p, t_nopersp, t_nopersp,
01e04c3fSmrg              negate(brw_swizzle(v0_ndc_copy, BRW_SWIZZLE_XYXY)));
01e04c3fSmrg
01e04c3fSmrg      /* Add the absolute values of the X and Y deltas so that if
01e04c3fSmrg       * the points aren't in the same place on the screen we get
01e04c3fSmrg       * nonzero values to divide.
01e04c3fSmrg       *
01e04c3fSmrg       * After that, we have vert1 - vert0 in t_nopersp.x and
01e04c3fSmrg       * vertnew - vert0 in t_nopersp.y
01e04c3fSmrg       *
01e04c3fSmrg       * t_nopersp = vec2(|v1.x  -v0.x| + |v1.y  -v0.y|,
01e04c3fSmrg       *                  |dest.x-v0.x| + |dest.y-v0.y|)
01e04c3fSmrg       */
01e04c3fSmrg      brw_ADD(p,
01e04c3fSmrg              brw_writemask(t_nopersp, WRITEMASK_XY),
01e04c3fSmrg              brw_abs(brw_swizzle(t_nopersp, BRW_SWIZZLE_XZXZ)),
01e04c3fSmrg              brw_abs(brw_swizzle(t_nopersp, BRW_SWIZZLE_YWYW)));
01e04c3fSmrg      brw_set_default_access_mode(p, BRW_ALIGN_1);
01e04c3fSmrg
01e04c3fSmrg      /* If the points are in the same place, just substitute a
01e04c3fSmrg       * value to avoid divide-by-zero
01e04c3fSmrg       */
01e04c3fSmrg      brw_CMP(p, vec1(brw_null_reg()), BRW_CONDITIONAL_EQ,
01e04c3fSmrg              vec1(t_nopersp),
01e04c3fSmrg              brw_imm_f(0));
01e04c3fSmrg      brw_IF(p, BRW_EXECUTE_1);
01e04c3fSmrg      brw_MOV(p, t_nopersp, brw_imm_vf4(brw_float_to_vf(1.0),
01e04c3fSmrg                                        brw_float_to_vf(0.0),
01e04c3fSmrg                                        brw_float_to_vf(0.0),
01e04c3fSmrg                                        brw_float_to_vf(0.0)));
01e04c3fSmrg      brw_ENDIF(p);
01e04c3fSmrg
01e04c3fSmrg      /* Now compute t_nopersp = t_nopersp.y/t_nopersp.x and broadcast it. */
01e04c3fSmrg      brw_math_invert(p, get_element(t_nopersp, 0), get_element(t_nopersp, 0));
01e04c3fSmrg      brw_MUL(p, vec1(t_nopersp), vec1(t_nopersp),
01e04c3fSmrg            vec1(suboffset(t_nopersp, 1)));
01e04c3fSmrg      brw_set_default_access_mode(p, BRW_ALIGN_16);
01e04c3fSmrg      brw_MOV(p, t_nopersp, brw_swizzle(t_nopersp, BRW_SWIZZLE_XXXX));
01e04c3fSmrg      brw_set_default_access_mode(p, BRW_ALIGN_1);
01e04c3fSmrg
01e04c3fSmrg      release_tmp(c, tmp);
01e04c3fSmrg      release_tmp(c, v0_ndc_copy);
01e04c3fSmrg   }
01e04c3fSmrg
01e04c3fSmrg   /* Now we can iterate over each attribute
01e04c3fSmrg    * (could be done in pairs?)
01e04c3fSmrg    */
01e04c3fSmrg   for (slot = 0; slot < c->vue_map.num_slots; slot++) {
01e04c3fSmrg      int varying = c->vue_map.slot_to_varying[slot];
01e04c3fSmrg      GLuint delta = brw_vue_slot_to_offset(slot);
01e04c3fSmrg
01e04c3fSmrg      /* HPOS, NDC already handled above */
01e04c3fSmrg      if (varying == VARYING_SLOT_POS || varying == BRW_VARYING_SLOT_NDC)
01e04c3fSmrg         continue;
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrg      if (varying == VARYING_SLOT_EDGE) {
01e04c3fSmrg	 if (force_edgeflag)
01e04c3fSmrg	    brw_MOV(p, deref_4f(dest_ptr, delta), brw_imm_f(1));
01e04c3fSmrg	 else
01e04c3fSmrg	    brw_MOV(p, deref_4f(dest_ptr, delta), deref_4f(v0_ptr, delta));
01e04c3fSmrg      } else if (varying == VARYING_SLOT_PSIZ) {
01e04c3fSmrg         /* PSIZ doesn't need interpolation because it isn't used by the
01e04c3fSmrg          * fragment shader.
01e04c3fSmrg          */
01e04c3fSmrg      } else if (varying < VARYING_SLOT_MAX) {
01e04c3fSmrg	 /* This is a true vertex result (and not a special value for the VUE
01e04c3fSmrg	  * header), so interpolate:
01e04c3fSmrg	  *
01e04c3fSmrg	  *        New = attr0 + t*attr1 - t*attr0
01e04c3fSmrg          *
01e04c3fSmrg          * Unless the attribute is flat shaded -- in which case just copy
01e04c3fSmrg          * from one of the sources (doesn't matter which; already copied from pv)
01e04c3fSmrg	  */
01e04c3fSmrg         GLuint interp = c->key.interp_mode[slot];
01e04c3fSmrg
01e04c3fSmrg         if (interp != INTERP_MODE_FLAT) {
01e04c3fSmrg            struct brw_reg tmp = get_tmp(c);
01e04c3fSmrg            struct brw_reg t =
01e04c3fSmrg               interp == INTERP_MODE_NOPERSPECTIVE ? t_nopersp : t0;
01e04c3fSmrg
01e04c3fSmrg            brw_MUL(p,
01e04c3fSmrg                  vec4(brw_null_reg()),
01e04c3fSmrg                  deref_4f(v1_ptr, delta),
01e04c3fSmrg                  t);
01e04c3fSmrg
01e04c3fSmrg            brw_MAC(p,
01e04c3fSmrg                  tmp,
01e04c3fSmrg                  negate(deref_4f(v0_ptr, delta)),
01e04c3fSmrg                  t);
01e04c3fSmrg
01e04c3fSmrg            brw_ADD(p,
01e04c3fSmrg                  deref_4f(dest_ptr, delta),
01e04c3fSmrg                  deref_4f(v0_ptr, delta),
01e04c3fSmrg                  tmp);
01e04c3fSmrg
01e04c3fSmrg            release_tmp(c, tmp);
01e04c3fSmrg         }
01e04c3fSmrg         else {
01e04c3fSmrg            brw_MOV(p,
01e04c3fSmrg                  deref_4f(dest_ptr, delta),
01e04c3fSmrg                  deref_4f(v0_ptr, delta));
01e04c3fSmrg         }
01e04c3fSmrg      }
01e04c3fSmrg   }
01e04c3fSmrg
01e04c3fSmrg   if (c->vue_map.num_slots % 2) {
01e04c3fSmrg      GLuint delta = brw_vue_slot_to_offset(c->vue_map.num_slots);
01e04c3fSmrg
01e04c3fSmrg      brw_MOV(p, deref_4f(dest_ptr, delta), brw_imm_f(0));
01e04c3fSmrg   }
01e04c3fSmrg
01e04c3fSmrg   if (c->key.contains_noperspective_varying)
01e04c3fSmrg      release_tmp(c, t_nopersp);
01e04c3fSmrg}
01e04c3fSmrg
01e04c3fSmrgvoid brw_clip_emit_vue(struct brw_clip_compile *c,
01e04c3fSmrg		       struct brw_indirect vert,
01e04c3fSmrg                       enum brw_urb_write_flags flags,
01e04c3fSmrg		       GLuint header)
01e04c3fSmrg{
01e04c3fSmrg   struct brw_codegen *p = &c->func;
01e04c3fSmrg   bool allocate = flags & BRW_URB_WRITE_ALLOCATE;
01e04c3fSmrg
01e04c3fSmrg   brw_clip_ff_sync(c);
01e04c3fSmrg
01e04c3fSmrg   /* Any URB entry that is allocated must subsequently be used or discarded,
01e04c3fSmrg    * so it doesn't make sense to mark EOT and ALLOCATE at the same time.
01e04c3fSmrg    */
01e04c3fSmrg   assert(!(allocate && (flags & BRW_URB_WRITE_EOT)));
01e04c3fSmrg
01e04c3fSmrg   /* Copy the vertex from vertn into m1..mN+1:
01e04c3fSmrg    */
01e04c3fSmrg   brw_copy_from_indirect(p, brw_message_reg(1), vert, c->nr_regs);
01e04c3fSmrg
01e04c3fSmrg   /* Overwrite PrimType and PrimStart in the message header, for
01e04c3fSmrg    * each vertex in turn:
01e04c3fSmrg    */
01e04c3fSmrg   brw_MOV(p, get_element_ud(c->reg.R0, 2), brw_imm_ud(header));
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrg   /* Send each vertex as a separate write to the urb.  This
01e04c3fSmrg    * is different to the concept in brw_sf_emit.c, where
01e04c3fSmrg    * subsequent writes are used to build up a single urb
01e04c3fSmrg    * entry.  Each of these writes instantiates a separate
01e04c3fSmrg    * urb entry - (I think... what about 'allocate'?)
01e04c3fSmrg    */
01e04c3fSmrg   brw_urb_WRITE(p,
01e04c3fSmrg		 allocate ? c->reg.R0 : retype(brw_null_reg(), BRW_REGISTER_TYPE_UD),
01e04c3fSmrg		 0,
01e04c3fSmrg		 c->reg.R0,
01e04c3fSmrg                 flags,
01e04c3fSmrg		 c->nr_regs + 1, /* msg length */
01e04c3fSmrg		 allocate ? 1 : 0, /* response_length */
01e04c3fSmrg		 0,		/* urb offset */
01e04c3fSmrg		 BRW_URB_SWIZZLE_NONE);
01e04c3fSmrg}
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrgvoid brw_clip_kill_thread(struct brw_clip_compile *c)
01e04c3fSmrg{
01e04c3fSmrg   struct brw_codegen *p = &c->func;
01e04c3fSmrg
01e04c3fSmrg   brw_clip_ff_sync(c);
01e04c3fSmrg   /* Send an empty message to kill the thread and release any
01e04c3fSmrg    * allocated urb entry:
01e04c3fSmrg    */
01e04c3fSmrg   brw_urb_WRITE(p,
01e04c3fSmrg		 retype(brw_null_reg(), BRW_REGISTER_TYPE_UD),
01e04c3fSmrg		 0,
01e04c3fSmrg		 c->reg.R0,
01e04c3fSmrg                 BRW_URB_WRITE_UNUSED | BRW_URB_WRITE_EOT_COMPLETE,
01e04c3fSmrg		 1, 		/* msg len */
01e04c3fSmrg		 0, 		/* response len */
01e04c3fSmrg		 0,
01e04c3fSmrg		 BRW_URB_SWIZZLE_NONE);
01e04c3fSmrg}
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrgstruct brw_reg brw_clip_plane0_address( struct brw_clip_compile *c )
01e04c3fSmrg{
01e04c3fSmrg   return brw_address(c->reg.fixed_planes);
01e04c3fSmrg}
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrgstruct brw_reg brw_clip_plane_stride( struct brw_clip_compile *c )
01e04c3fSmrg{
01e04c3fSmrg   if (c->key.nr_userclip) {
01e04c3fSmrg      return brw_imm_uw(16);
01e04c3fSmrg   }
01e04c3fSmrg   else {
01e04c3fSmrg      return brw_imm_uw(4);
01e04c3fSmrg   }
01e04c3fSmrg}
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrg/* Distribute flatshaded attributes from provoking vertex prior to
01e04c3fSmrg * clipping.
01e04c3fSmrg */
01e04c3fSmrgvoid brw_clip_copy_flatshaded_attributes( struct brw_clip_compile *c,
01e04c3fSmrg			   GLuint to, GLuint from )
01e04c3fSmrg{
01e04c3fSmrg   struct brw_codegen *p = &c->func;
01e04c3fSmrg
01e04c3fSmrg   for (int i = 0; i < c->vue_map.num_slots; i++) {
01e04c3fSmrg      if (c->key.interp_mode[i] == INTERP_MODE_FLAT) {
01e04c3fSmrg         brw_MOV(p,
01e04c3fSmrg                 byte_offset(c->reg.vertex[to], brw_vue_slot_to_offset(i)),
01e04c3fSmrg                 byte_offset(c->reg.vertex[from], brw_vue_slot_to_offset(i)));
01e04c3fSmrg      }
01e04c3fSmrg   }
01e04c3fSmrg}
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrg
01e04c3fSmrgvoid brw_clip_init_clipmask( struct brw_clip_compile *c )
01e04c3fSmrg{
01e04c3fSmrg   struct brw_codegen *p = &c->func;
01e04c3fSmrg   struct brw_reg incoming = get_element_ud(c->reg.R0, 2);
01e04c3fSmrg
01e04c3fSmrg   /* Shift so that lowest outcode bit is rightmost:
01e04c3fSmrg    */
01e04c3fSmrg   brw_SHR(p, c->reg.planemask, incoming, brw_imm_ud(26));
01e04c3fSmrg
01e04c3fSmrg   if (c->key.nr_userclip) {
01e04c3fSmrg      struct brw_reg tmp = retype(vec1(get_tmp(c)), BRW_REGISTER_TYPE_UD);
01e04c3fSmrg
01e04c3fSmrg      /* Rearrange userclip outcodes so that they come directly after
01e04c3fSmrg       * the fixed plane bits.
01e04c3fSmrg       */
7ec681f3Smrg      if (p->devinfo->ver == 5 || p->devinfo->is_g4x)
01e04c3fSmrg         brw_AND(p, tmp, incoming, brw_imm_ud(0xff<<14));
01e04c3fSmrg      else
01e04c3fSmrg         brw_AND(p, tmp, incoming, brw_imm_ud(0x3f<<14));
01e04c3fSmrg
01e04c3fSmrg      brw_SHR(p, tmp, tmp, brw_imm_ud(8));
01e04c3fSmrg      brw_OR(p, c->reg.planemask, c->reg.planemask, tmp);
01e04c3fSmrg
01e04c3fSmrg      release_tmp(c, tmp);
01e04c3fSmrg   }
01e04c3fSmrg}
01e04c3fSmrg
01e04c3fSmrgvoid brw_clip_ff_sync(struct brw_clip_compile *c)
01e04c3fSmrg{
01e04c3fSmrg    struct brw_codegen *p = &c->func;
01e04c3fSmrg
7ec681f3Smrg    if (p->devinfo->ver == 5) {
01e04c3fSmrg        brw_AND(p, brw_null_reg(), c->reg.ff_sync, brw_imm_ud(0x1));
01e04c3fSmrg        brw_inst_set_cond_modifier(p->devinfo, brw_last_inst, BRW_CONDITIONAL_Z);
01e04c3fSmrg        brw_IF(p, BRW_EXECUTE_1);
01e04c3fSmrg        {
01e04c3fSmrg            brw_OR(p, c->reg.ff_sync, c->reg.ff_sync, brw_imm_ud(0x1));
01e04c3fSmrg            brw_ff_sync(p,
01e04c3fSmrg			c->reg.R0,
01e04c3fSmrg			0,
01e04c3fSmrg			c->reg.R0,
01e04c3fSmrg			1, /* allocate */
01e04c3fSmrg			1, /* response length */
01e04c3fSmrg			0 /* eot */);
01e04c3fSmrg        }
01e04c3fSmrg        brw_ENDIF(p);
01e04c3fSmrg        brw_set_default_predicate_control(p, BRW_PREDICATE_NONE);
01e04c3fSmrg    }
01e04c3fSmrg}
01e04c3fSmrg
01e04c3fSmrgvoid brw_clip_init_ff_sync(struct brw_clip_compile *c)
01e04c3fSmrg{
01e04c3fSmrg    struct brw_codegen *p = &c->func;
01e04c3fSmrg
7ec681f3Smrg    if (p->devinfo->ver == 5) {
01e04c3fSmrg        brw_MOV(p, c->reg.ff_sync, brw_imm_ud(0));
01e04c3fSmrg    }
01e04c3fSmrg}