mesa/main/texcompress_fxt1.c

848b8605Smrg/*
848b8605Smrg * Mesa 3-D graphics library
848b8605Smrg *
848b8605Smrg * Copyright (C) 1999-2008  Brian Paul   All Rights Reserved.
848b8605Smrg *
848b8605Smrg * Permission is hereby granted, free of charge, to any person obtaining a
848b8605Smrg * copy of this software and associated documentation files (the "Software"),
848b8605Smrg * to deal in the Software without restriction, including without limitation
848b8605Smrg * the rights to use, copy, modify, merge, publish, distribute, sublicense,
848b8605Smrg * and/or sell copies of the Software, and to permit persons to whom the
848b8605Smrg * Software is furnished to do so, subject to the following conditions:
848b8605Smrg *
848b8605Smrg * The above copyright notice and this permission notice shall be included
848b8605Smrg * in all copies or substantial portions of the Software.
848b8605Smrg *
848b8605Smrg * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS
848b8605Smrg * OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
848b8605Smrg * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL
848b8605Smrg * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR
848b8605Smrg * OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE,
848b8605Smrg * ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR
848b8605Smrg * OTHER DEALINGS IN THE SOFTWARE.
848b8605Smrg */
848b8605Smrg
848b8605Smrg
848b8605Smrg/**
848b8605Smrg * \file texcompress_fxt1.c
848b8605Smrg * GL_3DFX_texture_compression_FXT1 support.
848b8605Smrg */
848b8605Smrg
848b8605Smrg
b8e80941Smrg#include "errors.h"
848b8605Smrg#include "glheader.h"
848b8605Smrg#include "imports.h"
848b8605Smrg#include "image.h"
848b8605Smrg#include "macros.h"
848b8605Smrg#include "mipmap.h"
848b8605Smrg#include "texcompress.h"
848b8605Smrg#include "texcompress_fxt1.h"
848b8605Smrg#include "texstore.h"
b8e80941Smrg#include "mtypes.h"
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfxt1_encode (GLuint width, GLuint height, GLint comps,
848b8605Smrg             const void *source, GLint srcRowStride,
848b8605Smrg             void *dest, GLint destRowStride);
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfxt1_decode_1 (const void *texture, GLint stride,
848b8605Smrg               GLint i, GLint j, GLubyte *rgba);
848b8605Smrg
848b8605Smrg
848b8605Smrg/**
848b8605Smrg * Store user's image in rgb_fxt1 format.
848b8605Smrg */
848b8605SmrgGLboolean
848b8605Smrg_mesa_texstore_rgb_fxt1(TEXSTORE_PARAMS)
848b8605Smrg{
848b8605Smrg   const GLubyte *pixels;
848b8605Smrg   GLint srcRowStride;
848b8605Smrg   GLubyte *dst;
848b8605Smrg   const GLubyte *tempImage = NULL;
848b8605Smrg
b8e80941Smrg   assert(dstFormat == MESA_FORMAT_RGB_FXT1);
848b8605Smrg
848b8605Smrg   if (srcFormat != GL_RGB ||
848b8605Smrg       srcType != GL_UNSIGNED_BYTE ||
848b8605Smrg       ctx->_ImageTransferState ||
b8e80941Smrg       ALIGN(srcPacking->RowLength, srcPacking->Alignment) != srcWidth ||
848b8605Smrg       srcPacking->SwapBytes) {
848b8605Smrg      /* convert image to RGB/GLubyte */
b8e80941Smrg      GLubyte *tempImageSlices[1];
b8e80941Smrg      int rgbRowStride = 3 * srcWidth * sizeof(GLubyte);
b8e80941Smrg      tempImage = malloc(srcWidth * srcHeight * 3 * sizeof(GLubyte));
848b8605Smrg      if (!tempImage)
848b8605Smrg         return GL_FALSE; /* out of memory */
b8e80941Smrg      tempImageSlices[0] = (GLubyte *) tempImage;
b8e80941Smrg      _mesa_texstore(ctx, dims,
b8e80941Smrg                     baseInternalFormat,
b8e80941Smrg                     MESA_FORMAT_RGB_UNORM8,
b8e80941Smrg                     rgbRowStride, tempImageSlices,
b8e80941Smrg                     srcWidth, srcHeight, srcDepth,
b8e80941Smrg                     srcFormat, srcType, srcAddr,
b8e80941Smrg                     srcPacking);
848b8605Smrg      pixels = tempImage;
848b8605Smrg      srcRowStride = 3 * srcWidth;
848b8605Smrg      srcFormat = GL_RGB;
848b8605Smrg   }
848b8605Smrg   else {
848b8605Smrg      pixels = _mesa_image_address2d(srcPacking, srcAddr, srcWidth, srcHeight,
848b8605Smrg                                     srcFormat, srcType, 0, 0);
848b8605Smrg
848b8605Smrg      srcRowStride = _mesa_image_row_stride(srcPacking, srcWidth, srcFormat,
848b8605Smrg                                            srcType) / sizeof(GLubyte);
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   dst = dstSlices[0];
848b8605Smrg
848b8605Smrg   fxt1_encode(srcWidth, srcHeight, 3, pixels, srcRowStride,
848b8605Smrg               dst, dstRowStride);
848b8605Smrg
848b8605Smrg   free((void*) tempImage);
848b8605Smrg
848b8605Smrg   return GL_TRUE;
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrg/**
848b8605Smrg * Store user's image in rgba_fxt1 format.
848b8605Smrg */
848b8605SmrgGLboolean
848b8605Smrg_mesa_texstore_rgba_fxt1(TEXSTORE_PARAMS)
848b8605Smrg{
848b8605Smrg   const GLubyte *pixels;
848b8605Smrg   GLint srcRowStride;
848b8605Smrg   GLubyte *dst;
848b8605Smrg   const GLubyte *tempImage = NULL;
848b8605Smrg
b8e80941Smrg   assert(dstFormat == MESA_FORMAT_RGBA_FXT1);
848b8605Smrg
848b8605Smrg   if (srcFormat != GL_RGBA ||
848b8605Smrg       srcType != GL_UNSIGNED_BYTE ||
848b8605Smrg       ctx->_ImageTransferState ||
848b8605Smrg       srcPacking->SwapBytes) {
848b8605Smrg      /* convert image to RGBA/GLubyte */
b8e80941Smrg      GLubyte *tempImageSlices[1];
b8e80941Smrg      int rgbaRowStride = 4 * srcWidth * sizeof(GLubyte);
b8e80941Smrg      tempImage = malloc(srcWidth * srcHeight * 4 * sizeof(GLubyte));
848b8605Smrg      if (!tempImage)
848b8605Smrg         return GL_FALSE; /* out of memory */
b8e80941Smrg      tempImageSlices[0] = (GLubyte *) tempImage;
b8e80941Smrg      _mesa_texstore(ctx, dims,
b8e80941Smrg                     baseInternalFormat,
b8e80941Smrg                     _mesa_little_endian() ? MESA_FORMAT_R8G8B8A8_UNORM
b8e80941Smrg                                           : MESA_FORMAT_A8B8G8R8_UNORM,
b8e80941Smrg                     rgbaRowStride, tempImageSlices,
b8e80941Smrg                     srcWidth, srcHeight, srcDepth,
b8e80941Smrg                     srcFormat, srcType, srcAddr,
b8e80941Smrg                     srcPacking);
848b8605Smrg      pixels = tempImage;
848b8605Smrg      srcRowStride = 4 * srcWidth;
848b8605Smrg      srcFormat = GL_RGBA;
848b8605Smrg   }
848b8605Smrg   else {
848b8605Smrg      pixels = _mesa_image_address2d(srcPacking, srcAddr, srcWidth, srcHeight,
848b8605Smrg                                     srcFormat, srcType, 0, 0);
848b8605Smrg
848b8605Smrg      srcRowStride = _mesa_image_row_stride(srcPacking, srcWidth, srcFormat,
848b8605Smrg                                            srcType) / sizeof(GLubyte);
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   dst = dstSlices[0];
848b8605Smrg
848b8605Smrg   fxt1_encode(srcWidth, srcHeight, 4, pixels, srcRowStride,
848b8605Smrg               dst, dstRowStride);
848b8605Smrg
848b8605Smrg   free((void*) tempImage);
848b8605Smrg
848b8605Smrg   return GL_TRUE;
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrg/***************************************************************************\
848b8605Smrg * FXT1 encoder
848b8605Smrg *
848b8605Smrg * The encoder was built by reversing the decoder,
848b8605Smrg * and is vaguely based on Texus2 by 3dfx. Note that this code
848b8605Smrg * is merely a proof of concept, since it is highly UNoptimized;
848b8605Smrg * moreover, it is sub-optimal due to initial conditions passed
848b8605Smrg * to Lloyd's algorithm (the interpolation modes are even worse).
848b8605Smrg\***************************************************************************/
848b8605Smrg
848b8605Smrg
848b8605Smrg#define MAX_COMP 4 /* ever needed maximum number of components in texel */
848b8605Smrg#define MAX_VECT 4 /* ever needed maximum number of base vectors to find */
848b8605Smrg#define N_TEXELS 32 /* number of texels in a block (always 32) */
848b8605Smrg#define LL_N_REP 50 /* number of iterations in lloyd's vq */
848b8605Smrg#define LL_RMS_D 10 /* fault tolerance (maximum delta) */
848b8605Smrg#define LL_RMS_E 255 /* fault tolerance (maximum error) */
848b8605Smrg#define ALPHA_TS 2 /* alpha threshold: (255 - ALPHA_TS) deemed opaque */
b8e80941Smrgstatic const GLuint zero = 0;
b8e80941Smrg#define ISTBLACK(v) (memcmp(&(v), &zero, sizeof(zero)) == 0)
848b8605Smrg
848b8605Smrg/*
848b8605Smrg * Define a 64-bit unsigned integer type and macros
848b8605Smrg */
848b8605Smrg#if 1
848b8605Smrg
848b8605Smrg#define FX64_NATIVE 1
848b8605Smrg
848b8605Smrgtypedef uint64_t Fx64;
848b8605Smrg
848b8605Smrg#define FX64_MOV32(a, b) a = b
848b8605Smrg#define FX64_OR32(a, b)  a |= b
848b8605Smrg#define FX64_SHL(a, c)   a <<= c
848b8605Smrg
848b8605Smrg#else
848b8605Smrg
848b8605Smrg#define FX64_NATIVE 0
848b8605Smrg
848b8605Smrgtypedef struct {
848b8605Smrg   GLuint lo, hi;
848b8605Smrg} Fx64;
848b8605Smrg
848b8605Smrg#define FX64_MOV32(a, b) a.lo = b
848b8605Smrg#define FX64_OR32(a, b)  a.lo |= b
848b8605Smrg
848b8605Smrg#define FX64_SHL(a, c)                                 \
848b8605Smrg   do {                                                \
848b8605Smrg       if ((c) >= 32) {                                \
848b8605Smrg          a.hi = a.lo << ((c) - 32);                   \
848b8605Smrg          a.lo = 0;                                    \
848b8605Smrg       } else {                                        \
848b8605Smrg          a.hi = (a.hi << (c)) | (a.lo >> (32 - (c))); \
848b8605Smrg          a.lo <<= (c);                                \
848b8605Smrg       }                                               \
848b8605Smrg   } while (0)
848b8605Smrg
848b8605Smrg#endif
848b8605Smrg
848b8605Smrg
848b8605Smrg#define F(i) (GLfloat)1 /* can be used to obtain an oblong metric: 0.30 / 0.59 / 0.11 */
848b8605Smrg#define SAFECDOT 1 /* for paranoids */
848b8605Smrg
848b8605Smrg#define MAKEIVEC(NV, NC, IV, B, V0, V1)  \
848b8605Smrg   do {                                  \
848b8605Smrg      /* compute interpolation vector */ \
848b8605Smrg      GLfloat d2 = 0.0F;                 \
848b8605Smrg      GLfloat rd2;                       \
848b8605Smrg                                         \
848b8605Smrg      for (i = 0; i < NC; i++) {         \
848b8605Smrg         IV[i] = (V1[i] - V0[i]) * F(i); \
848b8605Smrg         d2 += IV[i] * IV[i];            \
848b8605Smrg      }                                  \
848b8605Smrg      rd2 = (GLfloat)NV / d2;            \
848b8605Smrg      B = 0;                             \
848b8605Smrg      for (i = 0; i < NC; i++) {         \
848b8605Smrg         IV[i] *= F(i);                  \
848b8605Smrg         B -= IV[i] * V0[i];             \
848b8605Smrg         IV[i] *= rd2;                   \
848b8605Smrg      }                                  \
848b8605Smrg      B = B * rd2 + 0.5f;                \
848b8605Smrg   } while (0)
848b8605Smrg
848b8605Smrg#define CALCCDOT(TEXEL, NV, NC, IV, B, V)\
848b8605Smrg   do {                                  \
848b8605Smrg      GLfloat dot = 0.0F;                \
848b8605Smrg      for (i = 0; i < NC; i++) {         \
848b8605Smrg         dot += V[i] * IV[i];            \
848b8605Smrg      }                                  \
848b8605Smrg      TEXEL = (GLint)(dot + B);          \
848b8605Smrg      if (SAFECDOT) {                    \
848b8605Smrg         if (TEXEL < 0) {                \
848b8605Smrg            TEXEL = 0;                   \
848b8605Smrg         } else if (TEXEL > NV) {        \
848b8605Smrg            TEXEL = NV;                  \
848b8605Smrg         }                               \
848b8605Smrg      }                                  \
848b8605Smrg   } while (0)
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic GLint
848b8605Smrgfxt1_bestcol (GLfloat vec[][MAX_COMP], GLint nv,
848b8605Smrg              GLubyte input[MAX_COMP], GLint nc)
848b8605Smrg{
848b8605Smrg   GLint i, j, best = -1;
848b8605Smrg   GLfloat err = 1e9; /* big enough */
848b8605Smrg
848b8605Smrg   for (j = 0; j < nv; j++) {
848b8605Smrg      GLfloat e = 0.0F;
848b8605Smrg      for (i = 0; i < nc; i++) {
848b8605Smrg         e += (vec[j][i] - input[i]) * (vec[j][i] - input[i]);
848b8605Smrg      }
848b8605Smrg      if (e < err) {
848b8605Smrg         err = e;
848b8605Smrg         best = j;
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   return best;
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic GLint
848b8605Smrgfxt1_worst (GLfloat vec[MAX_COMP],
848b8605Smrg            GLubyte input[N_TEXELS][MAX_COMP], GLint nc, GLint n)
848b8605Smrg{
848b8605Smrg   GLint i, k, worst = -1;
848b8605Smrg   GLfloat err = -1.0F; /* small enough */
848b8605Smrg
848b8605Smrg   for (k = 0; k < n; k++) {
848b8605Smrg      GLfloat e = 0.0F;
848b8605Smrg      for (i = 0; i < nc; i++) {
848b8605Smrg         e += (vec[i] - input[k][i]) * (vec[i] - input[k][i]);
848b8605Smrg      }
848b8605Smrg      if (e > err) {
848b8605Smrg         err = e;
848b8605Smrg         worst = k;
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   return worst;
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic GLint
848b8605Smrgfxt1_variance (GLdouble variance[MAX_COMP],
848b8605Smrg               GLubyte input[N_TEXELS][MAX_COMP], GLint nc, GLint n)
848b8605Smrg{
848b8605Smrg   GLint i, k, best = 0;
848b8605Smrg   GLint sx, sx2;
848b8605Smrg   GLdouble var, maxvar = -1; /* small enough */
848b8605Smrg   GLdouble teenth = 1.0 / n;
848b8605Smrg
848b8605Smrg   for (i = 0; i < nc; i++) {
848b8605Smrg      sx = sx2 = 0;
848b8605Smrg      for (k = 0; k < n; k++) {
848b8605Smrg         GLint t = input[k][i];
848b8605Smrg         sx += t;
848b8605Smrg         sx2 += t * t;
848b8605Smrg      }
848b8605Smrg      var = sx2 * teenth - sx * sx * teenth * teenth;
848b8605Smrg      if (maxvar < var) {
848b8605Smrg         maxvar = var;
848b8605Smrg         best = i;
848b8605Smrg      }
848b8605Smrg      if (variance) {
848b8605Smrg         variance[i] = var;
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   return best;
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic GLint
848b8605Smrgfxt1_choose (GLfloat vec[][MAX_COMP], GLint nv,
848b8605Smrg             GLubyte input[N_TEXELS][MAX_COMP], GLint nc, GLint n)
848b8605Smrg{
848b8605Smrg#if 0
848b8605Smrg   /* Choose colors from a grid.
848b8605Smrg    */
848b8605Smrg   GLint i, j;
848b8605Smrg
848b8605Smrg   for (j = 0; j < nv; j++) {
848b8605Smrg      GLint m = j * (n - 1) / (nv - 1);
848b8605Smrg      for (i = 0; i < nc; i++) {
848b8605Smrg         vec[j][i] = input[m][i];
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg#else
848b8605Smrg   /* Our solution here is to find the darkest and brightest colors in
848b8605Smrg    * the 8x4 tile and use those as the two representative colors.
848b8605Smrg    * There are probably better algorithms to use (histogram-based).
848b8605Smrg    */
848b8605Smrg   GLint i, j, k;
848b8605Smrg   GLint minSum = 2000; /* big enough */
848b8605Smrg   GLint maxSum = -1; /* small enough */
848b8605Smrg   GLint minCol = 0; /* phoudoin: silent compiler! */
848b8605Smrg   GLint maxCol = 0; /* phoudoin: silent compiler! */
848b8605Smrg
848b8605Smrg   struct {
848b8605Smrg      GLint flag;
848b8605Smrg      GLint key;
848b8605Smrg      GLint freq;
848b8605Smrg      GLint idx;
848b8605Smrg   } hist[N_TEXELS];
848b8605Smrg   GLint lenh = 0;
848b8605Smrg
848b8605Smrg   memset(hist, 0, sizeof(hist));
848b8605Smrg
848b8605Smrg   for (k = 0; k < n; k++) {
848b8605Smrg      GLint l;
848b8605Smrg      GLint key = 0;
848b8605Smrg      GLint sum = 0;
848b8605Smrg      for (i = 0; i < nc; i++) {
848b8605Smrg         key <<= 8;
848b8605Smrg         key |= input[k][i];
848b8605Smrg         sum += input[k][i];
848b8605Smrg      }
848b8605Smrg      for (l = 0; l < n; l++) {
848b8605Smrg         if (!hist[l].flag) {
848b8605Smrg            /* alloc new slot */
848b8605Smrg            hist[l].flag = !0;
848b8605Smrg            hist[l].key = key;
848b8605Smrg            hist[l].freq = 1;
848b8605Smrg            hist[l].idx = k;
848b8605Smrg            lenh = l + 1;
848b8605Smrg            break;
848b8605Smrg         } else if (hist[l].key == key) {
848b8605Smrg            hist[l].freq++;
848b8605Smrg            break;
848b8605Smrg         }
848b8605Smrg      }
848b8605Smrg      if (minSum > sum) {
848b8605Smrg         minSum = sum;
848b8605Smrg         minCol = k;
848b8605Smrg      }
848b8605Smrg      if (maxSum < sum) {
848b8605Smrg         maxSum = sum;
848b8605Smrg         maxCol = k;
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   if (lenh <= nv) {
848b8605Smrg      for (j = 0; j < lenh; j++) {
848b8605Smrg         for (i = 0; i < nc; i++) {
848b8605Smrg            vec[j][i] = (GLfloat)input[hist[j].idx][i];
848b8605Smrg         }
848b8605Smrg      }
848b8605Smrg      for (; j < nv; j++) {
848b8605Smrg         for (i = 0; i < nc; i++) {
848b8605Smrg            vec[j][i] = vec[0][i];
848b8605Smrg         }
848b8605Smrg      }
848b8605Smrg      return 0;
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   for (j = 0; j < nv; j++) {
848b8605Smrg      for (i = 0; i < nc; i++) {
848b8605Smrg         vec[j][i] = ((nv - 1 - j) * input[minCol][i] + j * input[maxCol][i] + (nv - 1) / 2) / (GLfloat)(nv - 1);
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg#endif
848b8605Smrg
848b8605Smrg   return !0;
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic GLint
848b8605Smrgfxt1_lloyd (GLfloat vec[][MAX_COMP], GLint nv,
848b8605Smrg            GLubyte input[N_TEXELS][MAX_COMP], GLint nc, GLint n)
848b8605Smrg{
848b8605Smrg   /* Use the generalized lloyd's algorithm for VQ:
848b8605Smrg    *     find 4 color vectors.
848b8605Smrg    *
848b8605Smrg    *     for each sample color
848b8605Smrg    *         sort to nearest vector.
848b8605Smrg    *
848b8605Smrg    *     replace each vector with the centroid of its matching colors.
848b8605Smrg    *
848b8605Smrg    *     repeat until RMS doesn't improve.
848b8605Smrg    *
848b8605Smrg    *     if a color vector has no samples, or becomes the same as another
848b8605Smrg    *     vector, replace it with the color which is farthest from a sample.
848b8605Smrg    *
848b8605Smrg    * vec[][MAX_COMP]           initial vectors and resulting colors
848b8605Smrg    * nv                        number of resulting colors required
848b8605Smrg    * input[N_TEXELS][MAX_COMP] input texels
848b8605Smrg    * nc                        number of components in input / vec
848b8605Smrg    * n                         number of input samples
848b8605Smrg    */
848b8605Smrg
848b8605Smrg   GLint sum[MAX_VECT][MAX_COMP]; /* used to accumulate closest texels */
848b8605Smrg   GLint cnt[MAX_VECT]; /* how many times a certain vector was chosen */
848b8605Smrg   GLfloat error, lasterror = 1e9;
848b8605Smrg
848b8605Smrg   GLint i, j, k, rep;
848b8605Smrg
848b8605Smrg   /* the quantizer */
848b8605Smrg   for (rep = 0; rep < LL_N_REP; rep++) {
848b8605Smrg      /* reset sums & counters */
848b8605Smrg      for (j = 0; j < nv; j++) {
848b8605Smrg         for (i = 0; i < nc; i++) {
848b8605Smrg            sum[j][i] = 0;
848b8605Smrg         }
848b8605Smrg         cnt[j] = 0;
848b8605Smrg      }
848b8605Smrg      error = 0;
848b8605Smrg
848b8605Smrg      /* scan whole block */
848b8605Smrg      for (k = 0; k < n; k++) {
848b8605Smrg#if 1
848b8605Smrg         GLint best = -1;
848b8605Smrg         GLfloat err = 1e9; /* big enough */
848b8605Smrg         /* determine best vector */
848b8605Smrg         for (j = 0; j < nv; j++) {
848b8605Smrg            GLfloat e = (vec[j][0] - input[k][0]) * (vec[j][0] - input[k][0]) +
848b8605Smrg                      (vec[j][1] - input[k][1]) * (vec[j][1] - input[k][1]) +
848b8605Smrg                      (vec[j][2] - input[k][2]) * (vec[j][2] - input[k][2]);
848b8605Smrg            if (nc == 4) {
848b8605Smrg               e += (vec[j][3] - input[k][3]) * (vec[j][3] - input[k][3]);
848b8605Smrg            }
848b8605Smrg            if (e < err) {
848b8605Smrg               err = e;
848b8605Smrg               best = j;
848b8605Smrg            }
848b8605Smrg         }
848b8605Smrg#else
848b8605Smrg         GLint best = fxt1_bestcol(vec, nv, input[k], nc, &err);
848b8605Smrg#endif
848b8605Smrg         assert(best >= 0);
848b8605Smrg         /* add in closest color */
848b8605Smrg         for (i = 0; i < nc; i++) {
848b8605Smrg            sum[best][i] += input[k][i];
848b8605Smrg         }
848b8605Smrg         /* mark this vector as used */
848b8605Smrg         cnt[best]++;
848b8605Smrg         /* accumulate error */
848b8605Smrg         error += err;
848b8605Smrg      }
848b8605Smrg
848b8605Smrg      /* check RMS */
848b8605Smrg      if ((error < LL_RMS_E) ||
848b8605Smrg          ((error < lasterror) && ((lasterror - error) < LL_RMS_D))) {
848b8605Smrg         return !0; /* good match */
848b8605Smrg      }
848b8605Smrg      lasterror = error;
848b8605Smrg
848b8605Smrg      /* move each vector to the barycenter of its closest colors */
848b8605Smrg      for (j = 0; j < nv; j++) {
848b8605Smrg         if (cnt[j]) {
848b8605Smrg            GLfloat div = 1.0F / cnt[j];
848b8605Smrg            for (i = 0; i < nc; i++) {
848b8605Smrg               vec[j][i] = div * sum[j][i];
848b8605Smrg            }
848b8605Smrg         } else {
848b8605Smrg            /* this vec has no samples or is identical with a previous vec */
848b8605Smrg            GLint worst = fxt1_worst(vec[j], input, nc, n);
848b8605Smrg            for (i = 0; i < nc; i++) {
848b8605Smrg               vec[j][i] = input[worst][i];
848b8605Smrg            }
848b8605Smrg         }
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   return 0; /* could not converge fast enough */
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfxt1_quantize_CHROMA (GLuint *cc,
848b8605Smrg                      GLubyte input[N_TEXELS][MAX_COMP])
848b8605Smrg{
848b8605Smrg   const GLint n_vect = 4; /* 4 base vectors to find */
848b8605Smrg   const GLint n_comp = 3; /* 3 components: R, G, B */
848b8605Smrg   GLfloat vec[MAX_VECT][MAX_COMP];
848b8605Smrg   GLint i, j, k;
848b8605Smrg   Fx64 hi; /* high quadword */
848b8605Smrg   GLuint lohi, lolo; /* low quadword: hi dword, lo dword */
848b8605Smrg
848b8605Smrg   if (fxt1_choose(vec, n_vect, input, n_comp, N_TEXELS) != 0) {
848b8605Smrg      fxt1_lloyd(vec, n_vect, input, n_comp, N_TEXELS);
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   FX64_MOV32(hi, 4); /* cc-chroma = "010" + unused bit */
848b8605Smrg   for (j = n_vect - 1; j >= 0; j--) {
848b8605Smrg      for (i = 0; i < n_comp; i++) {
848b8605Smrg         /* add in colors */
848b8605Smrg         FX64_SHL(hi, 5);
848b8605Smrg         FX64_OR32(hi, (GLuint)(vec[j][i] / 8.0F));
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg   ((Fx64 *)cc)[1] = hi;
848b8605Smrg
848b8605Smrg   lohi = lolo = 0;
848b8605Smrg   /* right microtile */
848b8605Smrg   for (k = N_TEXELS - 1; k >= N_TEXELS/2; k--) {
848b8605Smrg      lohi <<= 2;
848b8605Smrg      lohi |= fxt1_bestcol(vec, n_vect, input[k], n_comp);
848b8605Smrg   }
848b8605Smrg   /* left microtile */
848b8605Smrg   for (; k >= 0; k--) {
848b8605Smrg      lolo <<= 2;
848b8605Smrg      lolo |= fxt1_bestcol(vec, n_vect, input[k], n_comp);
848b8605Smrg   }
848b8605Smrg   cc[1] = lohi;
848b8605Smrg   cc[0] = lolo;
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfxt1_quantize_ALPHA0 (GLuint *cc,
848b8605Smrg                      GLubyte input[N_TEXELS][MAX_COMP],
848b8605Smrg                      GLubyte reord[N_TEXELS][MAX_COMP], GLint n)
848b8605Smrg{
848b8605Smrg   const GLint n_vect = 3; /* 3 base vectors to find */
848b8605Smrg   const GLint n_comp = 4; /* 4 components: R, G, B, A */
848b8605Smrg   GLfloat vec[MAX_VECT][MAX_COMP];
848b8605Smrg   GLint i, j, k;
848b8605Smrg   Fx64 hi; /* high quadword */
848b8605Smrg   GLuint lohi, lolo; /* low quadword: hi dword, lo dword */
848b8605Smrg
848b8605Smrg   /* the last vector indicates zero */
848b8605Smrg   for (i = 0; i < n_comp; i++) {
848b8605Smrg      vec[n_vect][i] = 0;
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   /* the first n texels in reord are guaranteed to be non-zero */
848b8605Smrg   if (fxt1_choose(vec, n_vect, reord, n_comp, n) != 0) {
848b8605Smrg      fxt1_lloyd(vec, n_vect, reord, n_comp, n);
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   FX64_MOV32(hi, 6); /* alpha = "011" + lerp = 0 */
848b8605Smrg   for (j = n_vect - 1; j >= 0; j--) {
848b8605Smrg      /* add in alphas */
848b8605Smrg      FX64_SHL(hi, 5);
848b8605Smrg      FX64_OR32(hi, (GLuint)(vec[j][ACOMP] / 8.0F));
848b8605Smrg   }
848b8605Smrg   for (j = n_vect - 1; j >= 0; j--) {
848b8605Smrg      for (i = 0; i < n_comp - 1; i++) {
848b8605Smrg         /* add in colors */
848b8605Smrg         FX64_SHL(hi, 5);
848b8605Smrg         FX64_OR32(hi, (GLuint)(vec[j][i] / 8.0F));
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg   ((Fx64 *)cc)[1] = hi;
848b8605Smrg
848b8605Smrg   lohi = lolo = 0;
848b8605Smrg   /* right microtile */
848b8605Smrg   for (k = N_TEXELS - 1; k >= N_TEXELS/2; k--) {
848b8605Smrg      lohi <<= 2;
848b8605Smrg      lohi |= fxt1_bestcol(vec, n_vect + 1, input[k], n_comp);
848b8605Smrg   }
848b8605Smrg   /* left microtile */
848b8605Smrg   for (; k >= 0; k--) {
848b8605Smrg      lolo <<= 2;
848b8605Smrg      lolo |= fxt1_bestcol(vec, n_vect + 1, input[k], n_comp);
848b8605Smrg   }
848b8605Smrg   cc[1] = lohi;
848b8605Smrg   cc[0] = lolo;
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfxt1_quantize_ALPHA1 (GLuint *cc,
848b8605Smrg                      GLubyte input[N_TEXELS][MAX_COMP])
848b8605Smrg{
848b8605Smrg   const GLint n_vect = 3; /* highest vector number in each microtile */
848b8605Smrg   const GLint n_comp = 4; /* 4 components: R, G, B, A */
848b8605Smrg   GLfloat vec[1 + 1 + 1][MAX_COMP]; /* 1.5 extrema for each sub-block */
848b8605Smrg   GLfloat b, iv[MAX_COMP]; /* interpolation vector */
848b8605Smrg   GLint i, j, k;
848b8605Smrg   Fx64 hi; /* high quadword */
848b8605Smrg   GLuint lohi, lolo; /* low quadword: hi dword, lo dword */
848b8605Smrg
848b8605Smrg   GLint minSum;
848b8605Smrg   GLint maxSum;
848b8605Smrg   GLint minColL = 0, maxColL = 0;
848b8605Smrg   GLint minColR = 0, maxColR = 0;
848b8605Smrg   GLint sumL = 0, sumR = 0;
848b8605Smrg   GLint nn_comp;
848b8605Smrg   /* Our solution here is to find the darkest and brightest colors in
848b8605Smrg    * the 4x4 tile and use those as the two representative colors.
848b8605Smrg    * There are probably better algorithms to use (histogram-based).
848b8605Smrg    */
848b8605Smrg   nn_comp = n_comp;
848b8605Smrg   while ((minColL == maxColL) && nn_comp) {
848b8605Smrg       minSum = 2000; /* big enough */
848b8605Smrg       maxSum = -1; /* small enough */
848b8605Smrg       for (k = 0; k < N_TEXELS / 2; k++) {
848b8605Smrg           GLint sum = 0;
848b8605Smrg           for (i = 0; i < nn_comp; i++) {
848b8605Smrg               sum += input[k][i];
848b8605Smrg           }
848b8605Smrg           if (minSum > sum) {
848b8605Smrg               minSum = sum;
848b8605Smrg               minColL = k;
848b8605Smrg           }
848b8605Smrg           if (maxSum < sum) {
848b8605Smrg               maxSum = sum;
848b8605Smrg               maxColL = k;
848b8605Smrg           }
848b8605Smrg           sumL += sum;
848b8605Smrg       }
848b8605Smrg
848b8605Smrg       nn_comp--;
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   nn_comp = n_comp;
848b8605Smrg   while ((minColR == maxColR) && nn_comp) {
848b8605Smrg       minSum = 2000; /* big enough */
848b8605Smrg       maxSum = -1; /* small enough */
848b8605Smrg       for (k = N_TEXELS / 2; k < N_TEXELS; k++) {
848b8605Smrg           GLint sum = 0;
848b8605Smrg           for (i = 0; i < nn_comp; i++) {
848b8605Smrg               sum += input[k][i];
848b8605Smrg           }
848b8605Smrg           if (minSum > sum) {
848b8605Smrg               minSum = sum;
848b8605Smrg               minColR = k;
848b8605Smrg           }
848b8605Smrg           if (maxSum < sum) {
848b8605Smrg               maxSum = sum;
848b8605Smrg               maxColR = k;
848b8605Smrg           }
848b8605Smrg           sumR += sum;
848b8605Smrg       }
848b8605Smrg
848b8605Smrg       nn_comp--;
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   /* choose the common vector (yuck!) */
848b8605Smrg   {
848b8605Smrg      GLint j1, j2;
848b8605Smrg      GLint v1 = 0, v2 = 0;
848b8605Smrg      GLfloat err = 1e9; /* big enough */
848b8605Smrg      GLfloat tv[2 * 2][MAX_COMP]; /* 2 extrema for each sub-block */
848b8605Smrg      for (i = 0; i < n_comp; i++) {
848b8605Smrg         tv[0][i] = input[minColL][i];
848b8605Smrg         tv[1][i] = input[maxColL][i];
848b8605Smrg         tv[2][i] = input[minColR][i];
848b8605Smrg         tv[3][i] = input[maxColR][i];
848b8605Smrg      }
848b8605Smrg      for (j1 = 0; j1 < 2; j1++) {
848b8605Smrg         for (j2 = 2; j2 < 4; j2++) {
848b8605Smrg            GLfloat e = 0.0F;
848b8605Smrg            for (i = 0; i < n_comp; i++) {
848b8605Smrg               e += (tv[j1][i] - tv[j2][i]) * (tv[j1][i] - tv[j2][i]);
848b8605Smrg            }
848b8605Smrg            if (e < err) {
848b8605Smrg               err = e;
848b8605Smrg               v1 = j1;
848b8605Smrg               v2 = j2;
848b8605Smrg            }
848b8605Smrg         }
848b8605Smrg      }
848b8605Smrg      for (i = 0; i < n_comp; i++) {
848b8605Smrg         vec[0][i] = tv[1 - v1][i];
848b8605Smrg         vec[1][i] = (tv[v1][i] * sumL + tv[v2][i] * sumR) / (sumL + sumR);
848b8605Smrg         vec[2][i] = tv[5 - v2][i];
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   /* left microtile */
848b8605Smrg   cc[0] = 0;
848b8605Smrg   if (minColL != maxColL) {
848b8605Smrg      /* compute interpolation vector */
848b8605Smrg      MAKEIVEC(n_vect, n_comp, iv, b, vec[0], vec[1]);
848b8605Smrg
848b8605Smrg      /* add in texels */
848b8605Smrg      lolo = 0;
848b8605Smrg      for (k = N_TEXELS / 2 - 1; k >= 0; k--) {
848b8605Smrg         GLint texel;
848b8605Smrg         /* interpolate color */
848b8605Smrg         CALCCDOT(texel, n_vect, n_comp, iv, b, input[k]);
848b8605Smrg         /* add in texel */
848b8605Smrg         lolo <<= 2;
848b8605Smrg         lolo |= texel;
848b8605Smrg      }
848b8605Smrg
848b8605Smrg      cc[0] = lolo;
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   /* right microtile */
848b8605Smrg   cc[1] = 0;
848b8605Smrg   if (minColR != maxColR) {
848b8605Smrg      /* compute interpolation vector */
848b8605Smrg      MAKEIVEC(n_vect, n_comp, iv, b, vec[2], vec[1]);
848b8605Smrg
848b8605Smrg      /* add in texels */
848b8605Smrg      lohi = 0;
848b8605Smrg      for (k = N_TEXELS - 1; k >= N_TEXELS / 2; k--) {
848b8605Smrg         GLint texel;
848b8605Smrg         /* interpolate color */
848b8605Smrg         CALCCDOT(texel, n_vect, n_comp, iv, b, input[k]);
848b8605Smrg         /* add in texel */
848b8605Smrg         lohi <<= 2;
848b8605Smrg         lohi |= texel;
848b8605Smrg      }
848b8605Smrg
848b8605Smrg      cc[1] = lohi;
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   FX64_MOV32(hi, 7); /* alpha = "011" + lerp = 1 */
848b8605Smrg   for (j = n_vect - 1; j >= 0; j--) {
848b8605Smrg      /* add in alphas */
848b8605Smrg      FX64_SHL(hi, 5);
848b8605Smrg      FX64_OR32(hi, (GLuint)(vec[j][ACOMP] / 8.0F));
848b8605Smrg   }
848b8605Smrg   for (j = n_vect - 1; j >= 0; j--) {
848b8605Smrg      for (i = 0; i < n_comp - 1; i++) {
848b8605Smrg         /* add in colors */
848b8605Smrg         FX64_SHL(hi, 5);
848b8605Smrg         FX64_OR32(hi, (GLuint)(vec[j][i] / 8.0F));
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg   ((Fx64 *)cc)[1] = hi;
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfxt1_quantize_HI (GLuint *cc,
848b8605Smrg                  GLubyte input[N_TEXELS][MAX_COMP],
848b8605Smrg                  GLubyte reord[N_TEXELS][MAX_COMP], GLint n)
848b8605Smrg{
848b8605Smrg   const GLint n_vect = 6; /* highest vector number */
848b8605Smrg   const GLint n_comp = 3; /* 3 components: R, G, B */
848b8605Smrg   GLfloat b = 0.0F;       /* phoudoin: silent compiler! */
848b8605Smrg   GLfloat iv[MAX_COMP];   /* interpolation vector */
848b8605Smrg   GLint i, k;
848b8605Smrg   GLuint hihi; /* high quadword: hi dword */
848b8605Smrg
848b8605Smrg   GLint minSum = 2000; /* big enough */
848b8605Smrg   GLint maxSum = -1; /* small enough */
848b8605Smrg   GLint minCol = 0; /* phoudoin: silent compiler! */
848b8605Smrg   GLint maxCol = 0; /* phoudoin: silent compiler! */
848b8605Smrg
848b8605Smrg   /* Our solution here is to find the darkest and brightest colors in
848b8605Smrg    * the 8x4 tile and use those as the two representative colors.
848b8605Smrg    * There are probably better algorithms to use (histogram-based).
848b8605Smrg    */
848b8605Smrg   for (k = 0; k < n; k++) {
848b8605Smrg      GLint sum = 0;
848b8605Smrg      for (i = 0; i < n_comp; i++) {
848b8605Smrg         sum += reord[k][i];
848b8605Smrg      }
848b8605Smrg      if (minSum > sum) {
848b8605Smrg         minSum = sum;
848b8605Smrg         minCol = k;
848b8605Smrg      }
848b8605Smrg      if (maxSum < sum) {
848b8605Smrg         maxSum = sum;
848b8605Smrg         maxCol = k;
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   hihi = 0; /* cc-hi = "00" */
848b8605Smrg   for (i = 0; i < n_comp; i++) {
848b8605Smrg      /* add in colors */
848b8605Smrg      hihi <<= 5;
848b8605Smrg      hihi |= reord[maxCol][i] >> 3;
848b8605Smrg   }
848b8605Smrg   for (i = 0; i < n_comp; i++) {
848b8605Smrg      /* add in colors */
848b8605Smrg      hihi <<= 5;
848b8605Smrg      hihi |= reord[minCol][i] >> 3;
848b8605Smrg   }
848b8605Smrg   cc[3] = hihi;
848b8605Smrg   cc[0] = cc[1] = cc[2] = 0;
848b8605Smrg
848b8605Smrg   /* compute interpolation vector */
848b8605Smrg   if (minCol != maxCol) {
848b8605Smrg      MAKEIVEC(n_vect, n_comp, iv, b, reord[minCol], reord[maxCol]);
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   /* add in texels */
848b8605Smrg   for (k = N_TEXELS - 1; k >= 0; k--) {
848b8605Smrg      GLint t = k * 3;
848b8605Smrg      GLuint *kk = (GLuint *)((char *)cc + t / 8);
848b8605Smrg      GLint texel = n_vect + 1; /* transparent black */
848b8605Smrg
848b8605Smrg      if (!ISTBLACK(input[k])) {
848b8605Smrg         if (minCol != maxCol) {
848b8605Smrg            /* interpolate color */
848b8605Smrg            CALCCDOT(texel, n_vect, n_comp, iv, b, input[k]);
848b8605Smrg            /* add in texel */
848b8605Smrg            kk[0] |= texel << (t & 7);
848b8605Smrg         }
848b8605Smrg      } else {
848b8605Smrg         /* add in texel */
848b8605Smrg         kk[0] |= texel << (t & 7);
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfxt1_quantize_MIXED1 (GLuint *cc,
848b8605Smrg                      GLubyte input[N_TEXELS][MAX_COMP])
848b8605Smrg{
848b8605Smrg   const GLint n_vect = 2; /* highest vector number in each microtile */
848b8605Smrg   const GLint n_comp = 3; /* 3 components: R, G, B */
848b8605Smrg   GLubyte vec[2 * 2][MAX_COMP]; /* 2 extrema for each sub-block */
848b8605Smrg   GLfloat b, iv[MAX_COMP]; /* interpolation vector */
848b8605Smrg   GLint i, j, k;
848b8605Smrg   Fx64 hi; /* high quadword */
848b8605Smrg   GLuint lohi, lolo; /* low quadword: hi dword, lo dword */
848b8605Smrg
848b8605Smrg   GLint minSum;
848b8605Smrg   GLint maxSum;
848b8605Smrg   GLint minColL = 0, maxColL = -1;
848b8605Smrg   GLint minColR = 0, maxColR = -1;
848b8605Smrg
848b8605Smrg   /* Our solution here is to find the darkest and brightest colors in
848b8605Smrg    * the 4x4 tile and use those as the two representative colors.
848b8605Smrg    * There are probably better algorithms to use (histogram-based).
848b8605Smrg    */
848b8605Smrg   minSum = 2000; /* big enough */
848b8605Smrg   maxSum = -1; /* small enough */
848b8605Smrg   for (k = 0; k < N_TEXELS / 2; k++) {
848b8605Smrg      if (!ISTBLACK(input[k])) {
848b8605Smrg         GLint sum = 0;
848b8605Smrg         for (i = 0; i < n_comp; i++) {
848b8605Smrg            sum += input[k][i];
848b8605Smrg         }
848b8605Smrg         if (minSum > sum) {
848b8605Smrg            minSum = sum;
848b8605Smrg            minColL = k;
848b8605Smrg         }
848b8605Smrg         if (maxSum < sum) {
848b8605Smrg            maxSum = sum;
848b8605Smrg            maxColL = k;
848b8605Smrg         }
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg   minSum = 2000; /* big enough */
848b8605Smrg   maxSum = -1; /* small enough */
848b8605Smrg   for (; k < N_TEXELS; k++) {
848b8605Smrg      if (!ISTBLACK(input[k])) {
848b8605Smrg         GLint sum = 0;
848b8605Smrg         for (i = 0; i < n_comp; i++) {
848b8605Smrg            sum += input[k][i];
848b8605Smrg         }
848b8605Smrg         if (minSum > sum) {
848b8605Smrg            minSum = sum;
848b8605Smrg            minColR = k;
848b8605Smrg         }
848b8605Smrg         if (maxSum < sum) {
848b8605Smrg            maxSum = sum;
848b8605Smrg            maxColR = k;
848b8605Smrg         }
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   /* left microtile */
848b8605Smrg   if (maxColL == -1) {
848b8605Smrg      /* all transparent black */
848b8605Smrg      cc[0] = ~0u;
848b8605Smrg      for (i = 0; i < n_comp; i++) {
848b8605Smrg         vec[0][i] = 0;
848b8605Smrg         vec[1][i] = 0;
848b8605Smrg      }
848b8605Smrg   } else {
848b8605Smrg      cc[0] = 0;
848b8605Smrg      for (i = 0; i < n_comp; i++) {
848b8605Smrg         vec[0][i] = input[minColL][i];
848b8605Smrg         vec[1][i] = input[maxColL][i];
848b8605Smrg      }
848b8605Smrg      if (minColL != maxColL) {
848b8605Smrg         /* compute interpolation vector */
848b8605Smrg         MAKEIVEC(n_vect, n_comp, iv, b, vec[0], vec[1]);
848b8605Smrg
848b8605Smrg         /* add in texels */
848b8605Smrg         lolo = 0;
848b8605Smrg         for (k = N_TEXELS / 2 - 1; k >= 0; k--) {
848b8605Smrg            GLint texel = n_vect + 1; /* transparent black */
848b8605Smrg            if (!ISTBLACK(input[k])) {
848b8605Smrg               /* interpolate color */
848b8605Smrg               CALCCDOT(texel, n_vect, n_comp, iv, b, input[k]);
848b8605Smrg            }
848b8605Smrg            /* add in texel */
848b8605Smrg            lolo <<= 2;
848b8605Smrg            lolo |= texel;
848b8605Smrg         }
848b8605Smrg         cc[0] = lolo;
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   /* right microtile */
848b8605Smrg   if (maxColR == -1) {
848b8605Smrg      /* all transparent black */
848b8605Smrg      cc[1] = ~0u;
848b8605Smrg      for (i = 0; i < n_comp; i++) {
848b8605Smrg         vec[2][i] = 0;
848b8605Smrg         vec[3][i] = 0;
848b8605Smrg      }
848b8605Smrg   } else {
848b8605Smrg      cc[1] = 0;
848b8605Smrg      for (i = 0; i < n_comp; i++) {
848b8605Smrg         vec[2][i] = input[minColR][i];
848b8605Smrg         vec[3][i] = input[maxColR][i];
848b8605Smrg      }
848b8605Smrg      if (minColR != maxColR) {
848b8605Smrg         /* compute interpolation vector */
848b8605Smrg         MAKEIVEC(n_vect, n_comp, iv, b, vec[2], vec[3]);
848b8605Smrg
848b8605Smrg         /* add in texels */
848b8605Smrg         lohi = 0;
848b8605Smrg         for (k = N_TEXELS - 1; k >= N_TEXELS / 2; k--) {
848b8605Smrg            GLint texel = n_vect + 1; /* transparent black */
848b8605Smrg            if (!ISTBLACK(input[k])) {
848b8605Smrg               /* interpolate color */
848b8605Smrg               CALCCDOT(texel, n_vect, n_comp, iv, b, input[k]);
848b8605Smrg            }
848b8605Smrg            /* add in texel */
848b8605Smrg            lohi <<= 2;
848b8605Smrg            lohi |= texel;
848b8605Smrg         }
848b8605Smrg         cc[1] = lohi;
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   FX64_MOV32(hi, 9 | (vec[3][GCOMP] & 4) | ((vec[1][GCOMP] >> 1) & 2)); /* chroma = "1" */
848b8605Smrg   for (j = 2 * 2 - 1; j >= 0; j--) {
848b8605Smrg      for (i = 0; i < n_comp; i++) {
848b8605Smrg         /* add in colors */
848b8605Smrg         FX64_SHL(hi, 5);
848b8605Smrg         FX64_OR32(hi, vec[j][i] >> 3);
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg   ((Fx64 *)cc)[1] = hi;
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfxt1_quantize_MIXED0 (GLuint *cc,
848b8605Smrg                      GLubyte input[N_TEXELS][MAX_COMP])
848b8605Smrg{
848b8605Smrg   const GLint n_vect = 3; /* highest vector number in each microtile */
848b8605Smrg   const GLint n_comp = 3; /* 3 components: R, G, B */
848b8605Smrg   GLubyte vec[2 * 2][MAX_COMP]; /* 2 extrema for each sub-block */
848b8605Smrg   GLfloat b, iv[MAX_COMP]; /* interpolation vector */
848b8605Smrg   GLint i, j, k;
848b8605Smrg   Fx64 hi; /* high quadword */
848b8605Smrg   GLuint lohi, lolo; /* low quadword: hi dword, lo dword */
848b8605Smrg
848b8605Smrg   GLint minColL = 0, maxColL = 0;
848b8605Smrg   GLint minColR = 0, maxColR = 0;
848b8605Smrg#if 0
848b8605Smrg   GLint minSum;
848b8605Smrg   GLint maxSum;
848b8605Smrg
848b8605Smrg   /* Our solution here is to find the darkest and brightest colors in
848b8605Smrg    * the 4x4 tile and use those as the two representative colors.
848b8605Smrg    * There are probably better algorithms to use (histogram-based).
848b8605Smrg    */
848b8605Smrg   minSum = 2000; /* big enough */
848b8605Smrg   maxSum = -1; /* small enough */
848b8605Smrg   for (k = 0; k < N_TEXELS / 2; k++) {
848b8605Smrg      GLint sum = 0;
848b8605Smrg      for (i = 0; i < n_comp; i++) {
848b8605Smrg         sum += input[k][i];
848b8605Smrg      }
848b8605Smrg      if (minSum > sum) {
848b8605Smrg         minSum = sum;
848b8605Smrg         minColL = k;
848b8605Smrg      }
848b8605Smrg      if (maxSum < sum) {
848b8605Smrg         maxSum = sum;
848b8605Smrg         maxColL = k;
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg   minSum = 2000; /* big enough */
848b8605Smrg   maxSum = -1; /* small enough */
848b8605Smrg   for (; k < N_TEXELS; k++) {
848b8605Smrg      GLint sum = 0;
848b8605Smrg      for (i = 0; i < n_comp; i++) {
848b8605Smrg         sum += input[k][i];
848b8605Smrg      }
848b8605Smrg      if (minSum > sum) {
848b8605Smrg         minSum = sum;
848b8605Smrg         minColR = k;
848b8605Smrg      }
848b8605Smrg      if (maxSum < sum) {
848b8605Smrg         maxSum = sum;
848b8605Smrg         maxColR = k;
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg#else
848b8605Smrg   GLint minVal;
848b8605Smrg   GLint maxVal;
848b8605Smrg   GLint maxVarL = fxt1_variance(NULL, input, n_comp, N_TEXELS / 2);
848b8605Smrg   GLint maxVarR = fxt1_variance(NULL, &input[N_TEXELS / 2], n_comp, N_TEXELS / 2);
848b8605Smrg
848b8605Smrg   /* Scan the channel with max variance for lo & hi
848b8605Smrg    * and use those as the two representative colors.
848b8605Smrg    */
848b8605Smrg   minVal = 2000; /* big enough */
848b8605Smrg   maxVal = -1; /* small enough */
848b8605Smrg   for (k = 0; k < N_TEXELS / 2; k++) {
848b8605Smrg      GLint t = input[k][maxVarL];
848b8605Smrg      if (minVal > t) {
848b8605Smrg         minVal = t;
848b8605Smrg         minColL = k;
848b8605Smrg      }
848b8605Smrg      if (maxVal < t) {
848b8605Smrg         maxVal = t;
848b8605Smrg         maxColL = k;
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg   minVal = 2000; /* big enough */
848b8605Smrg   maxVal = -1; /* small enough */
848b8605Smrg   for (; k < N_TEXELS; k++) {
848b8605Smrg      GLint t = input[k][maxVarR];
848b8605Smrg      if (minVal > t) {
848b8605Smrg         minVal = t;
848b8605Smrg         minColR = k;
848b8605Smrg      }
848b8605Smrg      if (maxVal < t) {
848b8605Smrg         maxVal = t;
848b8605Smrg         maxColR = k;
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg#endif
848b8605Smrg
848b8605Smrg   /* left microtile */
848b8605Smrg   cc[0] = 0;
848b8605Smrg   for (i = 0; i < n_comp; i++) {
848b8605Smrg      vec[0][i] = input[minColL][i];
848b8605Smrg      vec[1][i] = input[maxColL][i];
848b8605Smrg   }
848b8605Smrg   if (minColL != maxColL) {
848b8605Smrg      /* compute interpolation vector */
848b8605Smrg      MAKEIVEC(n_vect, n_comp, iv, b, vec[0], vec[1]);
848b8605Smrg
848b8605Smrg      /* add in texels */
848b8605Smrg      lolo = 0;
848b8605Smrg      for (k = N_TEXELS / 2 - 1; k >= 0; k--) {
848b8605Smrg         GLint texel;
848b8605Smrg         /* interpolate color */
848b8605Smrg         CALCCDOT(texel, n_vect, n_comp, iv, b, input[k]);
848b8605Smrg         /* add in texel */
848b8605Smrg         lolo <<= 2;
848b8605Smrg         lolo |= texel;
848b8605Smrg      }
848b8605Smrg
848b8605Smrg      /* funky encoding for LSB of green */
848b8605Smrg      if ((GLint)((lolo >> 1) & 1) != (((vec[1][GCOMP] ^ vec[0][GCOMP]) >> 2) & 1)) {
848b8605Smrg         for (i = 0; i < n_comp; i++) {
848b8605Smrg            vec[1][i] = input[minColL][i];
848b8605Smrg            vec[0][i] = input[maxColL][i];
848b8605Smrg         }
848b8605Smrg         lolo = ~lolo;
848b8605Smrg      }
848b8605Smrg
848b8605Smrg      cc[0] = lolo;
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   /* right microtile */
848b8605Smrg   cc[1] = 0;
848b8605Smrg   for (i = 0; i < n_comp; i++) {
848b8605Smrg      vec[2][i] = input[minColR][i];
848b8605Smrg      vec[3][i] = input[maxColR][i];
848b8605Smrg   }
848b8605Smrg   if (minColR != maxColR) {
848b8605Smrg      /* compute interpolation vector */
848b8605Smrg      MAKEIVEC(n_vect, n_comp, iv, b, vec[2], vec[3]);
848b8605Smrg
848b8605Smrg      /* add in texels */
848b8605Smrg      lohi = 0;
848b8605Smrg      for (k = N_TEXELS - 1; k >= N_TEXELS / 2; k--) {
848b8605Smrg         GLint texel;
848b8605Smrg         /* interpolate color */
848b8605Smrg         CALCCDOT(texel, n_vect, n_comp, iv, b, input[k]);
848b8605Smrg         /* add in texel */
848b8605Smrg         lohi <<= 2;
848b8605Smrg         lohi |= texel;
848b8605Smrg      }
848b8605Smrg
848b8605Smrg      /* funky encoding for LSB of green */
848b8605Smrg      if ((GLint)((lohi >> 1) & 1) != (((vec[3][GCOMP] ^ vec[2][GCOMP]) >> 2) & 1)) {
848b8605Smrg         for (i = 0; i < n_comp; i++) {
848b8605Smrg            vec[3][i] = input[minColR][i];
848b8605Smrg            vec[2][i] = input[maxColR][i];
848b8605Smrg         }
848b8605Smrg         lohi = ~lohi;
848b8605Smrg      }
848b8605Smrg
848b8605Smrg      cc[1] = lohi;
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   FX64_MOV32(hi, 8 | (vec[3][GCOMP] & 4) | ((vec[1][GCOMP] >> 1) & 2)); /* chroma = "1" */
848b8605Smrg   for (j = 2 * 2 - 1; j >= 0; j--) {
848b8605Smrg      for (i = 0; i < n_comp; i++) {
848b8605Smrg         /* add in colors */
848b8605Smrg         FX64_SHL(hi, 5);
848b8605Smrg         FX64_OR32(hi, vec[j][i] >> 3);
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg   ((Fx64 *)cc)[1] = hi;
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfxt1_quantize (GLuint *cc, const GLubyte *lines[], GLint comps)
848b8605Smrg{
848b8605Smrg   GLint trualpha;
848b8605Smrg   GLubyte reord[N_TEXELS][MAX_COMP];
848b8605Smrg
848b8605Smrg   GLubyte input[N_TEXELS][MAX_COMP];
848b8605Smrg   GLint i, k, l;
848b8605Smrg
848b8605Smrg   if (comps == 3) {
848b8605Smrg      /* make the whole block opaque */
848b8605Smrg      memset(input, -1, sizeof(input));
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   /* 8 texels each line */
848b8605Smrg   for (l = 0; l < 4; l++) {
848b8605Smrg      for (k = 0; k < 4; k++) {
848b8605Smrg         for (i = 0; i < comps; i++) {
848b8605Smrg            input[k + l * 4][i] = *lines[l]++;
848b8605Smrg         }
848b8605Smrg      }
848b8605Smrg      for (; k < 8; k++) {
848b8605Smrg         for (i = 0; i < comps; i++) {
848b8605Smrg            input[k + l * 4 + 12][i] = *lines[l]++;
848b8605Smrg         }
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   /* block layout:
848b8605Smrg    * 00, 01, 02, 03, 08, 09, 0a, 0b
848b8605Smrg    * 10, 11, 12, 13, 18, 19, 1a, 1b
848b8605Smrg    * 04, 05, 06, 07, 0c, 0d, 0e, 0f
848b8605Smrg    * 14, 15, 16, 17, 1c, 1d, 1e, 1f
848b8605Smrg    */
848b8605Smrg
848b8605Smrg   /* [dBorca]
848b8605Smrg    * stupidity flows forth from this
848b8605Smrg    */
848b8605Smrg   l = N_TEXELS;
848b8605Smrg   trualpha = 0;
848b8605Smrg   if (comps == 4) {
848b8605Smrg      /* skip all transparent black texels */
848b8605Smrg      l = 0;
848b8605Smrg      for (k = 0; k < N_TEXELS; k++) {
848b8605Smrg         /* test all components against 0 */
848b8605Smrg         if (!ISTBLACK(input[k])) {
848b8605Smrg            /* texel is not transparent black */
848b8605Smrg            COPY_4UBV(reord[l], input[k]);
848b8605Smrg            if (reord[l][ACOMP] < (255 - ALPHA_TS)) {
848b8605Smrg               /* non-opaque texel */
848b8605Smrg               trualpha = !0;
848b8605Smrg            }
848b8605Smrg            l++;
848b8605Smrg         }
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg
848b8605Smrg#if 0
848b8605Smrg   if (trualpha) {
848b8605Smrg      fxt1_quantize_ALPHA0(cc, input, reord, l);
848b8605Smrg   } else if (l == 0) {
848b8605Smrg      cc[0] = cc[1] = cc[2] = -1;
848b8605Smrg      cc[3] = 0;
848b8605Smrg   } else if (l < N_TEXELS) {
848b8605Smrg      fxt1_quantize_HI(cc, input, reord, l);
848b8605Smrg   } else {
848b8605Smrg      fxt1_quantize_CHROMA(cc, input);
848b8605Smrg   }
848b8605Smrg   (void)fxt1_quantize_ALPHA1;
848b8605Smrg   (void)fxt1_quantize_MIXED1;
848b8605Smrg   (void)fxt1_quantize_MIXED0;
848b8605Smrg#else
848b8605Smrg   if (trualpha) {
848b8605Smrg      fxt1_quantize_ALPHA1(cc, input);
848b8605Smrg   } else if (l == 0) {
848b8605Smrg      cc[0] = cc[1] = cc[2] = ~0u;
848b8605Smrg      cc[3] = 0;
848b8605Smrg   } else if (l < N_TEXELS) {
848b8605Smrg      fxt1_quantize_MIXED1(cc, input);
848b8605Smrg   } else {
848b8605Smrg      fxt1_quantize_MIXED0(cc, input);
848b8605Smrg   }
848b8605Smrg   (void)fxt1_quantize_ALPHA0;
848b8605Smrg   (void)fxt1_quantize_HI;
848b8605Smrg   (void)fxt1_quantize_CHROMA;
848b8605Smrg#endif
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrg
848b8605Smrg/**
848b8605Smrg * Upscale an image by replication, not (typical) stretching.
848b8605Smrg * We use this when the image width or height is less than a
848b8605Smrg * certain size (4, 8) and we need to upscale an image.
848b8605Smrg */
848b8605Smrgstatic void
848b8605Smrgupscale_teximage2d(GLsizei inWidth, GLsizei inHeight,
848b8605Smrg                   GLsizei outWidth, GLsizei outHeight,
848b8605Smrg                   GLint comps, const GLubyte *src, GLint srcRowStride,
848b8605Smrg                   GLubyte *dest )
848b8605Smrg{
848b8605Smrg   GLint i, j, k;
848b8605Smrg
b8e80941Smrg   assert(outWidth >= inWidth);
b8e80941Smrg   assert(outHeight >= inHeight);
848b8605Smrg#if 0
b8e80941Smrg   assert(inWidth == 1 || inWidth == 2 || inHeight == 1 || inHeight == 2);
b8e80941Smrg   assert((outWidth & 3) == 0);
b8e80941Smrg   assert((outHeight & 3) == 0);
848b8605Smrg#endif
848b8605Smrg
848b8605Smrg   for (i = 0; i < outHeight; i++) {
848b8605Smrg      const GLint ii = i % inHeight;
848b8605Smrg      for (j = 0; j < outWidth; j++) {
848b8605Smrg         const GLint jj = j % inWidth;
848b8605Smrg         for (k = 0; k < comps; k++) {
848b8605Smrg            dest[(i * outWidth + j) * comps + k]
848b8605Smrg               = src[ii * srcRowStride + jj * comps + k];
848b8605Smrg         }
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfxt1_encode (GLuint width, GLuint height, GLint comps,
848b8605Smrg             const void *source, GLint srcRowStride,
848b8605Smrg             void *dest, GLint destRowStride)
848b8605Smrg{
848b8605Smrg   GLuint x, y;
848b8605Smrg   const GLubyte *data;
848b8605Smrg   GLuint *encoded = (GLuint *)dest;
848b8605Smrg   void *newSource = NULL;
848b8605Smrg
848b8605Smrg   assert(comps == 3 || comps == 4);
848b8605Smrg
848b8605Smrg   /* Replicate image if width is not M8 or height is not M4 */
848b8605Smrg   if ((width & 7) | (height & 3)) {
848b8605Smrg      GLint newWidth = (width + 7) & ~7;
848b8605Smrg      GLint newHeight = (height + 3) & ~3;
848b8605Smrg      newSource = malloc(comps * newWidth * newHeight * sizeof(GLubyte));
848b8605Smrg      if (!newSource) {
848b8605Smrg         GET_CURRENT_CONTEXT(ctx);
848b8605Smrg         _mesa_error(ctx, GL_OUT_OF_MEMORY, "texture compression");
848b8605Smrg         goto cleanUp;
848b8605Smrg      }
848b8605Smrg      upscale_teximage2d(width, height, newWidth, newHeight,
848b8605Smrg                         comps, (const GLubyte *) source,
848b8605Smrg                         srcRowStride, (GLubyte *) newSource);
848b8605Smrg      source = newSource;
848b8605Smrg      width = newWidth;
848b8605Smrg      height = newHeight;
848b8605Smrg      srcRowStride = comps * newWidth;
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   data = (const GLubyte *) source;
848b8605Smrg   destRowStride = (destRowStride - width * 2) / 4;
848b8605Smrg   for (y = 0; y < height; y += 4) {
848b8605Smrg      GLuint offs = 0 + (y + 0) * srcRowStride;
848b8605Smrg      for (x = 0; x < width; x += 8) {
848b8605Smrg         const GLubyte *lines[4];
848b8605Smrg         lines[0] = &data[offs];
848b8605Smrg         lines[1] = lines[0] + srcRowStride;
848b8605Smrg         lines[2] = lines[1] + srcRowStride;
848b8605Smrg         lines[3] = lines[2] + srcRowStride;
848b8605Smrg         offs += 8 * comps;
848b8605Smrg         fxt1_quantize(encoded, lines, comps);
848b8605Smrg         /* 128 bits per 8x4 block */
848b8605Smrg         encoded += 4;
848b8605Smrg      }
848b8605Smrg      encoded += destRowStride;
848b8605Smrg   }
848b8605Smrg
848b8605Smrg cleanUp:
848b8605Smrg   free(newSource);
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrg/***************************************************************************\
848b8605Smrg * FXT1 decoder
848b8605Smrg *
848b8605Smrg * The decoder is based on GL_3DFX_texture_compression_FXT1
848b8605Smrg * specification and serves as a concept for the encoder.
848b8605Smrg\***************************************************************************/
848b8605Smrg
848b8605Smrg
848b8605Smrg/* lookup table for scaling 5 bit colors up to 8 bits */
848b8605Smrgstatic const GLubyte _rgb_scale_5[] = {
848b8605Smrg   0,   8,   16,  25,  33,  41,  49,  58,
848b8605Smrg   66,  74,  82,  90,  99,  107, 115, 123,
848b8605Smrg   132, 140, 148, 156, 165, 173, 181, 189,
848b8605Smrg   197, 206, 214, 222, 230, 239, 247, 255
848b8605Smrg};
848b8605Smrg
848b8605Smrg/* lookup table for scaling 6 bit colors up to 8 bits */
848b8605Smrgstatic const GLubyte _rgb_scale_6[] = {
848b8605Smrg   0,   4,   8,   12,  16,  20,  24,  28,
848b8605Smrg   32,  36,  40,  45,  49,  53,  57,  61,
848b8605Smrg   65,  69,  73,  77,  81,  85,  89,  93,
848b8605Smrg   97,  101, 105, 109, 113, 117, 121, 125,
848b8605Smrg   130, 134, 138, 142, 146, 150, 154, 158,
848b8605Smrg   162, 166, 170, 174, 178, 182, 186, 190,
848b8605Smrg   194, 198, 202, 206, 210, 215, 219, 223,
848b8605Smrg   227, 231, 235, 239, 243, 247, 251, 255
848b8605Smrg};
848b8605Smrg
848b8605Smrg
848b8605Smrg#define CC_SEL(cc, which) (((GLuint *)(cc))[(which) / 32] >> ((which) & 31))
848b8605Smrg#define UP5(c) _rgb_scale_5[(c) & 31]
848b8605Smrg#define UP6(c, b) _rgb_scale_6[(((c) & 31) << 1) | ((b) & 1)]
848b8605Smrg#define LERP(n, t, c0, c1) (((n) - (t)) * (c0) + (t) * (c1) + (n) / 2) / (n)
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfxt1_decode_1HI (const GLubyte *code, GLint t, GLubyte *rgba)
848b8605Smrg{
848b8605Smrg   const GLuint *cc;
848b8605Smrg
848b8605Smrg   t *= 3;
848b8605Smrg   cc = (const GLuint *)(code + t / 8);
848b8605Smrg   t = (cc[0] >> (t & 7)) & 7;
848b8605Smrg
848b8605Smrg   if (t == 7) {
848b8605Smrg      rgba[RCOMP] = rgba[GCOMP] = rgba[BCOMP] = rgba[ACOMP] = 0;
848b8605Smrg   } else {
848b8605Smrg      GLubyte r, g, b;
848b8605Smrg      cc = (const GLuint *)(code + 12);
848b8605Smrg      if (t == 0) {
848b8605Smrg         b = UP5(CC_SEL(cc, 0));
848b8605Smrg         g = UP5(CC_SEL(cc, 5));
848b8605Smrg         r = UP5(CC_SEL(cc, 10));
848b8605Smrg      } else if (t == 6) {
848b8605Smrg         b = UP5(CC_SEL(cc, 15));
848b8605Smrg         g = UP5(CC_SEL(cc, 20));
848b8605Smrg         r = UP5(CC_SEL(cc, 25));
848b8605Smrg      } else {
848b8605Smrg         b = LERP(6, t, UP5(CC_SEL(cc, 0)), UP5(CC_SEL(cc, 15)));
848b8605Smrg         g = LERP(6, t, UP5(CC_SEL(cc, 5)), UP5(CC_SEL(cc, 20)));
848b8605Smrg         r = LERP(6, t, UP5(CC_SEL(cc, 10)), UP5(CC_SEL(cc, 25)));
848b8605Smrg      }
848b8605Smrg      rgba[RCOMP] = r;
848b8605Smrg      rgba[GCOMP] = g;
848b8605Smrg      rgba[BCOMP] = b;
848b8605Smrg      rgba[ACOMP] = 255;
848b8605Smrg   }
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfxt1_decode_1CHROMA (const GLubyte *code, GLint t, GLubyte *rgba)
848b8605Smrg{
848b8605Smrg   const GLuint *cc;
848b8605Smrg   GLuint kk;
848b8605Smrg
848b8605Smrg   cc = (const GLuint *)code;
848b8605Smrg   if (t & 16) {
848b8605Smrg      cc++;
848b8605Smrg      t &= 15;
848b8605Smrg   }
848b8605Smrg   t = (cc[0] >> (t * 2)) & 3;
848b8605Smrg
848b8605Smrg   t *= 15;
848b8605Smrg   cc = (const GLuint *)(code + 8 + t / 8);
848b8605Smrg   kk = cc[0] >> (t & 7);
848b8605Smrg   rgba[BCOMP] = UP5(kk);
848b8605Smrg   rgba[GCOMP] = UP5(kk >> 5);
848b8605Smrg   rgba[RCOMP] = UP5(kk >> 10);
848b8605Smrg   rgba[ACOMP] = 255;
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfxt1_decode_1MIXED (const GLubyte *code, GLint t, GLubyte *rgba)
848b8605Smrg{
848b8605Smrg   const GLuint *cc;
848b8605Smrg   GLuint col[2][3];
848b8605Smrg   GLint glsb, selb;
848b8605Smrg
848b8605Smrg   cc = (const GLuint *)code;
848b8605Smrg   if (t & 16) {
848b8605Smrg      t &= 15;
848b8605Smrg      t = (cc[1] >> (t * 2)) & 3;
848b8605Smrg      /* col 2 */
848b8605Smrg      col[0][BCOMP] = (*(const GLuint *)(code + 11)) >> 6;
848b8605Smrg      col[0][GCOMP] = CC_SEL(cc, 99);
848b8605Smrg      col[0][RCOMP] = CC_SEL(cc, 104);
848b8605Smrg      /* col 3 */
848b8605Smrg      col[1][BCOMP] = CC_SEL(cc, 109);
848b8605Smrg      col[1][GCOMP] = CC_SEL(cc, 114);
848b8605Smrg      col[1][RCOMP] = CC_SEL(cc, 119);
848b8605Smrg      glsb = CC_SEL(cc, 126);
848b8605Smrg      selb = CC_SEL(cc, 33);
848b8605Smrg   } else {
848b8605Smrg      t = (cc[0] >> (t * 2)) & 3;
848b8605Smrg      /* col 0 */
848b8605Smrg      col[0][BCOMP] = CC_SEL(cc, 64);
848b8605Smrg      col[0][GCOMP] = CC_SEL(cc, 69);
848b8605Smrg      col[0][RCOMP] = CC_SEL(cc, 74);
848b8605Smrg      /* col 1 */
848b8605Smrg      col[1][BCOMP] = CC_SEL(cc, 79);
848b8605Smrg      col[1][GCOMP] = CC_SEL(cc, 84);
848b8605Smrg      col[1][RCOMP] = CC_SEL(cc, 89);
848b8605Smrg      glsb = CC_SEL(cc, 125);
848b8605Smrg      selb = CC_SEL(cc, 1);
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   if (CC_SEL(cc, 124) & 1) {
848b8605Smrg      /* alpha[0] == 1 */
848b8605Smrg
848b8605Smrg      if (t == 3) {
848b8605Smrg         /* zero */
848b8605Smrg         rgba[RCOMP] = rgba[BCOMP] = rgba[GCOMP] = rgba[ACOMP] = 0;
848b8605Smrg      } else {
848b8605Smrg         GLubyte r, g, b;
848b8605Smrg         if (t == 0) {
848b8605Smrg            b = UP5(col[0][BCOMP]);
848b8605Smrg            g = UP5(col[0][GCOMP]);
848b8605Smrg            r = UP5(col[0][RCOMP]);
848b8605Smrg         } else if (t == 2) {
848b8605Smrg            b = UP5(col[1][BCOMP]);
848b8605Smrg            g = UP6(col[1][GCOMP], glsb);
848b8605Smrg            r = UP5(col[1][RCOMP]);
848b8605Smrg         } else {
848b8605Smrg            b = (UP5(col[0][BCOMP]) + UP5(col[1][BCOMP])) / 2;
848b8605Smrg            g = (UP5(col[0][GCOMP]) + UP6(col[1][GCOMP], glsb)) / 2;
848b8605Smrg            r = (UP5(col[0][RCOMP]) + UP5(col[1][RCOMP])) / 2;
848b8605Smrg         }
848b8605Smrg         rgba[RCOMP] = r;
848b8605Smrg         rgba[GCOMP] = g;
848b8605Smrg         rgba[BCOMP] = b;
848b8605Smrg         rgba[ACOMP] = 255;
848b8605Smrg      }
848b8605Smrg   } else {
848b8605Smrg      /* alpha[0] == 0 */
848b8605Smrg      GLubyte r, g, b;
848b8605Smrg      if (t == 0) {
848b8605Smrg         b = UP5(col[0][BCOMP]);
848b8605Smrg         g = UP6(col[0][GCOMP], glsb ^ selb);
848b8605Smrg         r = UP5(col[0][RCOMP]);
848b8605Smrg      } else if (t == 3) {
848b8605Smrg         b = UP5(col[1][BCOMP]);
848b8605Smrg         g = UP6(col[1][GCOMP], glsb);
848b8605Smrg         r = UP5(col[1][RCOMP]);
848b8605Smrg      } else {
848b8605Smrg         b = LERP(3, t, UP5(col[0][BCOMP]), UP5(col[1][BCOMP]));
848b8605Smrg         g = LERP(3, t, UP6(col[0][GCOMP], glsb ^ selb),
848b8605Smrg                        UP6(col[1][GCOMP], glsb));
848b8605Smrg         r = LERP(3, t, UP5(col[0][RCOMP]), UP5(col[1][RCOMP]));
848b8605Smrg      }
848b8605Smrg      rgba[RCOMP] = r;
848b8605Smrg      rgba[GCOMP] = g;
848b8605Smrg      rgba[BCOMP] = b;
848b8605Smrg      rgba[ACOMP] = 255;
848b8605Smrg   }
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfxt1_decode_1ALPHA (const GLubyte *code, GLint t, GLubyte *rgba)
848b8605Smrg{
848b8605Smrg   const GLuint *cc;
848b8605Smrg   GLubyte r, g, b, a;
848b8605Smrg
848b8605Smrg   cc = (const GLuint *)code;
848b8605Smrg   if (CC_SEL(cc, 124) & 1) {
848b8605Smrg      /* lerp == 1 */
848b8605Smrg      GLuint col0[4];
848b8605Smrg
848b8605Smrg      if (t & 16) {
848b8605Smrg         t &= 15;
848b8605Smrg         t = (cc[1] >> (t * 2)) & 3;
848b8605Smrg         /* col 2 */
848b8605Smrg         col0[BCOMP] = (*(const GLuint *)(code + 11)) >> 6;
848b8605Smrg         col0[GCOMP] = CC_SEL(cc, 99);
848b8605Smrg         col0[RCOMP] = CC_SEL(cc, 104);
848b8605Smrg         col0[ACOMP] = CC_SEL(cc, 119);
848b8605Smrg      } else {
848b8605Smrg         t = (cc[0] >> (t * 2)) & 3;
848b8605Smrg         /* col 0 */
848b8605Smrg         col0[BCOMP] = CC_SEL(cc, 64);
848b8605Smrg         col0[GCOMP] = CC_SEL(cc, 69);
848b8605Smrg         col0[RCOMP] = CC_SEL(cc, 74);
848b8605Smrg         col0[ACOMP] = CC_SEL(cc, 109);
848b8605Smrg      }
848b8605Smrg
848b8605Smrg      if (t == 0) {
848b8605Smrg         b = UP5(col0[BCOMP]);
848b8605Smrg         g = UP5(col0[GCOMP]);
848b8605Smrg         r = UP5(col0[RCOMP]);
848b8605Smrg         a = UP5(col0[ACOMP]);
848b8605Smrg      } else if (t == 3) {
848b8605Smrg         b = UP5(CC_SEL(cc, 79));
848b8605Smrg         g = UP5(CC_SEL(cc, 84));
848b8605Smrg         r = UP5(CC_SEL(cc, 89));
848b8605Smrg         a = UP5(CC_SEL(cc, 114));
848b8605Smrg      } else {
848b8605Smrg         b = LERP(3, t, UP5(col0[BCOMP]), UP5(CC_SEL(cc, 79)));
848b8605Smrg         g = LERP(3, t, UP5(col0[GCOMP]), UP5(CC_SEL(cc, 84)));
848b8605Smrg         r = LERP(3, t, UP5(col0[RCOMP]), UP5(CC_SEL(cc, 89)));
848b8605Smrg         a = LERP(3, t, UP5(col0[ACOMP]), UP5(CC_SEL(cc, 114)));
848b8605Smrg      }
848b8605Smrg   } else {
848b8605Smrg      /* lerp == 0 */
848b8605Smrg
848b8605Smrg      if (t & 16) {
848b8605Smrg         cc++;
848b8605Smrg         t &= 15;
848b8605Smrg      }
848b8605Smrg      t = (cc[0] >> (t * 2)) & 3;
848b8605Smrg
848b8605Smrg      if (t == 3) {
848b8605Smrg         /* zero */
848b8605Smrg         r = g = b = a = 0;
848b8605Smrg      } else {
848b8605Smrg         GLuint kk;
848b8605Smrg         cc = (const GLuint *)code;
848b8605Smrg         a = UP5(cc[3] >> (t * 5 + 13));
848b8605Smrg         t *= 15;
848b8605Smrg         cc = (const GLuint *)(code + 8 + t / 8);
848b8605Smrg         kk = cc[0] >> (t & 7);
848b8605Smrg         b = UP5(kk);
848b8605Smrg         g = UP5(kk >> 5);
848b8605Smrg         r = UP5(kk >> 10);
848b8605Smrg      }
848b8605Smrg   }
848b8605Smrg   rgba[RCOMP] = r;
848b8605Smrg   rgba[GCOMP] = g;
848b8605Smrg   rgba[BCOMP] = b;
848b8605Smrg   rgba[ACOMP] = a;
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfxt1_decode_1 (const void *texture, GLint stride, /* in pixels */
848b8605Smrg               GLint i, GLint j, GLubyte *rgba)
848b8605Smrg{
848b8605Smrg   static void (*decode_1[]) (const GLubyte *, GLint, GLubyte *) = {
848b8605Smrg      fxt1_decode_1HI,     /* cc-high   = "00?" */
848b8605Smrg      fxt1_decode_1HI,     /* cc-high   = "00?" */
848b8605Smrg      fxt1_decode_1CHROMA, /* cc-chroma = "010" */
848b8605Smrg      fxt1_decode_1ALPHA,  /* alpha     = "011" */
848b8605Smrg      fxt1_decode_1MIXED,  /* mixed     = "1??" */
848b8605Smrg      fxt1_decode_1MIXED,  /* mixed     = "1??" */
848b8605Smrg      fxt1_decode_1MIXED,  /* mixed     = "1??" */
848b8605Smrg      fxt1_decode_1MIXED   /* mixed     = "1??" */
848b8605Smrg   };
848b8605Smrg
848b8605Smrg   const GLubyte *code = (const GLubyte *)texture +
848b8605Smrg                         ((j / 4) * (stride / 8) + (i / 8)) * 16;
848b8605Smrg   GLint mode = CC_SEL(code, 125);
848b8605Smrg   GLint t = i & 7;
848b8605Smrg
848b8605Smrg   if (t & 4) {
848b8605Smrg      t += 12;
848b8605Smrg   }
848b8605Smrg   t += (j & 3) * 4;
848b8605Smrg
848b8605Smrg   decode_1[mode](code, t, rgba);
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfetch_rgb_fxt1(const GLubyte *map,
848b8605Smrg               GLint rowStride, GLint i, GLint j, GLfloat *texel)
848b8605Smrg{
848b8605Smrg   GLubyte rgba[4];
848b8605Smrg   fxt1_decode_1(map, rowStride, i, j, rgba);
848b8605Smrg   texel[RCOMP] = UBYTE_TO_FLOAT(rgba[RCOMP]);
848b8605Smrg   texel[GCOMP] = UBYTE_TO_FLOAT(rgba[GCOMP]);
848b8605Smrg   texel[BCOMP] = UBYTE_TO_FLOAT(rgba[BCOMP]);
848b8605Smrg   texel[ACOMP] = 1.0F;
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgstatic void
848b8605Smrgfetch_rgba_fxt1(const GLubyte *map,
848b8605Smrg                GLint rowStride, GLint i, GLint j, GLfloat *texel)
848b8605Smrg{
848b8605Smrg   GLubyte rgba[4];
848b8605Smrg   fxt1_decode_1(map, rowStride, i, j, rgba);
848b8605Smrg   texel[RCOMP] = UBYTE_TO_FLOAT(rgba[RCOMP]);
848b8605Smrg   texel[GCOMP] = UBYTE_TO_FLOAT(rgba[GCOMP]);
848b8605Smrg   texel[BCOMP] = UBYTE_TO_FLOAT(rgba[BCOMP]);
848b8605Smrg   texel[ACOMP] = UBYTE_TO_FLOAT(rgba[ACOMP]);
848b8605Smrg}
848b8605Smrg
848b8605Smrg
848b8605Smrgcompressed_fetch_func
848b8605Smrg_mesa_get_fxt_fetch_func(mesa_format format)
848b8605Smrg{
848b8605Smrg   switch (format) {
848b8605Smrg   case MESA_FORMAT_RGB_FXT1:
848b8605Smrg      return fetch_rgb_fxt1;
848b8605Smrg   case MESA_FORMAT_RGBA_FXT1:
848b8605Smrg      return fetch_rgba_fxt1;
848b8605Smrg   default:
848b8605Smrg      return NULL;
848b8605Smrg   }
848b8605Smrg}