auxiliary/util/u_half.h

848b8605Smrg/**************************************************************************
848b8605Smrg *
848b8605Smrg * Copyright 2010 Luca Barbieri
848b8605Smrg *
848b8605Smrg * Permission is hereby granted, free of charge, to any person obtaining
848b8605Smrg * a copy of this software and associated documentation files (the
848b8605Smrg * "Software"), to deal in the Software without restriction, including
848b8605Smrg * without limitation the rights to use, copy, modify, merge, publish,
848b8605Smrg * distribute, sublicense, and/or sell copies of the Software, and to
848b8605Smrg * permit persons to whom the Software is furnished to do so, subject to
848b8605Smrg * the following conditions:
848b8605Smrg *
848b8605Smrg * The above copyright notice and this permission notice (including the
848b8605Smrg * next paragraph) shall be included in all copies or substantial
848b8605Smrg * portions of the Software.
848b8605Smrg *
848b8605Smrg * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
848b8605Smrg * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
848b8605Smrg * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.
848b8605Smrg * IN NO EVENT SHALL THE COPYRIGHT OWNER(S) AND/OR ITS SUPPLIERS BE
848b8605Smrg * LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION
848b8605Smrg * OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION
848b8605Smrg * WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
848b8605Smrg *
848b8605Smrg **************************************************************************/
848b8605Smrg
848b8605Smrg
848b8605Smrg#ifndef U_HALF_H
848b8605Smrg#define U_HALF_H
848b8605Smrg
848b8605Smrg#include "pipe/p_compiler.h"
848b8605Smrg#include "util/u_math.h"
848b8605Smrg
848b8605Smrg#ifdef __cplusplus
848b8605Smrgextern "C" {
848b8605Smrg#endif
848b8605Smrg
848b8605Smrg/*
848b8605Smrg * References for float <-> half conversions
848b8605Smrg *
848b8605Smrg *  http://fgiesen.wordpress.com/2012/03/28/half-to-float-done-quic/
848b8605Smrg *  https://gist.github.com/2156668
848b8605Smrg *  https://gist.github.com/2144712
848b8605Smrg */
848b8605Smrg
b8e80941Smrgstatic inline uint16_t
848b8605Smrgutil_float_to_half(float f)
848b8605Smrg{
848b8605Smrg   uint32_t sign_mask  = 0x80000000;
848b8605Smrg   uint32_t round_mask = ~0xfff;
848b8605Smrg   uint32_t f32inf = 0xff << 23;
848b8605Smrg   uint32_t f16inf = 0x1f << 23;
848b8605Smrg   uint32_t sign;
848b8605Smrg   union fi magic;
848b8605Smrg   union fi f32;
848b8605Smrg   uint16_t f16;
848b8605Smrg
848b8605Smrg   magic.ui = 0xf << 23;
848b8605Smrg
848b8605Smrg   f32.f = f;
848b8605Smrg
848b8605Smrg   /* Sign */
848b8605Smrg   sign = f32.ui & sign_mask;
848b8605Smrg   f32.ui ^= sign;
848b8605Smrg
848b8605Smrg   if (f32.ui == f32inf) {
848b8605Smrg      /* Inf */
848b8605Smrg      f16 = 0x7c00;
848b8605Smrg   } else if (f32.ui > f32inf) {
848b8605Smrg      /* NaN */
848b8605Smrg      f16 = 0x7e00;
848b8605Smrg   } else {
848b8605Smrg      /* Number */
848b8605Smrg      f32.ui &= round_mask;
848b8605Smrg      f32.f  *= magic.f;
848b8605Smrg      f32.ui -= round_mask;
b8e80941Smrg      /*
b8e80941Smrg       * XXX: The magic mul relies on denorms being available, otherwise
b8e80941Smrg       * all f16 denorms get flushed to zero - hence when this is used
b8e80941Smrg       * for tgsi_exec in softpipe we won't get f16 denorms.
b8e80941Smrg       */
848b8605Smrg      /*
848b8605Smrg       * Clamp to max finite value if overflowed.
848b8605Smrg       * OpenGL has completely undefined rounding behavior for float to
848b8605Smrg       * half-float conversions, and this matches what is mandated for float
848b8605Smrg       * to fp11/fp10, which recommend round-to-nearest-finite too.
848b8605Smrg       * (d3d10 is deeply unhappy about flushing such values to infinity, and
848b8605Smrg       * while it also mandates round-to-zero it doesn't care nearly as much
848b8605Smrg       * about that.)
848b8605Smrg       */
848b8605Smrg      if (f32.ui > f16inf)
848b8605Smrg         f32.ui = f16inf - 1;
848b8605Smrg
848b8605Smrg      f16 = f32.ui >> 13;
848b8605Smrg   }
848b8605Smrg
848b8605Smrg   /* Sign */
848b8605Smrg   f16 |= sign >> 16;
848b8605Smrg
848b8605Smrg   return f16;
848b8605Smrg}
848b8605Smrg
b8e80941Smrgstatic inline float
848b8605Smrgutil_half_to_float(uint16_t f16)
848b8605Smrg{
848b8605Smrg   union fi infnan;
848b8605Smrg   union fi magic;
848b8605Smrg   union fi f32;
848b8605Smrg
848b8605Smrg   infnan.ui = 0x8f << 23;
848b8605Smrg   infnan.f = 65536.0f;
848b8605Smrg   magic.ui  = 0xef << 23;
848b8605Smrg
848b8605Smrg   /* Exponent / Mantissa */
848b8605Smrg   f32.ui = (f16 & 0x7fff) << 13;
848b8605Smrg
848b8605Smrg   /* Adjust */
848b8605Smrg   f32.f *= magic.f;
b8e80941Smrg   /* XXX: The magic mul relies on denorms being available */
848b8605Smrg
848b8605Smrg   /* Inf / NaN */
848b8605Smrg   if (f32.f >= infnan.f)
848b8605Smrg      f32.ui |= 0xff << 23;
848b8605Smrg
848b8605Smrg   /* Sign */
848b8605Smrg   f32.ui |= (f16 & 0x8000) << 16;
848b8605Smrg
848b8605Smrg   return f32.f;
848b8605Smrg}
848b8605Smrg
848b8605Smrg#ifdef __cplusplus
848b8605Smrg}
848b8605Smrg#endif
848b8605Smrg
848b8605Smrg#endif /* U_HALF_H */
848b8605Smrg