d3/df3/_simd_math__inl_8h_source.htm

#pragma once


// static


PL_FORCE_INLINE plSimdVec4f plSimdMath::Exp(const plSimdVec4f& f)

{

#if PL_ENABLED(PL_COMPILER_MSVC) && PL_SIMD_IMPLEMENTATION == PL_SIMD_IMPLEMENTATION_SSE

  return _mm_exp_ps(f.m_v);

#else

  return plSimdVec4f(plMath::Exp(f.x()), plMath::Exp(f.y()), plMath::Exp(f.z()), plMath::Exp(f.w()));

#endif

}


// static

PL_FORCE_INLINE plSimdVec4f plSimdMath::Ln(const plSimdVec4f& f)

{

#if PL_ENABLED(PL_COMPILER_MSVC) && PL_SIMD_IMPLEMENTATION == PL_SIMD_IMPLEMENTATION_SSE

  return _mm_log_ps(f.m_v);

#else

  return plSimdVec4f(plMath::Ln(f.x()), plMath::Ln(f.y()), plMath::Ln(f.z()), plMath::Ln(f.w()));

#endif

}


// static

PL_FORCE_INLINE plSimdVec4f plSimdMath::Log2(const plSimdVec4f& f)

{

#if PL_ENABLED(PL_COMPILER_MSVC) && PL_SIMD_IMPLEMENTATION == PL_SIMD_IMPLEMENTATION_SSE

  return _mm_log2_ps(f.m_v);

#else

  return plSimdVec4f(plMath::Log2(f.x()), plMath::Log2(f.y()), plMath::Log2(f.z()), plMath::Log2(f.w()));

#endif

}


// static

PL_FORCE_INLINE plSimdVec4i plSimdMath::Log2i(const plSimdVec4i& i)

{

  return plSimdVec4i(plMath::Log2i(i.x()), plMath::Log2i(i.y()), plMath::Log2i(i.z()), plMath::Log2i(i.w()));

}


// static

PL_FORCE_INLINE plSimdVec4f plSimdMath::Log10(const plSimdVec4f& f)

{

#if PL_ENABLED(PL_COMPILER_MSVC) && PL_SIMD_IMPLEMENTATION == PL_SIMD_IMPLEMENTATION_SSE

  return _mm_log10_ps(f.m_v);

#else

  return plSimdVec4f(plMath::Log10(f.x()), plMath::Log10(f.y()), plMath::Log10(f.z()), plMath::Log10(f.w()));

#endif

}


// static

PL_FORCE_INLINE plSimdVec4f plSimdMath::Pow2(const plSimdVec4f& f)

{

#if PL_ENABLED(PL_COMPILER_MSVC) && PL_SIMD_IMPLEMENTATION == PL_SIMD_IMPLEMENTATION_SSE

  return _mm_exp2_ps(f.m_v);

#else

  return plSimdVec4f(plMath::Pow2(f.x()), plMath::Pow2(f.y()), plMath::Pow2(f.z()), plMath::Pow2(f.w()));

#endif

}


// static

PL_FORCE_INLINE plSimdVec4f plSimdMath::Sin(const plSimdVec4f& f)

{

#if PL_ENABLED(PL_COMPILER_MSVC) && PL_SIMD_IMPLEMENTATION == PL_SIMD_IMPLEMENTATION_SSE

  return _mm_sin_ps(f.m_v);

#else

  return plSimdVec4f(plMath::Sin(plAngle::MakeFromRadian(f.x())), plMath::Sin(plAngle::MakeFromRadian(f.y())), plMath::Sin(plAngle::MakeFromRadian(f.z())),

    plMath::Sin(plAngle::MakeFromRadian(f.w())));

#endif

}


// static

PL_FORCE_INLINE plSimdVec4f plSimdMath::Cos(const plSimdVec4f& f)

{

#if PL_ENABLED(PL_COMPILER_MSVC) && PL_SIMD_IMPLEMENTATION == PL_SIMD_IMPLEMENTATION_SSE

  return _mm_cos_ps(f.m_v);

#else

  return plSimdVec4f(plMath::Cos(plAngle::MakeFromRadian(f.x())), plMath::Cos(plAngle::MakeFromRadian(f.y())), plMath::Cos(plAngle::MakeFromRadian(f.z())),

    plMath::Cos(plAngle::MakeFromRadian(f.w())));

#endif

}


// static

PL_FORCE_INLINE plSimdVec4f plSimdMath::Tan(const plSimdVec4f& f)

{

#if PL_ENABLED(PL_COMPILER_MSVC) && PL_SIMD_IMPLEMENTATION == PL_SIMD_IMPLEMENTATION_SSE

  return _mm_tan_ps(f.m_v);

#else

  return plSimdVec4f(plMath::Tan(plAngle::MakeFromRadian(f.x())), plMath::Tan(plAngle::MakeFromRadian(f.y())), plMath::Tan(plAngle::MakeFromRadian(f.z())),

    plMath::Tan(plAngle::MakeFromRadian(f.w())));

#endif

}


// static

PL_ALWAYS_INLINE plSimdVec4f plSimdMath::ASin(const plSimdVec4f& f)

{

  return plSimdVec4f(plMath::Pi<float>() * 0.5f) - ACos(f);

}


// 4th order polynomial approximation

// 7 * 10^-5 radians precision

// Reference : Handbook of Mathematical Functions (chapter : Elementary Transcendental Functions), M. Abramowitz and I.A. Stegun, Ed.

// static

PL_FORCE_INLINE plSimdVec4f plSimdMath::ACos(const plSimdVec4f& f)

{

  plSimdVec4f x1 = f.Abs();

  plSimdVec4f x2 = x1.CompMul(x1);

  plSimdVec4f x3 = x2.CompMul(x1);


  plSimdVec4f s = x1 * -0.2121144f + plSimdVec4f(1.5707288f);

  s += x2 * 0.0742610f;

  s += x3 * -0.0187293f;

  s = s.CompMul((plSimdVec4f(1.0f) - x1).GetSqrt());


  return plSimdVec4f::Select(f >= plSimdVec4f::MakeZero(), s, plSimdVec4f(plMath::Pi<float>()) - s);

}


// Reference: https://seblagarde.wordpress.com/2014/12/01/inverse-trigonometric-functions-gpu-optimization-for-amd-gcn-architecture/

// static

PL_FORCE_INLINE plSimdVec4f plSimdMath::ATan(const plSimdVec4f& f)

{

  plSimdVec4f x = f.Abs();

  plSimdVec4f t0 = plSimdVec4f::Select(x < plSimdVec4f(1.0f), x, x.GetReciprocal());

  plSimdVec4f t1 = t0.CompMul(t0);

  plSimdVec4f poly = plSimdVec4f(0.0872929f);

  poly = plSimdVec4f(-0.301895f) + poly.CompMul(t1);

  poly = plSimdVec4f(1.0f) + poly.CompMul(t1);

  poly = poly.CompMul(t0);

  t0 = plSimdVec4f::Select(x < plSimdVec4f(1.0f), poly, plSimdVec4f(plMath::Pi<float>() * 0.5f) - poly);


  return plSimdVec4f::Select(f < plSimdVec4f::MakeZero(), -t0, t0);

}

plAngle::MakeFromRadian
static constexpr plAngle MakeFromRadian(float fRadian)
Creates an instance of plAngle that was initialized from radian. (No need for any conversion)
Definition Angle_inl.h:38

plSimdVec4f
A 4-component SIMD vector class.
Definition SimdVec4f.h:8

plSimdVec4f::MakeZero
static plSimdVec4f MakeZero()
Creates an plSimdVec4f that is initialized to zero.
Definition SimdVec4f_inl.h:8

plSimdVec4i
A SIMD 4-component vector class of signed 32b integers.
Definition SimdVec4i.h:9

plMath::Pi
constexpr TYPE Pi()
Returns the natural constant Pi.

plMath::Sin
PL_ALWAYS_INLINE float Sin(plAngle a)
***** Trigonometric Functions *****
Definition MathFloat_inl.h:62

plMath::Tan
PL_ALWAYS_INLINE float Tan(plAngle a)
Takes an angle, returns its tangent.
Definition MathFloat_inl.h:72

plMath::Cos
PL_ALWAYS_INLINE float Cos(plAngle a)
Takes an angle, returns its cosine.
Definition MathFloat_inl.h:67

plMath::Log2i
PL_ALWAYS_INLINE plUInt32 Log2i(plUInt32 uiVal)
Returns the integral logarithm to the base 2, that comes closest to the given integer.
Definition MathInt32_inl.h:41

plSimdMath::Exp
static plSimdVec4f Exp(const plSimdVec4f &f)
Definition SimdMath_inl.h:6