d9/d91/dvec_8h_source.html

#ifndef _DVEC_H_INCLUDED

#define _DVEC_H_INCLUDED

#ifndef RC_INVOKED


#if !defined __cplusplus

#error This file is only supported in C++ compilations!

#endif


#include <emmintrin.h>

#include <assert.h>

#include <fvec.h>

#include <crtdefs.h>


#pragma pack(push,_CRT_PACKING)


#if defined(_ENABLE_VEC_DEBUG)

#include <iostream>

#endif


#pragma pack(push,16)


#define EXPLICIT explicit


class I8vec16;

class Is8vec16;

class Iu8vec16;

class I16vec8;

class Is16vec8;

class Iu16vec8;

class I32vec4;

class Is32vec4;

class Iu32vec4;

class I64vec2;

class I128vec1;


#define _MM_16UB(element,vector) (*((unsigned char*)&##vector + ##element))

#define _MM_16B(element,vector) (*((signed char*)&##vector + ##element))


#define _MM_8UW(element,vector) (*((unsigned short*)&##vector + ##element))

#define _MM_8W(element,vector) (*((short*)&##vector + ##element))


#define _MM_4UDW(element,vector) (*((unsigned int*)&##vector + ##element))

#define _MM_4DW(element,vector) (*((int*)&##vector + ##element))


#define _MM_2QW(element,vector) (*((__int64*)&##vector + ##element))


inline const __m128i get_mask128()

{

  static const __m128i mask128 = _mm_set1_epi64(M64(0xffffffffffffffffi64));

  return mask128;

}


class M128

{

protected:

  __m128i vec;


public:

  M128() { }

  M128(__m128i mm) { vec = mm; }


  operator __m128i() const { return vec; }


  M128& operator&=(const M128 &a) { return *this = (M128) _mm_and_si128(vec,a); }

  M128& operator|=(const M128 &a) { return *this = (M128) _mm_or_si128(vec,a); }

  M128& operator^=(const M128 &a) { return *this = (M128) _mm_xor_si128(vec,a); }


};


inline M128 operator&(const M128 &a,const M128 &b) { return _mm_and_si128(a,b); }

inline M128 operator|(const M128 &a,const M128 &b) { return _mm_or_si128(a,b); }

inline M128 operator^(const M128 &a,const M128 &b) { return _mm_xor_si128(a,b); }

inline M128 andnot(const M128 &a,const M128 &b) { return _mm_andnot_si128(a,b); }


class I128vec1 : public M128

{

public:

  I128vec1() { }

  I128vec1(__m128i mm) : M128(mm) { }


  I128vec1& operator= (const M128 &a) { return *this = (I128vec1) a; }

  I128vec1& operator&=(const M128 &a) { return *this = (I128vec1) _mm_and_si128(vec,a); }

  I128vec1& operator|=(const M128 &a) { return *this = (I128vec1) _mm_or_si128(vec,a); }

  I128vec1& operator^=(const M128 &a) { return *this = (I128vec1) _mm_xor_si128(vec,a); }


};


class I64vec2 : public M128

{

public:

  I64vec2() { }

  I64vec2(__m128i mm) : M128(mm) { }


  I64vec2(__m64 q1,__m64 q0)

  {

    _MM_2QW(0,vec) = *(__int64*)&q0;

    _MM_2QW(1,vec) = *(__int64*)&q1;

  }


  I64vec2& operator= (const M128 &a) { return *this = (I64vec2) a; }


  I64vec2& operator&=(const M128 &a) { return *this = (I64vec2) _mm_and_si128(vec,a); }

  I64vec2& operator|=(const M128 &a) { return *this = (I64vec2) _mm_or_si128(vec,a); }

  I64vec2& operator^=(const M128 &a) { return *this = (I64vec2) _mm_xor_si128(vec,a); }


  I64vec2& operator +=(const I64vec2 &a) { return *this = (I64vec2) _mm_add_epi64(vec,a); }

  I64vec2& operator -=(const I64vec2 &a) { return *this = (I64vec2) _mm_sub_epi64(vec,a); }


  I64vec2 operator<<(const I64vec2 &a) { return _mm_sll_epi64(vec,a); }

  I64vec2 operator<<(int count) { return _mm_slli_epi64(vec,count); }

  I64vec2& operator<<=(const I64vec2 &a) { return *this = (I64vec2) _mm_sll_epi64(vec,a); }

  I64vec2& operator<<=(int count) { return *this = (I64vec2) _mm_slli_epi64(vec,count); }

  I64vec2 operator>>(const I64vec2 &a) { return _mm_srl_epi64(vec,a); }

  I64vec2 operator>>(int count) { return _mm_srli_epi64(vec,count); }

  I64vec2& operator>>=(const I64vec2 &a) { return *this = (I64vec2) _mm_srl_epi64(vec,a); }

  I64vec2& operator>>=(int count) { return *this = (I64vec2) _mm_srli_epi64(vec,count); }


  const __int64& operator[](int i)const

  {

    assert(static_cast<unsigned int>(i) < 2);

    return _MM_2QW(i,vec);

  }


  __int64& operator[](int i)

  {

    assert(static_cast<unsigned int>(i) < 2);

    return _MM_2QW(i,vec);

  }


};


inline I64vec2 unpack_low(const I64vec2 &a,const I64vec2 &b) {return _mm_unpacklo_epi64(a,b); }

inline I64vec2 unpack_high(const I64vec2 &a,const I64vec2 &b) {return _mm_unpackhi_epi64(a,b); }


class I32vec4 : public M128

{

public:

  I32vec4() { }

  I32vec4(__m128i mm) : M128(mm) { }


  I32vec4& operator= (const M128 &a) { return *this = (I32vec4) a; }


  I32vec4& operator&=(const M128 &a) { return *this = (I32vec4) _mm_and_si128(vec,a); }

  I32vec4& operator|=(const M128 &a) { return *this = (I32vec4) _mm_or_si128(vec,a); }

  I32vec4& operator^=(const M128 &a) { return *this = (I32vec4) _mm_xor_si128(vec,a); }


  I32vec4& operator +=(const I32vec4 &a) { return *this = (I32vec4)_mm_add_epi32(vec,a); }

  I32vec4& operator -=(const I32vec4 &a) { return *this = (I32vec4)_mm_sub_epi32(vec,a); }


  I32vec4 operator<<(const I32vec4 &a) { return _mm_sll_epi32(vec,a); }

  I32vec4 operator<<(int count) { return _mm_slli_epi32(vec,count); }

  I32vec4& operator<<=(const I32vec4 &a) { return *this = (I32vec4)_mm_sll_epi32(vec,a); }

  I32vec4& operator<<=(int count) { return *this = (I32vec4)_mm_slli_epi32(vec,count); }


};


inline I32vec4 cmpeq(const I32vec4 &a,const I32vec4 &b) { return _mm_cmpeq_epi32(a,b); }

inline I32vec4 cmpneq(const I32vec4 &a,const I32vec4 &b) { return _mm_andnot_si128(_mm_cmpeq_epi32(a,b),get_mask128()); }


inline I32vec4 unpack_low(const I32vec4 &a,const I32vec4 &b) { return _mm_unpacklo_epi32(a,b); }

inline I32vec4 unpack_high(const I32vec4 &a,const I32vec4 &b) { return _mm_unpackhi_epi32(a,b); }


class Is32vec4 : public I32vec4

{

public:

  Is32vec4() { }

  Is32vec4(__m128i mm) : I32vec4(mm) { }

  Is32vec4(int i3,int i2,int i1,int i0)

  {

    _MM_4DW(0,vec) = i0;

    _MM_4DW(1,vec) = i1;

    _MM_4DW(2,vec) = i2;

    _MM_4DW(3,vec) = i3;

  }


  Is32vec4& operator= (const M128 &a) { return *this = (Is32vec4) a; }


  Is32vec4& operator&=(const M128 &a) { return *this = (Is32vec4) _mm_and_si128(vec,a); }

  Is32vec4& operator|=(const M128 &a) { return *this = (Is32vec4) _mm_or_si128(vec,a); }

  Is32vec4& operator^=(const M128 &a) { return *this = (Is32vec4) _mm_xor_si128(vec,a); }


  Is32vec4& operator +=(const I32vec4 &a) { return *this = (Is32vec4)_mm_add_epi32(vec,a); }

  Is32vec4& operator -=(const I32vec4 &a) { return *this = (Is32vec4)_mm_sub_epi32(vec,a); }


  Is32vec4 operator<<(const M128 &a) { return _mm_sll_epi32(vec,a); }

  Is32vec4 operator<<(int count) { return _mm_slli_epi32(vec,count); }

  Is32vec4& operator<<=(const M128 &a) { return *this = (Is32vec4)_mm_sll_epi32(vec,a); }

  Is32vec4& operator<<=(int count) { return *this = (Is32vec4)_mm_slli_epi32(vec,count); }


  Is32vec4 operator>>(const M128 &a) { return _mm_sra_epi32(vec,a); }

  Is32vec4 operator>>(int count) { return _mm_srai_epi32(vec,count); }

  Is32vec4& operator>>=(const M128 &a) { return *this = (Is32vec4) _mm_sra_epi32(vec,a); }

  Is32vec4& operator>>=(int count) { return *this = (Is32vec4) _mm_srai_epi32(vec,count); }


#if defined(_ENABLE_VEC_DEBUG)


  friend std::ostream& operator<< (std::ostream &os,const Is32vec4 &a)

  {

    os << "[3]:" << _MM_4DW(3,a)

      << " [2]:" << _MM_4DW(2,a)

      << " [1]:" << _MM_4DW(1,a)

      << " [0]:" << _MM_4DW(0,a);

    return os;

  }

#endif


  const int& operator[](int i)const

  {

    assert(static_cast<unsigned int>(i) < 4);

    return _MM_4DW(i,vec);

  }


  int& operator[](int i)

  {

    assert(static_cast<unsigned int>(i) < 4);

    return _MM_4DW(i,vec);

  }

};


inline Is32vec4 cmpeq(const Is32vec4 &a,const Is32vec4 &b) { return _mm_cmpeq_epi32(a,b); }

inline Is32vec4 cmpneq(const Is32vec4 &a,const Is32vec4 &b) { return _mm_andnot_si128(_mm_cmpeq_epi32(a,b),get_mask128()); }

inline Is32vec4 cmpgt(const Is32vec4 &a,const Is32vec4 &b) { return _mm_cmpgt_epi32(a,b); }

inline Is32vec4 cmplt(const Is32vec4 &a,const Is32vec4 &b) { return _mm_cmpgt_epi32(b,a); }


inline Is32vec4 unpack_low(const Is32vec4 &a,const Is32vec4 &b) { return _mm_unpacklo_epi32(a,b); }

inline Is32vec4 unpack_high(const Is32vec4 &a,const Is32vec4 &b) { return _mm_unpackhi_epi32(a,b); }


class Iu32vec4 : public I32vec4

{

public:

  Iu32vec4() { }

  Iu32vec4(__m128i mm) : I32vec4(mm) { }

  Iu32vec4(unsigned int ui3,unsigned int ui2,unsigned int ui1,unsigned int ui0)

  {

    _MM_4UDW(0,vec) = ui0;

    _MM_4UDW(1,vec) = ui1;

    _MM_4UDW(2,vec) = ui2;

    _MM_4UDW(3,vec) = ui3;

  }


  Iu32vec4& operator= (const M128 &a) { return *this = (Iu32vec4) a; }


  Iu32vec4& operator&=(const M128 &a) { return *this = (Iu32vec4) _mm_and_si128(vec,a); }

  Iu32vec4& operator|=(const M128 &a) { return *this = (Iu32vec4) _mm_or_si128(vec,a); }

  Iu32vec4& operator^=(const M128 &a) { return *this = (Iu32vec4) _mm_xor_si128(vec,a); }


  Iu32vec4& operator +=(const I32vec4 &a) { return *this = (Iu32vec4)_mm_add_epi32(vec,a); }

  Iu32vec4& operator -=(const I32vec4 &a) { return *this = (Iu32vec4)_mm_sub_epi32(vec,a); }


  Iu32vec4 operator<<(const M128 &a) { return _mm_sll_epi32(vec,a); }

  Iu32vec4 operator<<(int count) { return _mm_slli_epi32(vec,count); }

  Iu32vec4& operator<<=(const M128 &a) { return *this = (Iu32vec4)_mm_sll_epi32(vec,a); }

  Iu32vec4& operator<<=(int count) { return *this = (Iu32vec4)_mm_slli_epi32(vec,count); }

  Iu32vec4 operator>>(const M128 &a) { return _mm_srl_epi32(vec,a); }

  Iu32vec4 operator>>(int count) { return _mm_srli_epi32(vec,count); }

  Iu32vec4& operator>>=(const M128 &a) { return *this = (Iu32vec4) _mm_srl_epi32(vec,a); }

  Iu32vec4& operator>>=(int count) { return *this = (Iu32vec4) _mm_srli_epi32(vec,count); }


#if defined(_ENABLE_VEC_DEBUG)


  friend std::ostream& operator<< (std::ostream &os,const Iu32vec4 &a)

  {

    os << "[3]:" << _MM_4UDW(3,a)

      << " [2]:" << _MM_4UDW(2,a)

      << " [1]:" << _MM_4UDW(1,a)

      << " [0]:" << _MM_4UDW(0,a);

    return os;

  }

#endif


  const unsigned int& operator[](int i)const

  {

    assert(static_cast<unsigned int>(i) < 4);

    return _MM_4UDW(i,vec);

  }


  unsigned int& operator[](int i)

  {

    assert(static_cast<unsigned int>(i) < 4);

    return _MM_4UDW(i,vec);

  }

};


inline I64vec2 operator*(const Iu32vec4 &a,const Iu32vec4 &b) { return _mm_mul_epu32(a,b); }

inline Iu32vec4 cmpeq(const Iu32vec4 &a,const Iu32vec4 &b) { return _mm_cmpeq_epi32(a,b); }

inline Iu32vec4 cmpneq(const Iu32vec4 &a,const Iu32vec4 &b) { return _mm_andnot_si128(_mm_cmpeq_epi32(a,b),get_mask128()); }


inline Iu32vec4 unpack_low(const Iu32vec4 &a,const Iu32vec4 &b) { return _mm_unpacklo_epi32(a,b); }

inline Iu32vec4 unpack_high(const Iu32vec4 &a,const Iu32vec4 &b) { return _mm_unpackhi_epi32(a,b); }


class I16vec8 : public M128

{

public:

  I16vec8() { }

  I16vec8(__m128i mm) : M128(mm) { }


  I16vec8& operator= (const M128 &a) { return *this = (I16vec8) a; }


  I16vec8& operator&=(const M128 &a) { return *this = (I16vec8) _mm_and_si128(vec,a); }

  I16vec8& operator|=(const M128 &a) { return *this = (I16vec8) _mm_or_si128(vec,a); }

  I16vec8& operator^=(const M128 &a) { return *this = (I16vec8) _mm_xor_si128(vec,a); }


  I16vec8& operator +=(const I16vec8 &a) { return *this = (I16vec8) _mm_add_epi16(vec,a); }

  I16vec8& operator -=(const I16vec8 &a) { return *this = (I16vec8) _mm_sub_epi16(vec,a); }

  I16vec8& operator *=(const I16vec8 &a) { return *this = (I16vec8) _mm_mullo_epi16(vec,a); }


  I16vec8 operator<<(const M128 &a) { return _mm_sll_epi16(vec,a); }

  I16vec8 operator<<(int count) { return _mm_slli_epi16(vec,count); }

  I16vec8& operator<<=(const M128 &a) { return *this = (I16vec8)_mm_sll_epi16(vec,a); }

  I16vec8& operator<<=(int count) { return *this = (I16vec8)_mm_slli_epi16(vec,count); }


};


inline I16vec8 operator*(const I16vec8 &a,const I16vec8 &b) { return _mm_mullo_epi16(a,b); }


inline I16vec8 cmpeq(const I16vec8 &a,const I16vec8 &b) { return _mm_cmpeq_epi16(a,b); }

inline I16vec8 cmpneq(const I16vec8 &a,const I16vec8 &b) { return _mm_andnot_si128(_mm_cmpeq_epi16(a,b),get_mask128()); }


inline I16vec8 unpack_low(const I16vec8 &a,const I16vec8 &b) { return _mm_unpacklo_epi16(a,b); }

inline I16vec8 unpack_high(const I16vec8 &a,const I16vec8 &b) { return _mm_unpackhi_epi16(a,b); }


class Is16vec8 : public I16vec8

{

public:

  Is16vec8() { }

  Is16vec8(__m128i mm) : I16vec8(mm) { }

  Is16vec8(signed short s7,signed short s6,signed short s5,signed short s4,signed short s3,signed short s2,signed short s1,signed short s0)

  {

    _MM_8W(0,vec) = s0;

    _MM_8W(1,vec) = s1;

    _MM_8W(2,vec) = s2;

    _MM_8W(3,vec) = s3;

    _MM_8W(4,vec) = s4;

    _MM_8W(5,vec) = s5;

    _MM_8W(6,vec) = s6;

    _MM_8W(7,vec) = s7;

  }


  Is16vec8& operator= (const M128 &a) { return *this = (Is16vec8) a; }


  Is16vec8& operator&=(const M128 &a) { return *this = (Is16vec8) _mm_and_si128(vec,a); }

  Is16vec8& operator|=(const M128 &a) { return *this = (Is16vec8) _mm_or_si128(vec,a); }

  Is16vec8& operator^=(const M128 &a) { return *this = (Is16vec8) _mm_xor_si128(vec,a); }


  Is16vec8& operator +=(const I16vec8 &a) { return *this = (Is16vec8) _mm_add_epi16(vec,a); }

  Is16vec8& operator -=(const I16vec8 &a) { return *this = (Is16vec8) _mm_sub_epi16(vec,a); }

  Is16vec8& operator *=(const I16vec8 &a) { return *this = (Is16vec8) _mm_mullo_epi16(vec,a); }


  Is16vec8 operator<<(const M128 &a) { return _mm_sll_epi16(vec,a); }

  Is16vec8 operator<<(int count) { return _mm_slli_epi16(vec,count); }

  Is16vec8& operator<<=(const M128 &a) { return *this = (Is16vec8)_mm_sll_epi16(vec,a); }

  Is16vec8& operator<<=(int count) { return *this = (Is16vec8)_mm_slli_epi16(vec,count); }


  Is16vec8 operator>>(const M128 &a) { return _mm_sra_epi16(vec,a); }

  Is16vec8 operator>>(int count) { return _mm_srai_epi16(vec,count); }

  Is16vec8& operator>>=(const M128 &a) { return *this = (Is16vec8)_mm_sra_epi16(vec,a); }

  Is16vec8& operator>>=(int count) { return *this = (Is16vec8)_mm_srai_epi16(vec,count); }


#if defined(_ENABLE_VEC_DEBUG)


  friend std::ostream& operator<< (std::ostream &os,const Is16vec8 &a)

  {

    os << "[7]:" << _MM_8W(7,a)

      << " [6]:" << _MM_8W(6,a)

      << " [5]:" << _MM_8W(5,a)

      << " [4]:" << _MM_8W(4,a)

      << " [3]:" << _MM_8W(3,a)

      << " [2]:" << _MM_8W(2,a)

      << " [1]:" << _MM_8W(1,a)

      << " [0]:" << _MM_8W(0,a);

    return os;

  }

#endif


  const signed short& operator[](int i)const

  {

    assert(static_cast<unsigned int>(i) < 8);

    return _MM_8W(i,vec);

  }


  signed short& operator[](int i)

  {

    assert(static_cast<unsigned int>(i) < 8);

    return _MM_8W(i,vec);

  }

};


inline Is16vec8 operator*(const Is16vec8 &a,const Is16vec8 &b) { return _mm_mullo_epi16(a,b); }


inline Is16vec8 cmpeq(const Is16vec8 &a,const Is16vec8 &b) { return _mm_cmpeq_epi16(a,b); }

inline Is16vec8 cmpneq(const Is16vec8 &a,const Is16vec8 &b) { return _mm_andnot_si128(_mm_cmpeq_epi16(a,b),get_mask128()); }

inline Is16vec8 cmpgt(const Is16vec8 &a,const Is16vec8 &b) { return _mm_cmpgt_epi16(a,b); }

inline Is16vec8 cmplt(const Is16vec8 &a,const Is16vec8 &b) { return _mm_cmpgt_epi16(b,a); }


inline Is16vec8 unpack_low(const Is16vec8 &a,const Is16vec8 &b) { return _mm_unpacklo_epi16(a,b); }

inline Is16vec8 unpack_high(const Is16vec8 &a,const Is16vec8 &b) { return _mm_unpackhi_epi16(a,b); }


inline Is16vec8 mul_high(const Is16vec8 &a,const Is16vec8 &b) { return _mm_mulhi_epi16(a,b); }

inline Is32vec4 mul_add(const Is16vec8 &a,const Is16vec8 &b) { return _mm_madd_epi16(a,b);}


inline Is16vec8 sat_add(const Is16vec8 &a,const Is16vec8 &b) { return _mm_adds_epi16(a,b); }

inline Is16vec8 sat_sub(const Is16vec8 &a,const Is16vec8 &b) { return _mm_subs_epi16(a,b); }


inline Is16vec8 simd_max(const Is16vec8 &a,const Is16vec8 &b) { return _mm_max_epi16(a,b); }

inline Is16vec8 simd_min(const Is16vec8 &a,const Is16vec8 &b) { return _mm_min_epi16(a,b); }


class Iu16vec8 : public I16vec8

{

public:

  Iu16vec8() { }

  Iu16vec8(__m128i mm) : I16vec8(mm) { }

  Iu16vec8(unsigned short s7,unsigned short s6,unsigned short s5,unsigned short s4,unsigned short s3,unsigned short s2,unsigned short s1,unsigned short s0)

  {

    _MM_8UW(0,vec) = s0;

    _MM_8UW(1,vec) = s1;

    _MM_8UW(2,vec) = s2;

    _MM_8UW(3,vec) = s3;

    _MM_8UW(4,vec) = s4;

    _MM_8UW(5,vec) = s5;

    _MM_8UW(6,vec) = s6;

    _MM_8UW(7,vec) = s7;

  }


  Iu16vec8& operator= (const M128 &a) { return *this = (Iu16vec8) a; }


  Iu16vec8& operator&=(const M128 &a) { return *this = (Iu16vec8) _mm_and_si128(vec,a); }

  Iu16vec8& operator|=(const M128 &a) { return *this = (Iu16vec8) _mm_or_si128(vec,a); }

  Iu16vec8& operator^=(const M128 &a) { return *this = (Iu16vec8) _mm_xor_si128(vec,a); }


  Iu16vec8& operator +=(const I16vec8 &a) { return *this = (Iu16vec8) _mm_add_epi16(vec,a); }

  Iu16vec8& operator -=(const I16vec8 &a) { return *this = (Iu16vec8) _mm_sub_epi16(vec,a); }

  Iu16vec8& operator *=(const I16vec8 &a) { return *this = (Iu16vec8) _mm_mullo_epi16(vec,a); }


  Iu16vec8 operator<<(const M128 &a) { return _mm_sll_epi16(vec,a); }

  Iu16vec8 operator<<(int count) { return _mm_slli_epi16(vec,count); }

  Iu16vec8& operator<<=(const M128 &a) { return *this = (Iu16vec8)_mm_sll_epi16(vec,a); }

  Iu16vec8& operator<<=(int count) { return *this = (Iu16vec8)_mm_slli_epi16(vec,count); }

  Iu16vec8 operator>>(const M128 &a) { return _mm_srl_epi16(vec,a); }

  Iu16vec8 operator>>(int count) { return _mm_srli_epi16(vec,count); }

  Iu16vec8& operator>>=(const M128 &a) { return *this = (Iu16vec8) _mm_srl_epi16(vec,a); }

  Iu16vec8& operator>>=(int count) { return *this = (Iu16vec8) _mm_srli_epi16(vec,count); }


#if defined(_ENABLE_VEC_DEBUG)


  friend std::ostream& operator << (std::ostream &os,const Iu16vec8 &a)

  {

    os << "[7]:" << unsigned short(_MM_8UW(7,a))

      << " [6]:" << unsigned short(_MM_8UW(6,a))

      << " [5]:" << unsigned short(_MM_8UW(5,a))

      << " [4]:" << unsigned short(_MM_8UW(4,a))

      << " [3]:" << unsigned short(_MM_8UW(3,a))

      << " [2]:" << unsigned short(_MM_8UW(2,a))

      << " [1]:" << unsigned short(_MM_8UW(1,a))

      << " [0]:" << unsigned short(_MM_8UW(0,a));

    return os;

  }

#endif


  const unsigned short& operator[](int i)const

  {

    assert(static_cast<unsigned int>(i) < 8);

    return _MM_8UW(i,vec);

  }


  unsigned short& operator[](int i)

  {

    assert(static_cast<unsigned int>(i) < 8);

    return _MM_8UW(i,vec);

  }

};


inline Iu16vec8 operator*(const Iu16vec8 &a,const Iu16vec8 &b) { return _mm_mullo_epi16(a,b); }


inline Iu16vec8 cmpeq(const Iu16vec8 &a,const Iu16vec8 &b) { return _mm_cmpeq_epi16(a,b); }

inline Iu16vec8 cmpneq(const Iu16vec8 &a,const Iu16vec8 &b) { return _mm_andnot_si128(_mm_cmpeq_epi16(a,b),get_mask128()); }


inline Iu16vec8 unpack_low(const Iu16vec8 &a,const Iu16vec8 &b) { return _mm_unpacklo_epi16(a,b); }

inline Iu16vec8 unpack_high(const Iu16vec8 &a,const Iu16vec8 &b) { return _mm_unpackhi_epi16(a,b); }


inline Iu16vec8 sat_add(const Iu16vec8 &a,const Iu16vec8 &b) { return _mm_adds_epu16(a,b); }

inline Iu16vec8 sat_sub(const Iu16vec8 &a,const Iu16vec8 &b) { return _mm_subs_epu16(a,b); }


inline Iu16vec8 simd_avg(const Iu16vec8 &a,const Iu16vec8 &b) { return _mm_avg_epu16(a,b); }

inline I16vec8 mul_high(const Iu16vec8 &a,const Iu16vec8 &b) { return _mm_mulhi_epu16(a,b); }


class I8vec16 : public M128

{

public:

  I8vec16() { }

  I8vec16(__m128i mm) : M128(mm) { }


  I8vec16& operator= (const M128 &a) { return *this = (I8vec16) a; }


  I8vec16& operator&=(const M128 &a) { return *this = (I8vec16) _mm_and_si128(vec,a); }

  I8vec16& operator|=(const M128 &a) { return *this = (I8vec16) _mm_or_si128(vec,a); }

  I8vec16& operator^=(const M128 &a) { return *this = (I8vec16) _mm_xor_si128(vec,a); }


  I8vec16& operator +=(const I8vec16 &a) { return *this = (I8vec16) _mm_add_epi8(vec,a); }

  I8vec16& operator -=(const I8vec16 &a) { return *this = (I8vec16) _mm_sub_epi8(vec,a); }


};


inline I8vec16 cmpeq(const I8vec16 &a,const I8vec16 &b) { return _mm_cmpeq_epi8(a,b); }

inline I8vec16 cmpneq(const I8vec16 &a,const I8vec16 &b) { return _mm_andnot_si128(_mm_cmpeq_epi8(a,b),get_mask128()); }


inline I8vec16 unpack_low(const I8vec16 &a,const I8vec16 &b) { return _mm_unpacklo_epi8(a,b); }

inline I8vec16 unpack_high(const I8vec16 &a,const I8vec16 &b) { return _mm_unpackhi_epi8(a,b); }


class Is8vec16 : public I8vec16

{

public:

  Is8vec16() { }

  Is8vec16(__m128i mm) : I8vec16(mm) { }


  Is8vec16& operator= (const M128 &a) { return *this = (Is8vec16) a; }


  Is8vec16& operator&=(const M128 &a) { return *this = (Is8vec16) _mm_and_si128(vec,a); }

  Is8vec16& operator|=(const M128 &a) { return *this = (Is8vec16) _mm_or_si128(vec,a); }

  Is8vec16& operator^=(const M128 &a) { return *this = (Is8vec16) _mm_xor_si128(vec,a); }


  Is8vec16& operator +=(const I8vec16 &a) { return *this = (Is8vec16) _mm_add_epi8(vec,a); }

  Is8vec16& operator -=(const I8vec16 &a) { return *this = (Is8vec16) _mm_sub_epi8(vec,a); }


#if defined(_ENABLE_VEC_DEBUG)


  friend std::ostream& operator << (std::ostream &os,const Is8vec16 &a)

  {

    os << "[15]:" << short(_MM_16B(15,a))

      << " [14]:" << short(_MM_16B(14,a))

      << " [13]:" << short(_MM_16B(13,a))

      << " [12]:" << short(_MM_16B(12,a))

      << " [11]:" << short(_MM_16B(11,a))

      << " [10]:" << short(_MM_16B(10,a))

      << " [9]:" << short(_MM_16B(9,a))

      << " [8]:" << short(_MM_16B(8,a))

      << " [7]:" << short(_MM_16B(7,a))

      << " [6]:" << short(_MM_16B(6,a))

      << " [5]:" << short(_MM_16B(5,a))

      << " [4]:" << short(_MM_16B(4,a))

      << " [3]:" << short(_MM_16B(3,a))

      << " [2]:" << short(_MM_16B(2,a))

      << " [1]:" << short(_MM_16B(1,a))

      << " [0]:" << short(_MM_16B(0,a));

    return os;

  }

#endif


  const signed char& operator[](int i)const

  {

    assert(static_cast<unsigned int>(i) < 16);

    return _MM_16B(i,vec);

  }


  signed char& operator[](int i)

  {

    assert(static_cast<unsigned int>(i) < 16);

    return _MM_16B(i,vec);

  }


};


inline Is8vec16 cmpeq(const Is8vec16 &a,const Is8vec16 &b) { return _mm_cmpeq_epi8(a,b); }

inline Is8vec16 cmpneq(const Is8vec16 &a,const Is8vec16 &b) { return _mm_andnot_si128(_mm_cmpeq_epi8(a,b),get_mask128()); }

inline Is8vec16 cmpgt(const Is8vec16 &a,const Is8vec16 &b) { return _mm_cmpgt_epi8(a,b); }

inline Is8vec16 cmplt(const Is8vec16 &a,const Is8vec16 &b) { return _mm_cmplt_epi8(a,b); }


inline Is8vec16 unpack_low(const Is8vec16 &a,const Is8vec16 &b) { return _mm_unpacklo_epi8(a,b); }

inline Is8vec16 unpack_high(const Is8vec16 &a,const Is8vec16 &b) { return _mm_unpackhi_epi8(a,b); }


inline Is8vec16 sat_add(const Is8vec16 &a,const Is8vec16 &b) { return _mm_adds_epi8(a,b); }

inline Is8vec16 sat_sub(const Is8vec16 &a,const Is8vec16 &b) { return _mm_subs_epi8(a,b); }


class Iu8vec16 : public I8vec16

{

public:

  Iu8vec16() { }

  Iu8vec16(__m128i mm) : I8vec16(mm) { }


  Iu8vec16& operator= (const M128 &a) { return *this = (Iu8vec16) a; }


  Iu8vec16& operator&=(const M128 &a) { return *this = (Iu8vec16) _mm_and_si128(vec,a); }

  Iu8vec16& operator|=(const M128 &a) { return *this = (Iu8vec16) _mm_or_si128(vec,a); }

  Iu8vec16& operator^=(const M128 &a) { return *this = (Iu8vec16) _mm_xor_si128(vec,a); }


  Iu8vec16& operator +=(const I8vec16 &a) { return *this = (Iu8vec16) _mm_add_epi8(vec,a); }

  Iu8vec16& operator -=(const I8vec16 &a) { return *this = (Iu8vec16) _mm_sub_epi8(vec,a); }


#if defined(_ENABLE_VEC_DEBUG)


  friend std::ostream& operator << (std::ostream &os,const Iu8vec16 &a)

  {

    os << "[15]:" << unsigned short(_MM_16UB(15,a))

      << " [14]:" << unsigned short(_MM_16UB(14,a))

      << " [13]:" << unsigned short(_MM_16UB(13,a))

      << " [12]:" << unsigned short(_MM_16UB(12,a))

      << " [11]:" << unsigned short(_MM_16UB(11,a))

      << " [10]:" << unsigned short(_MM_16UB(10,a))

      << " [9]:" << unsigned short(_MM_16UB(9,a))

      << " [8]:" << unsigned short(_MM_16UB(8,a))

      << " [7]:" << unsigned short(_MM_16UB(7,a))

      << " [6]:" << unsigned short(_MM_16UB(6,a))

      << " [5]:" << unsigned short(_MM_16UB(5,a))

      << " [4]:" << unsigned short(_MM_16UB(4,a))

      << " [3]:" << unsigned short(_MM_16UB(3,a))

      << " [2]:" << unsigned short(_MM_16UB(2,a))

      << " [1]:" << unsigned short(_MM_16UB(1,a))

      << " [0]:" << unsigned short(_MM_16UB(0,a));

    return os;

  }

#endif


  const unsigned char& operator[](int i)const

  {

    assert(static_cast<unsigned int>(i) < 16);

    return _MM_16UB(i,vec);

  }


  unsigned char& operator[](int i)

  {

    assert(static_cast<unsigned int>(i) < 16);

    return _MM_16UB(i,vec);

  }


};


inline Iu8vec16 cmpeq(const Iu8vec16 &a,const Iu8vec16 &b) { return _mm_cmpeq_epi8(a,b); }

inline Iu8vec16 cmpneq(const Iu8vec16 &a,const Iu8vec16 &b) { return _mm_andnot_si128(_mm_cmpeq_epi8(a,b),get_mask128()); }


inline Iu8vec16 unpack_low(const Iu8vec16 &a,const Iu8vec16 &b) { return _mm_unpacklo_epi8(a,b); }

inline Iu8vec16 unpack_high(const Iu8vec16 &a,const Iu8vec16 &b) { return _mm_unpackhi_epi8(a,b); }


inline Iu8vec16 sat_add(const Iu8vec16 &a,const Iu8vec16 &b) { return _mm_adds_epu8(a,b); }

inline Iu8vec16 sat_sub(const Iu8vec16 &a,const Iu8vec16 &b) { return _mm_subs_epu8(a,b); }


inline I64vec2 sum_abs(const Iu8vec16 &a,const Iu8vec16 &b) { return _mm_sad_epu8(a,b); }


inline Iu8vec16 simd_avg(const Iu8vec16 &a,const Iu8vec16 &b) { return _mm_avg_epu8(a,b); }

inline Iu8vec16 simd_max(const Iu8vec16 &a,const Iu8vec16 &b) { return _mm_max_epu8(a,b); }

inline Iu8vec16 simd_min(const Iu8vec16 &a,const Iu8vec16 &b) { return _mm_min_epu8(a,b); }


inline Is16vec8 pack_sat(const Is32vec4 &a,const Is32vec4 &b) { return _mm_packs_epi32(a,b); }

inline Is8vec16 pack_sat(const Is16vec8 &a,const Is16vec8 &b) { return _mm_packs_epi16(a,b); }

inline Iu8vec16 packu_sat(const Is16vec8 &a,const Is16vec8 &b) { return _mm_packus_epi16(a,b);}


#define IVEC128_LOGICALS(vect,element) inline I##vect##vec##element operator& (const I##vect##vec##element &a,const I##vect##vec##element &b) { return _mm_and_si128(a,b); } inline I##vect##vec##element operator| (const I##vect##vec##element &a,const I##vect##vec##element &b) { return _mm_or_si128(a,b); } inline I##vect##vec##element operator^ (const I##vect##vec##element &a,const I##vect##vec##element &b) { return _mm_xor_si128(a,b); } inline I##vect##vec##element andnot (const I##vect##vec##element &a,const I##vect##vec##element &b) { return _mm_andnot_si128(a,b); }


IVEC128_LOGICALS(8,16)

IVEC128_LOGICALS(u8,16)

IVEC128_LOGICALS(s8,16)

IVEC128_LOGICALS(16,8)

IVEC128_LOGICALS(u16,8)

IVEC128_LOGICALS(s16,8)

IVEC128_LOGICALS(32,4)

IVEC128_LOGICALS(u32,4)

IVEC128_LOGICALS(s32,4)

IVEC128_LOGICALS(64,2)

IVEC128_LOGICALS(128,1)

#undef IVEC128_LOGICALS


#define IVEC128_ADD_SUB(vect,element,opsize) inline I##vect##vec##element operator+ (const I##vect##vec##element &a,const I##vect##vec##element &b) { return _mm_add_##opsize(a,b); } inline I##vect##vec##element operator- (const I##vect##vec##element &a,const I##vect##vec##element &b) { return _mm_sub_##opsize(a,b); }


IVEC128_ADD_SUB(8,16,epi8)

IVEC128_ADD_SUB(u8,16,epi8)

IVEC128_ADD_SUB(s8,16,epi8)

IVEC128_ADD_SUB(16,8,epi16)

IVEC128_ADD_SUB(u16,8,epi16)

IVEC128_ADD_SUB(s16,8,epi16)

IVEC128_ADD_SUB(32,4,epi32)

IVEC128_ADD_SUB(u32,4,epi32)

IVEC128_ADD_SUB(s32,4,epi32)

IVEC128_ADD_SUB(64,2,epi64)

#undef IVEC128_ADD_SUB


#define IVEC128_SELECT(vect12,vect34,element,selop,arg1,arg2) inline I##vect34##vec##element select_##selop (const I##vect12##vec##element &a,const I##vect12##vec##element &b,const I##vect34##vec##element &c,const I##vect34##vec##element &d) { I##vect12##vec##element mask = cmp##selop(a,b); return(I##vect34##vec##element ((mask & arg1) | I##vect12##vec##element ((_mm_andnot_si128(mask,arg2))))); }

IVEC128_SELECT(8,s8,16,eq,c,d)

IVEC128_SELECT(8,u8,16,eq,c,d)

IVEC128_SELECT(8,8,16,eq,c,d)

IVEC128_SELECT(8,s8,16,neq,c,d)

IVEC128_SELECT(8,u8,16,neq,c,d)

IVEC128_SELECT(8,8,16,neq,c,d)


IVEC128_SELECT(16,s16,8,eq,c,d)

IVEC128_SELECT(16,u16,8,eq,c,d)

IVEC128_SELECT(16,16,8,eq,c,d)

IVEC128_SELECT(16,s16,8,neq,c,d)

IVEC128_SELECT(16,u16,8,neq,c,d)

IVEC128_SELECT(16,16,8,neq,c,d)


IVEC128_SELECT(32,s32,4,eq,c,d)

IVEC128_SELECT(32,u32,4,eq,c,d)

IVEC128_SELECT(32,32,4,eq,c,d)

IVEC128_SELECT(32,s32,4,neq,c,d)

IVEC128_SELECT(32,u32,4,neq,c,d)

IVEC128_SELECT(32,32,4,neq,c,d)


IVEC128_SELECT(s8,s8,16,gt,c,d)

IVEC128_SELECT(s8,u8,16,gt,c,d)

IVEC128_SELECT(s8,8,16,gt,c,d)

IVEC128_SELECT(s8,s8,16,lt,c,d)

IVEC128_SELECT(s8,u8,16,lt,c,d)

IVEC128_SELECT(s8,8,16,lt,c,d)


IVEC128_SELECT(s16,s16,8,gt,c,d)

IVEC128_SELECT(s16,u16,8,gt,c,d)

IVEC128_SELECT(s16,16,8,gt,c,d)

IVEC128_SELECT(s16,s16,8,lt,c,d)

IVEC128_SELECT(s16,u16,8,lt,c,d)

IVEC128_SELECT(s16,16,8,lt,c,d)


#undef IVEC128_SELECT


class F64vec2

{

protected:

  __m128d vec;

public:


  F64vec2() {}


  F64vec2(__m128d m) { vec = m;}


  F64vec2(double d1,double d0) { vec= _mm_set_pd(d1,d0); }


  EXPLICIT F64vec2(double d) { vec = _mm_set1_pd(d); }


  operator __m128d() const { return vec; }


  friend F64vec2 operator &(const F64vec2 &a,const F64vec2 &b) { return _mm_and_pd(a,b); }

  friend F64vec2 operator |(const F64vec2 &a,const F64vec2 &b) { return _mm_or_pd(a,b); }

  friend F64vec2 operator ^(const F64vec2 &a,const F64vec2 &b) { return _mm_xor_pd(a,b); }


  friend F64vec2 operator +(const F64vec2 &a,const F64vec2 &b) { return _mm_add_pd(a,b); }

  friend F64vec2 operator -(const F64vec2 &a,const F64vec2 &b) { return _mm_sub_pd(a,b); }

  friend F64vec2 operator *(const F64vec2 &a,const F64vec2 &b) { return _mm_mul_pd(a,b); }

  friend F64vec2 operator /(const F64vec2 &a,const F64vec2 &b) { return _mm_div_pd(a,b); }


  F64vec2& operator +=(F64vec2 &a) { return *this = _mm_add_pd(vec,a); }

  F64vec2& operator -=(F64vec2 &a) { return *this = _mm_sub_pd(vec,a); }

  F64vec2& operator *=(F64vec2 &a) { return *this = _mm_mul_pd(vec,a); }

  F64vec2& operator /=(F64vec2 &a) { return *this = _mm_div_pd(vec,a); }

  F64vec2& operator &=(F64vec2 &a) { return *this = _mm_and_pd(vec,a); }

  F64vec2& operator |=(F64vec2 &a) { return *this = _mm_or_pd(vec,a); }

  F64vec2& operator ^=(F64vec2 &a) { return *this = _mm_xor_pd(vec,a); }


  friend double add_horizontal(F64vec2 &a)

  {

    F64vec2 ftemp = _mm_add_sd(a,_mm_shuffle_pd(a,a,1));

    return ftemp[0];

  }


  friend F64vec2 andnot(const F64vec2 &a,const F64vec2 &b) { return _mm_andnot_pd(a,b); }


  friend F64vec2 sqrt(const F64vec2 &a) { return _mm_sqrt_pd(a); }


#define F64vec2_COMP(op) friend F64vec2 cmp##op (const F64vec2 &a,const F64vec2 &b) { return _mm_cmp##op##_pd(a,b); }

  F64vec2_COMP(eq)

    F64vec2_COMP(lt)

    F64vec2_COMP(le)

    F64vec2_COMP(gt)

    F64vec2_COMP(ge)

    F64vec2_COMP(ngt)

    F64vec2_COMP(nge)

    F64vec2_COMP(neq)

    F64vec2_COMP(nlt)

    F64vec2_COMP(nle)

#undef F64vec2_COMP


    friend F64vec2 simd_min(const F64vec2 &a,const F64vec2 &b) { return _mm_min_pd(a,b); }

  friend F64vec2 simd_max(const F64vec2 &a,const F64vec2 &b) { return _mm_max_pd(a,b); }


#define F64vec2_COMI(op) friend int comi##op (const F64vec2 &a,const F64vec2 &b) { return _mm_comi##op##_sd(a,b); }

  F64vec2_COMI(eq)

    F64vec2_COMI(lt)

    F64vec2_COMI(le)

    F64vec2_COMI(gt)

    F64vec2_COMI(ge)

    F64vec2_COMI(neq)

#undef F64vec2_COMI


#define F64vec2_UCOMI(op) friend int ucomi##op (const F64vec2 &a,const F64vec2 &b) { return _mm_ucomi##op##_sd(a,b); }

    F64vec2_UCOMI(eq)

    F64vec2_UCOMI(lt)

    F64vec2_UCOMI(le)

    F64vec2_UCOMI(gt)

    F64vec2_UCOMI(ge)

    F64vec2_UCOMI(neq)

#undef F64vec2_UCOMI


#if defined(_ENABLE_VEC_DEBUG)


  friend std::ostream & operator<<(std::ostream & os,const F64vec2 &a) {

    double *dp = (double*)&a;

    os << " [1]:" << *(dp+1)

      << " [0]:" << *dp;

    return os;

  }

#endif


  const double &operator[](int i) const {

    assert((0 <= i) && (i <= 1));

    double *dp = (double*)&vec;

    return *(dp+i);

  }


  double &operator[](int i) {

    assert((0 <= i) && (i <= 1));

    double *dp = (double*)&vec;

    return *(dp+i);

  }

};


inline F64vec2 unpack_low(const F64vec2 &a,const F64vec2 &b) { return _mm_unpacklo_pd(a,b); }

inline F64vec2 unpack_high(const F64vec2 &a,const F64vec2 &b) { return _mm_unpackhi_pd(a,b); }

inline int move_mask(const F64vec2 &a) { return _mm_movemask_pd(a); }

inline void loadu(F64vec2 &a,double *p) { a = _mm_loadu_pd(p); }

inline void storeu(double *p,const F64vec2 &a) { _mm_storeu_pd(p,a); }

inline void store_nta(double *p,F64vec2 &a) { _mm_stream_pd(p,a); }


#define F64vec2_SELECT(op) inline F64vec2 select_##op (const F64vec2 &a,const F64vec2 &b,const F64vec2 &c,const F64vec2 &d) { F64vec2 mask = _mm_cmp##op##_pd(a,b); return((mask & c) | F64vec2((_mm_andnot_pd(mask,d)))); }

F64vec2_SELECT(eq)

F64vec2_SELECT(lt)

F64vec2_SELECT(le)

F64vec2_SELECT(gt)

F64vec2_SELECT(ge)

F64vec2_SELECT(neq)

F64vec2_SELECT(nlt)

F64vec2_SELECT(nle)

#undef F64vec2_SELECT


inline int F64vec2ToInt(const F64vec2 &a) { return _mm_cvttsd_si32(a); }

inline F64vec2 F32vec4ToF64vec2(const F32vec4 &a) { return _mm_cvtps_pd(a); }

inline F32vec4 F64vec2ToF32vec4(const F64vec2 &a) { return _mm_cvtpd_ps(a); }

inline F64vec2 IntToF64vec2(const F64vec2 &a,int b) { return _mm_cvtsi32_sd(a,b); }


#pragma pack(pop)

#pragma pack(pop)

#endif

#endif

operator<<
basic_ostream< _CharT, _Traits > &_STLP_CALL operator<<(basic_ostream< _CharT, _Traits > &__os, const bitset< _Nb > &__x)
Definition: _bitset.c:219

__int64
#define __int64
Definition: basetyps.h:16

u32
ULONG32 u32
Definition: btrfs.h:14

u8
UCHAR u8
Definition: btrfs.h:12

u16
USHORT u16
Definition: btrfs.h:13

F32vec4
Definition: fvec.h:28

F64vec2
Definition: dvec.h:718

F64vec2::operator*
friend F64vec2 operator*(const F64vec2 &a, const F64vec2 &b)
Definition: dvec.h:739

F64vec2::operator-=
F64vec2 & operator-=(F64vec2 &a)
Definition: dvec.h:743

F64vec2::F64vec2_COMI
F64vec2_COMI(eq) F64vec2_COMI(lt) F64vec2_COMI(le) F64vec2_COMI(gt) F64vec2_COMI(ge) F64vec2_COMI(neq) F64vec2_UCOMI(eq) F64vec2_UCOMI(lt) F64vec2_UCOMI(le) F64vec2_UCOMI(gt) F64vec2_UCOMI(ge) F64vec2_UCOMI(neq) const double &operator[](int i) const
Definition: dvec.h:777

F64vec2::F64vec2
EXPLICIT F64vec2(double d)
Definition: dvec.h:729

F64vec2::operator[]
double & operator[](int i)
Definition: dvec.h:810

F64vec2::operator/
friend F64vec2 operator/(const F64vec2 &a, const F64vec2 &b)
Definition: dvec.h:740

F64vec2::operator-
friend F64vec2 operator-(const F64vec2 &a, const F64vec2 &b)
Definition: dvec.h:738

F64vec2::operator/=
F64vec2 & operator/=(F64vec2 &a)
Definition: dvec.h:745

F64vec2::operator&
friend F64vec2 operator&(const F64vec2 &a, const F64vec2 &b)
Definition: dvec.h:733

F64vec2::simd_max
friend F64vec2 simd_max(const F64vec2 &a, const F64vec2 &b)
Definition: dvec.h:774

F64vec2::sqrt
friend F64vec2 sqrt(const F64vec2 &a)
Definition: dvec.h:758

F64vec2::add_horizontal
friend double add_horizontal(F64vec2 &a)
Definition: dvec.h:750

F64vec2::operator+
friend F64vec2 operator+(const F64vec2 &a, const F64vec2 &b)
Definition: dvec.h:737

F64vec2::operator^=
F64vec2 & operator^=(F64vec2 &a)
Definition: dvec.h:748

F64vec2::andnot
friend F64vec2 andnot(const F64vec2 &a, const F64vec2 &b)
Definition: dvec.h:756

F64vec2::F64vec2_COMP
F64vec2_COMP(eq) F64vec2_COMP(lt) F64vec2_COMP(le) F64vec2_COMP(gt) F64vec2_COMP(ge) F64vec2_COMP(ngt) F64vec2_COMP(nge) F64vec2_COMP(neq) F64vec2_COMP(nlt) F64vec2_COMP(nle) friend F64vec2 simd_min(const F64vec2 &a

F64vec2::operator+=
F64vec2 & operator+=(F64vec2 &a)
Definition: dvec.h:742

F64vec2::operator|
friend F64vec2 operator|(const F64vec2 &a, const F64vec2 &b)
Definition: dvec.h:734

F64vec2::F64vec2
F64vec2()
Definition: dvec.h:723

F64vec2::operator|=
F64vec2 & operator|=(F64vec2 &a)
Definition: dvec.h:747

F64vec2::vec
__m128d vec
Definition: dvec.h:720

F64vec2::operator^
friend F64vec2 operator^(const F64vec2 &a, const F64vec2 &b)
Definition: dvec.h:735

F64vec2::operator*=
F64vec2 & operator*=(F64vec2 &a)
Definition: dvec.h:744

F64vec2::F64vec2
F64vec2(double d1, double d0)
Definition: dvec.h:727

F64vec2::operator&=
F64vec2 & operator&=(F64vec2 &a)
Definition: dvec.h:746

F64vec2::F64vec2
F64vec2(__m128d m)
Definition: dvec.h:725

I128vec1
Definition: dvec.h:81

I128vec1::operator=
I128vec1 & operator=(const M128 &a)
Definition: dvec.h:86

I128vec1::operator^=
I128vec1 & operator^=(const M128 &a)
Definition: dvec.h:89

I128vec1::operator&=
I128vec1 & operator&=(const M128 &a)
Definition: dvec.h:87

I128vec1::I128vec1
I128vec1(__m128i mm)
Definition: dvec.h:84

I128vec1::operator|=
I128vec1 & operator|=(const M128 &a)
Definition: dvec.h:88

I128vec1::I128vec1
I128vec1()
Definition: dvec.h:83

I16vec8
Definition: dvec.h:297

I16vec8::operator*=
I16vec8 & operator*=(const I16vec8 &a)
Definition: dvec.h:310

I16vec8::operator=
I16vec8 & operator=(const M128 &a)
Definition: dvec.h:302

I16vec8::operator<<
I16vec8 operator<<(const M128 &a)
Definition: dvec.h:312

I16vec8::operator&=
I16vec8 & operator&=(const M128 &a)
Definition: dvec.h:304

I16vec8::operator^=
I16vec8 & operator^=(const M128 &a)
Definition: dvec.h:306

I16vec8::operator+=
I16vec8 & operator+=(const I16vec8 &a)
Definition: dvec.h:308

I16vec8::operator|=
I16vec8 & operator|=(const M128 &a)
Definition: dvec.h:305

I16vec8::operator<<=
I16vec8 & operator<<=(const M128 &a)
Definition: dvec.h:314

I16vec8::I16vec8
I16vec8(__m128i mm)
Definition: dvec.h:300

I16vec8::operator-=
I16vec8 & operator-=(const I16vec8 &a)
Definition: dvec.h:309

I16vec8::operator<<=
I16vec8 & operator<<=(int count)
Definition: dvec.h:315

I16vec8::I16vec8
I16vec8()
Definition: dvec.h:299

I16vec8::operator<<
I16vec8 operator<<(int count)
Definition: dvec.h:313

I32vec4
Definition: dvec.h:141

I32vec4::operator+=
I32vec4 & operator+=(const I32vec4 &a)
Definition: dvec.h:152

I32vec4::operator=
I32vec4 & operator=(const M128 &a)
Definition: dvec.h:146

I32vec4::I32vec4
I32vec4()
Definition: dvec.h:143

I32vec4::operator&=
I32vec4 & operator&=(const M128 &a)
Definition: dvec.h:148

I32vec4::operator<<=
I32vec4 & operator<<=(int count)
Definition: dvec.h:158

I32vec4::operator<<=
I32vec4 & operator<<=(const I32vec4 &a)
Definition: dvec.h:157

I32vec4::operator<<
I32vec4 operator<<(int count)
Definition: dvec.h:156

I32vec4::I32vec4
I32vec4(__m128i mm)
Definition: dvec.h:144

I32vec4::operator-=
I32vec4 & operator-=(const I32vec4 &a)
Definition: dvec.h:153

I32vec4::operator|=
I32vec4 & operator|=(const M128 &a)
Definition: dvec.h:149

I32vec4::operator^=
I32vec4 & operator^=(const M128 &a)
Definition: dvec.h:150

I32vec4::operator<<
I32vec4 operator<<(const I32vec4 &a)
Definition: dvec.h:155

I64vec2
Definition: dvec.h:94

I64vec2::operator+=
I64vec2 & operator+=(const I64vec2 &a)
Definition: dvec.h:111

I64vec2::operator[]
const __int64 & operator[](int i) const
Definition: dvec.h:123

I64vec2::I64vec2
I64vec2(__m128i mm)
Definition: dvec.h:97

I64vec2::operator>>
I64vec2 operator>>(const I64vec2 &a)
Definition: dvec.h:118

I64vec2::operator>>
I64vec2 operator>>(int count)
Definition: dvec.h:119

I64vec2::operator&=
I64vec2 & operator&=(const M128 &a)
Definition: dvec.h:107

I64vec2::operator=
I64vec2 & operator=(const M128 &a)
Definition: dvec.h:105

I64vec2::operator^=
I64vec2 & operator^=(const M128 &a)
Definition: dvec.h:109

I64vec2::operator|=
I64vec2 & operator|=(const M128 &a)
Definition: dvec.h:108

I64vec2::operator[]
__int64 & operator[](int i)
Definition: dvec.h:129

I64vec2::operator<<=
I64vec2 & operator<<=(const I64vec2 &a)
Definition: dvec.h:116

I64vec2::operator>>=
I64vec2 & operator>>=(int count)
Definition: dvec.h:121

I64vec2::operator>>=
I64vec2 & operator>>=(const I64vec2 &a)
Definition: dvec.h:120

I64vec2::operator-=
I64vec2 & operator-=(const I64vec2 &a)
Definition: dvec.h:112

I64vec2::operator<<
I64vec2 operator<<(const I64vec2 &a)
Definition: dvec.h:114

I64vec2::operator<<=
I64vec2 & operator<<=(int count)
Definition: dvec.h:117

I64vec2::I64vec2
I64vec2()
Definition: dvec.h:96

I64vec2::I64vec2
I64vec2(__m64 q1, __m64 q0)
Definition: dvec.h:99

I64vec2::operator<<
I64vec2 operator<<(int count)
Definition: dvec.h:115

I8vec16
Definition: dvec.h:492

I8vec16::operator+=
I8vec16 & operator+=(const I8vec16 &a)
Definition: dvec.h:503

I8vec16::operator^=
I8vec16 & operator^=(const M128 &a)
Definition: dvec.h:501

I8vec16::I8vec16
I8vec16()
Definition: dvec.h:494

I8vec16::operator=
I8vec16 & operator=(const M128 &a)
Definition: dvec.h:497

I8vec16::operator|=
I8vec16 & operator|=(const M128 &a)
Definition: dvec.h:500

I8vec16::I8vec16
I8vec16(__m128i mm)
Definition: dvec.h:495

I8vec16::operator&=
I8vec16 & operator&=(const M128 &a)
Definition: dvec.h:499

I8vec16::operator-=
I8vec16 & operator-=(const I8vec16 &a)
Definition: dvec.h:504

Is16vec8
Definition: dvec.h:328

Is16vec8::operator*=
Is16vec8 & operator*=(const I16vec8 &a)
Definition: dvec.h:352

Is16vec8::Is16vec8
Is16vec8(signed short s7, signed short s6, signed short s5, signed short s4, signed short s3, signed short s2, signed short s1, signed short s0)
Definition: dvec.h:332

Is16vec8::operator>>
Is16vec8 operator>>(const M128 &a)
Definition: dvec.h:359

Is16vec8::operator>>=
Is16vec8 & operator>>=(const M128 &a)
Definition: dvec.h:361

Is16vec8::operator[]
const signed short & operator[](int i) const
Definition: dvec.h:380

Is16vec8::operator<<=
Is16vec8 & operator<<=(const M128 &a)
Definition: dvec.h:356

Is16vec8::operator&=
Is16vec8 & operator&=(const M128 &a)
Definition: dvec.h:346

Is16vec8::operator-=
Is16vec8 & operator-=(const I16vec8 &a)
Definition: dvec.h:351

Is16vec8::operator|=
Is16vec8 & operator|=(const M128 &a)
Definition: dvec.h:347

Is16vec8::operator>>=
Is16vec8 & operator>>=(int count)
Definition: dvec.h:362

Is16vec8::operator=
Is16vec8 & operator=(const M128 &a)
Definition: dvec.h:344

Is16vec8::operator[]
signed short & operator[](int i)
Definition: dvec.h:386

Is16vec8::operator+=
Is16vec8 & operator+=(const I16vec8 &a)
Definition: dvec.h:350

Is16vec8::Is16vec8
Is16vec8()
Definition: dvec.h:330

Is16vec8::operator>>
Is16vec8 operator>>(int count)
Definition: dvec.h:360

Is16vec8::operator<<
Is16vec8 operator<<(int count)
Definition: dvec.h:355

Is16vec8::operator^=
Is16vec8 & operator^=(const M128 &a)
Definition: dvec.h:348

Is16vec8::operator<<=
Is16vec8 & operator<<=(int count)
Definition: dvec.h:357

Is16vec8::operator<<
Is16vec8 operator<<(const M128 &a)
Definition: dvec.h:354

Is16vec8::Is16vec8
Is16vec8(__m128i mm)
Definition: dvec.h:331

Is32vec4
Definition: dvec.h:169

Is32vec4::operator=
Is32vec4 & operator=(const M128 &a)
Definition: dvec.h:181

Is32vec4::operator>>
Is32vec4 operator>>(int count)
Definition: dvec.h:196

Is32vec4::operator|=
Is32vec4 & operator|=(const M128 &a)
Definition: dvec.h:184

Is32vec4::operator<<
Is32vec4 operator<<(int count)
Definition: dvec.h:191

Is32vec4::operator-=
Is32vec4 & operator-=(const I32vec4 &a)
Definition: dvec.h:188

Is32vec4::operator>>=
Is32vec4 & operator>>=(int count)
Definition: dvec.h:198

Is32vec4::operator[]
int & operator[](int i)
Definition: dvec.h:218

Is32vec4::operator>>=
Is32vec4 & operator>>=(const M128 &a)
Definition: dvec.h:197

Is32vec4::operator<<
Is32vec4 operator<<(const M128 &a)
Definition: dvec.h:190

Is32vec4::operator>>
Is32vec4 operator>>(const M128 &a)
Definition: dvec.h:195

Is32vec4::operator<<=
Is32vec4 & operator<<=(const M128 &a)
Definition: dvec.h:192

Is32vec4::operator<<=
Is32vec4 & operator<<=(int count)
Definition: dvec.h:193

Is32vec4::Is32vec4
Is32vec4()
Definition: dvec.h:171

Is32vec4::operator+=
Is32vec4 & operator+=(const I32vec4 &a)
Definition: dvec.h:187

Is32vec4::Is32vec4
Is32vec4(__m128i mm)
Definition: dvec.h:172

Is32vec4::operator&=
Is32vec4 & operator&=(const M128 &a)
Definition: dvec.h:183

Is32vec4::operator[]
const int & operator[](int i) const
Definition: dvec.h:212

Is32vec4::operator^=
Is32vec4 & operator^=(const M128 &a)
Definition: dvec.h:185

Is32vec4::Is32vec4
Is32vec4(int i3, int i2, int i1, int i0)
Definition: dvec.h:173

Is8vec16
Definition: dvec.h:515

Is8vec16::operator[]
signed char & operator[](int i)
Definition: dvec.h:559

Is8vec16::Is8vec16
Is8vec16()
Definition: dvec.h:517

Is8vec16::operator&=
Is8vec16 & operator&=(const M128 &a)
Definition: dvec.h:522

Is8vec16::operator-=
Is8vec16 & operator-=(const I8vec16 &a)
Definition: dvec.h:527

Is8vec16::Is8vec16
Is8vec16(__m128i mm)
Definition: dvec.h:518

Is8vec16::operator=
Is8vec16 & operator=(const M128 &a)
Definition: dvec.h:520

Is8vec16::operator^=
Is8vec16 & operator^=(const M128 &a)
Definition: dvec.h:524

Is8vec16::operator|=
Is8vec16 & operator|=(const M128 &a)
Definition: dvec.h:523

Is8vec16::operator+=
Is8vec16 & operator+=(const I8vec16 &a)
Definition: dvec.h:526

Is8vec16::operator[]
const signed char & operator[](int i) const
Definition: dvec.h:553

Iu16vec8
Definition: dvec.h:413

Iu16vec8::operator[]
unsigned short & operator[](int i)
Definition: dvec.h:470

Iu16vec8::operator&=
Iu16vec8 & operator&=(const M128 &a)
Definition: dvec.h:431

Iu16vec8::operator|=
Iu16vec8 & operator|=(const M128 &a)
Definition: dvec.h:432

Iu16vec8::Iu16vec8
Iu16vec8()
Definition: dvec.h:415

Iu16vec8::operator<<=
Iu16vec8 & operator<<=(int count)
Definition: dvec.h:442

Iu16vec8::operator-=
Iu16vec8 & operator-=(const I16vec8 &a)
Definition: dvec.h:436

Iu16vec8::operator^=
Iu16vec8 & operator^=(const M128 &a)
Definition: dvec.h:433

Iu16vec8::operator>>=
Iu16vec8 & operator>>=(int count)
Definition: dvec.h:446

Iu16vec8::Iu16vec8
Iu16vec8(__m128i mm)
Definition: dvec.h:416

Iu16vec8::operator*=
Iu16vec8 & operator*=(const I16vec8 &a)
Definition: dvec.h:437

Iu16vec8::operator=
Iu16vec8 & operator=(const M128 &a)
Definition: dvec.h:429

Iu16vec8::operator<<=
Iu16vec8 & operator<<=(const M128 &a)
Definition: dvec.h:441

Iu16vec8::operator+=
Iu16vec8 & operator+=(const I16vec8 &a)
Definition: dvec.h:435

Iu16vec8::operator>>
Iu16vec8 operator>>(const M128 &a)
Definition: dvec.h:443

Iu16vec8::operator>>=
Iu16vec8 & operator>>=(const M128 &a)
Definition: dvec.h:445

Iu16vec8::operator[]
const unsigned short & operator[](int i) const
Definition: dvec.h:464

Iu16vec8::operator>>
Iu16vec8 operator>>(int count)
Definition: dvec.h:444

Iu16vec8::operator<<
Iu16vec8 operator<<(const M128 &a)
Definition: dvec.h:439

Iu16vec8::Iu16vec8
Iu16vec8(unsigned short s7, unsigned short s6, unsigned short s5, unsigned short s4, unsigned short s3, unsigned short s2, unsigned short s1, unsigned short s0)
Definition: dvec.h:417

Iu16vec8::operator<<
Iu16vec8 operator<<(int count)
Definition: dvec.h:440

Iu32vec4
Definition: dvec.h:234

Iu32vec4::operator-=
Iu32vec4 & operator-=(const I32vec4 &a)
Definition: dvec.h:253

Iu32vec4::operator=
Iu32vec4 & operator=(const M128 &a)
Definition: dvec.h:246

Iu32vec4::operator<<=
Iu32vec4 & operator<<=(int count)
Definition: dvec.h:258

Iu32vec4::Iu32vec4
Iu32vec4(unsigned int ui3, unsigned int ui2, unsigned int ui1, unsigned int ui0)
Definition: dvec.h:238

Iu32vec4::operator>>=
Iu32vec4 & operator>>=(int count)
Definition: dvec.h:262

Iu32vec4::operator^=
Iu32vec4 & operator^=(const M128 &a)
Definition: dvec.h:250

Iu32vec4::Iu32vec4
Iu32vec4()
Definition: dvec.h:236

Iu32vec4::operator&=
Iu32vec4 & operator&=(const M128 &a)
Definition: dvec.h:248

Iu32vec4::operator+=
Iu32vec4 & operator+=(const I32vec4 &a)
Definition: dvec.h:252

Iu32vec4::operator<<
Iu32vec4 operator<<(int count)
Definition: dvec.h:256

Iu32vec4::operator<<
Iu32vec4 operator<<(const M128 &a)
Definition: dvec.h:255

Iu32vec4::operator<<=
Iu32vec4 & operator<<=(const M128 &a)
Definition: dvec.h:257

Iu32vec4::operator[]
unsigned int & operator[](int i)
Definition: dvec.h:282

Iu32vec4::operator|=
Iu32vec4 & operator|=(const M128 &a)
Definition: dvec.h:249

Iu32vec4::operator>>
Iu32vec4 operator>>(int count)
Definition: dvec.h:260

Iu32vec4::operator>>=
Iu32vec4 & operator>>=(const M128 &a)
Definition: dvec.h:261

Iu32vec4::Iu32vec4
Iu32vec4(__m128i mm)
Definition: dvec.h:237

Iu32vec4::operator>>
Iu32vec4 operator>>(const M128 &a)
Definition: dvec.h:259

Iu32vec4::operator[]
const unsigned int & operator[](int i) const
Definition: dvec.h:276

Iu8vec16
Definition: dvec.h:579

Iu8vec16::operator^=
Iu8vec16 & operator^=(const M128 &a)
Definition: dvec.h:588

Iu8vec16::Iu8vec16
Iu8vec16()
Definition: dvec.h:581

Iu8vec16::operator[]
const unsigned char & operator[](int i) const
Definition: dvec.h:617

Iu8vec16::Iu8vec16
Iu8vec16(__m128i mm)
Definition: dvec.h:582

Iu8vec16::operator+=
Iu8vec16 & operator+=(const I8vec16 &a)
Definition: dvec.h:590

Iu8vec16::operator[]
unsigned char & operator[](int i)
Definition: dvec.h:623

Iu8vec16::operator&=
Iu8vec16 & operator&=(const M128 &a)
Definition: dvec.h:586

Iu8vec16::operator=
Iu8vec16 & operator=(const M128 &a)
Definition: dvec.h:584

Iu8vec16::operator|=
Iu8vec16 & operator|=(const M128 &a)
Definition: dvec.h:587

Iu8vec16::operator-=
Iu8vec16 & operator-=(const I8vec16 &a)
Definition: dvec.h:591

M128
Definition: dvec.h:59

M128::vec
__m128i vec
Definition: dvec.h:61

M128::operator|=
M128 & operator|=(const M128 &a)
Definition: dvec.h:70

M128::operator^=
M128 & operator^=(const M128 &a)
Definition: dvec.h:71

M128::M128
M128()
Definition: dvec.h:64

M128::operator&=
M128 & operator&=(const M128 &a)
Definition: dvec.h:69

M128::M128
M128(__m128i mm)
Definition: dvec.h:65

crtdefs.h

short
unsigned short(__cdecl typeof(TIFFCurrentDirectory))(struct tiff *)
Definition: typeof.h:94

assert
#define assert(x)
Definition: debug.h:53

s32
signed int s32
Definition: linux.h:57

s8
signed char s8
Definition: linux.h:51

s16
signed short s16
Definition: linux.h:54

pack_sat
Is16vec8 pack_sat(const Is32vec4 &a, const Is32vec4 &b)
Definition: dvec.h:646

sum_abs
I64vec2 sum_abs(const Iu8vec16 &a, const Iu8vec16 &b)
Definition: dvec.h:640

F64vec2_COMI
#define F64vec2_COMI(op)
Definition: dvec.h:776

_MM_8UW
#define _MM_8UW(element, vector)
Definition: dvec.h:44

F64vec2_COMP
#define F64vec2_COMP(op)
Definition: dvec.h:760

EXPLICIT
#define EXPLICIT
Definition: dvec.h:27

mul_add
Is32vec4 mul_add(const Is16vec8 &a, const Is16vec8 &b)
Definition: dvec.h:404

F64vec2_UCOMI
#define F64vec2_UCOMI(op)

cmpgt
Is32vec4 cmpgt(const Is32vec4 &a, const Is32vec4 &b)
Definition: dvec.h:227

cmpeq
I32vec4 cmpeq(const I32vec4 &a, const I32vec4 &b)
Definition: dvec.h:162

_MM_4DW
#define _MM_4DW(element, vector)
Definition: dvec.h:48

_MM_2QW
#define _MM_2QW(element, vector)
Definition: dvec.h:50

IntToF64vec2
F64vec2 IntToF64vec2(const F64vec2 &a, int b)
Definition: dvec.h:838

_MM_8W
#define _MM_8W(element, vector)
Definition: dvec.h:45

andnot
M128 andnot(const M128 &a, const M128 &b)
Definition: dvec.h:78

cmpneq
I32vec4 cmpneq(const I32vec4 &a, const I32vec4 &b)
Definition: dvec.h:163

loadu
void loadu(F64vec2 &a, double *p)
Definition: dvec.h:820

IVEC128_ADD_SUB
#define IVEC128_ADD_SUB(vect, element, opsize)
Definition: dvec.h:665

simd_max
Is16vec8 simd_max(const Is16vec8 &a, const Is16vec8 &b)
Definition: dvec.h:409

F64vec2_SELECT
#define F64vec2_SELECT(op)
Definition: dvec.h:824

operator&
M128 operator&(const M128 &a, const M128 &b)
Definition: dvec.h:75

unpack_low
I64vec2 unpack_low(const I64vec2 &a, const I64vec2 &b)
Definition: dvec.h:137

cmplt
Is32vec4 cmplt(const Is32vec4 &a, const Is32vec4 &b)
Definition: dvec.h:228

unpack_high
I64vec2 unpack_high(const I64vec2 &a, const I64vec2 &b)
Definition: dvec.h:138

F32vec4ToF64vec2
F64vec2 F32vec4ToF64vec2(const F32vec4 &a)
Definition: dvec.h:836

operator*
I64vec2 operator*(const Iu32vec4 &a, const Iu32vec4 &b)
Definition: dvec.h:289

simd_avg
Iu16vec8 simd_avg(const Iu16vec8 &a, const Iu16vec8 &b)
Definition: dvec.h:488

_MM_4UDW
#define _MM_4UDW(element, vector)
Definition: dvec.h:47

mul_high
Is16vec8 mul_high(const Is16vec8 &a, const Is16vec8 &b)
Definition: dvec.h:403

_MM_16UB
#define _MM_16UB(element, vector)
Definition: dvec.h:41

operator^
M128 operator^(const M128 &a, const M128 &b)
Definition: dvec.h:77

operator|
M128 operator|(const M128 &a, const M128 &b)
Definition: dvec.h:76

F64vec2ToF32vec4
F32vec4 F64vec2ToF32vec4(const F64vec2 &a)
Definition: dvec.h:837

storeu
void storeu(double *p, const F64vec2 &a)
Definition: dvec.h:821

packu_sat
Iu8vec16 packu_sat(const Is16vec8 &a, const Is16vec8 &b)
Definition: dvec.h:648

IVEC128_LOGICALS
#define IVEC128_LOGICALS(vect, element)
Definition: dvec.h:650

sat_sub
Is16vec8 sat_sub(const Is16vec8 &a, const Is16vec8 &b)
Definition: dvec.h:407

simd_min
Is16vec8 simd_min(const Is16vec8 &a, const Is16vec8 &b)
Definition: dvec.h:410

get_mask128
const __m128i get_mask128()
Definition: dvec.h:52

_MM_16B
#define _MM_16B(element, vector)
Definition: dvec.h:42

store_nta
void store_nta(double *p, F64vec2 &a)
Definition: dvec.h:822

IVEC128_SELECT
#define IVEC128_SELECT(vect12, vect34, element, selop, arg1, arg2)
Definition: dvec.h:679

move_mask
int move_mask(const F64vec2 &a)
Definition: dvec.h:819

sat_add
Is16vec8 sat_add(const Is16vec8 &a, const Is16vec8 &b)
Definition: dvec.h:406

emmintrin.h

_mm_cvtpd_ps
__m128 _mm_cvtpd_ps(__m128d a)
Definition: emmintrin.h:846

_mm_storeu_pd
void _mm_storeu_pd(double *dp, __m128d a)
Definition: emmintrin.h:1083

_mm_add_sd
__m128d _mm_add_sd(__m128d a, __m128d b)
Definition: emmintrin.h:567

_mm_cmpgt_epi8
__m128i _mm_cmpgt_epi8(__m128i a, __m128i b)
Definition: emmintrin.h:1442

_mm_adds_epu16
__m128i _mm_adds_epu16(__m128i a, __m128i b)
Definition: emmintrin.h:1170

_mm_slli_epi64
__m128i _mm_slli_epi64(__m128i a, int count)
Definition: emmintrin.h:1364

_mm_srl_epi64
__m128i _mm_srl_epi64(__m128i a, __m128i count)
Definition: emmintrin.h:1422

_mm_add_pd
__m128d _mm_add_pd(__m128d a, __m128d b)
Definition: emmintrin.h:573

_mm_xor_si128
__m128i _mm_xor_si128(__m128i a, __m128i b)
Definition: emmintrin.h:1336

_mm_srli_epi64
__m128i _mm_srli_epi64(__m128i a, int count)
Definition: emmintrin.h:1417

_mm_set1_epi64
__m128i _mm_set1_epi64(__m64 q)
Definition: emmintrin.h:1603

_mm_packs_epi32
__m128i _mm_packs_epi32(__m128i a, __m128i b)
Definition: emmintrin.h:1747

_mm_sad_epu8
__m128i _mm_sad_epu8(__m128i a, __m128i b)
Definition: emmintrin.h:1255

_mm_packus_epi16
__m128i _mm_packus_epi16(__m128i a, __m128i b)
Definition: emmintrin.h:1752

_mm_adds_epu8
__m128i _mm_adds_epu8(__m128i a, __m128i b)
Definition: emmintrin.h:1161

_mm_sub_epi32
__m128i _mm_sub_epi32(__m128i a, __m128i b)
Definition: emmintrin.h:1270

_mm_add_epi16
__m128i _mm_add_epi16(__m128i a, __m128i b)
Definition: emmintrin.h:1123

_mm_mulhi_epu16
__m128i _mm_mulhi_epu16(__m128i a, __m128i b)
Definition: emmintrin.h:1235

_mm_slli_epi32
__m128i _mm_slli_epi32(__m128i a, int count)
Definition: emmintrin.h:1354

_mm_and_pd
__m128d _mm_and_pd(__m128d a, __m128d b)
Definition: emmintrin.h:642

_mm_mul_epu32
__m128i _mm_mul_epu32(__m128i a, __m128i b)
Definition: emmintrin.h:1250

_mm_sub_pd
__m128d _mm_sub_pd(__m128d a, __m128d b)
Definition: emmintrin.h:584

_mm_cmpeq_epi8
__m128i _mm_cmpeq_epi8(__m128i a, __m128i b)
Definition: emmintrin.h:1427

_mm_min_pd
__m128d _mm_min_pd(__m128d a, __m128d b)
Definition: emmintrin.h:627

_mm_sll_epi32
__m128i _mm_sll_epi32(__m128i a, __m128i count)
Definition: emmintrin.h:1359

_mm_unpackhi_epi16
__m128i _mm_unpackhi_epi16(__m128i a, __m128i b)
Definition: emmintrin.h:1790

_mm_subs_epu8
__m128i _mm_subs_epu8(__m128i a, __m128i b)
Definition: emmintrin.h:1303

_mm_srl_epi32
__m128i _mm_srl_epi32(__m128i a, __m128i count)
Definition: emmintrin.h:1412

_mm_mulhi_epi16
__m128i _mm_mulhi_epi16(__m128i a, __m128i b)
Definition: emmintrin.h:1230

_mm_shuffle_pd
#define _mm_shuffle_pd(a, b, i)
Definition: emmintrin.h:1901

_mm_or_pd
__m128d _mm_or_pd(__m128d a, __m128d b)
Definition: emmintrin.h:652

_mm_cmpeq_epi16
__m128i _mm_cmpeq_epi16(__m128i a, __m128i b)
Definition: emmintrin.h:1432

_mm_sra_epi32
__m128i _mm_sra_epi32(__m128i a, __m128i count)
Definition: emmintrin.h:1389

_mm_srai_epi32
__m128i _mm_srai_epi32(__m128i a, int count)
Definition: emmintrin.h:1384

_mm_slli_epi16
__m128i _mm_slli_epi16(__m128i a, int count)
Definition: emmintrin.h:1344

_mm_subs_epi8
__m128i _mm_subs_epi8(__m128i a, __m128i b)
Definition: emmintrin.h:1285

_mm_movemask_pd
int _mm_movemask_pd(__m128d a)
Definition: emmintrin.h:1896

_mm_sub_epi64
__m128i _mm_sub_epi64(__m128i a, __m128i b)
Definition: emmintrin.h:1280

_mm_min_epu8
__m128i _mm_min_epu8(__m128i a, __m128i b)
Definition: emmintrin.h:1221

_mm_unpackhi_pd
__m128d _mm_unpackhi_pd(__m128d a, __m128d b)
Definition: emmintrin.h:1878

_mm_cvttsd_si32
int _mm_cvttsd_si32(__m128d a)
Definition: emmintrin.h:902

_mm_unpackhi_epi32
__m128i _mm_unpackhi_epi32(__m128i a, __m128i b)
Definition: emmintrin.h:1800

_mm_add_epi8
__m128i _mm_add_epi8(__m128i a, __m128i b)
Definition: emmintrin.h:1118

_mm_loadu_pd
__m128d _mm_loadu_pd(double const *dp)
Definition: emmintrin.h:956

_mm_avg_epu16
__m128i _mm_avg_epu16(__m128i a, __m128i b)
Definition: emmintrin.h:1184

_mm_sll_epi64
__m128i _mm_sll_epi64(__m128i a, __m128i count)
Definition: emmintrin.h:1369

_mm_cvtsi32_sd
__m128d _mm_cvtsi32_sd(__m128d a, int b)
Definition: emmintrin.h:884

_mm_or_si128
__m128i _mm_or_si128(__m128i a, __m128i b)
Definition: emmintrin.h:1331

_mm_subs_epi16
__m128i _mm_subs_epi16(__m128i a, __m128i b)
Definition: emmintrin.h:1294

_mm_packs_epi16
__m128i _mm_packs_epi16(__m128i a, __m128i b)
Definition: emmintrin.h:1742

_mm_srli_epi16
__m128i _mm_srli_epi16(__m128i a, int count)
Definition: emmintrin.h:1397

_mm_sub_epi8
__m128i _mm_sub_epi8(__m128i a, __m128i b)
Definition: emmintrin.h:1260

_mm_mul_pd
__m128d _mm_mul_pd(__m128d a, __m128d b)
Definition: emmintrin.h:595

_mm_sll_epi16
__m128i _mm_sll_epi16(__m128i a, __m128i count)
Definition: emmintrin.h:1349

_mm_sqrt_pd
__m128d _mm_sqrt_pd(__m128d a)
Definition: emmintrin.h:617

_mm_mullo_epi16
__m128i _mm_mullo_epi16(__m128i a, __m128i b)
Definition: emmintrin.h:1240

_mm_sra_epi16
__m128i _mm_sra_epi16(__m128i a, __m128i count)
Definition: emmintrin.h:1379

_mm_madd_epi16
__m128i _mm_madd_epi16(__m128i a, __m128i b)
Definition: emmintrin.h:1189

_mm_cmpeq_epi32
__m128i _mm_cmpeq_epi32(__m128i a, __m128i b)
Definition: emmintrin.h:1437

_mm_srai_epi16
__m128i _mm_srai_epi16(__m128i a, int count)
Definition: emmintrin.h:1374

_mm_unpackhi_epi8
__m128i _mm_unpackhi_epi8(__m128i a, __m128i b)
Definition: emmintrin.h:1779

_mm_andnot_pd
__m128d _mm_andnot_pd(__m128d a, __m128d b)
Definition: emmintrin.h:647

_mm_min_epi16
__m128i _mm_min_epi16(__m128i a, __m128i b)
Definition: emmintrin.h:1212

_mm_andnot_si128
__m128i _mm_andnot_si128(__m128i a, __m128i b)
Definition: emmintrin.h:1326

_mm_and_si128
__m128i _mm_and_si128(__m128i a, __m128i b)
Definition: emmintrin.h:1321

_mm_stream_pd
void _mm_stream_pd(double *p, __m128d a)
Definition: emmintrin.h:1706

_mm_avg_epu8
__m128i _mm_avg_epu8(__m128i a, __m128i b)
Definition: emmintrin.h:1179

_mm_adds_epi16
__m128i _mm_adds_epi16(__m128i a, __m128i b)
Definition: emmintrin.h:1152

_mm_unpackhi_epi64
__m128i _mm_unpackhi_epi64(__m128i a, __m128i b)
Definition: emmintrin.h:1810

_mm_adds_epi8
__m128i _mm_adds_epi8(__m128i a, __m128i b)
Definition: emmintrin.h:1143

_mm_unpacklo_epi16
__m128i _mm_unpacklo_epi16(__m128i a, __m128i b)
Definition: emmintrin.h:1830

_mm_cmplt_epi8
__m128i _mm_cmplt_epi8(__m128i a, __m128i b)
Definition: emmintrin.h:1459

_mm_max_epi16
__m128i _mm_max_epi16(__m128i a, __m128i b)
Definition: emmintrin.h:1194

_mm_unpacklo_epi8
__m128i _mm_unpacklo_epi8(__m128i a, __m128i b)
Definition: emmintrin.h:1819

_mm_xor_pd
__m128d _mm_xor_pd(__m128d a, __m128d b)
Definition: emmintrin.h:657

_mm_cvtps_pd
__m128d _mm_cvtps_pd(__m128 a)
Definition: emmintrin.h:851

_mm_set_pd
__m128d _mm_set_pd(double w, double x)
Definition: emmintrin.h:1038

_mm_srli_epi32
__m128i _mm_srli_epi32(__m128i a, int count)
Definition: emmintrin.h:1407

_mm_cmpgt_epi16
__m128i _mm_cmpgt_epi16(__m128i a, __m128i b)
Definition: emmintrin.h:1449

_mm_add_epi32
__m128i _mm_add_epi32(__m128i a, __m128i b)
Definition: emmintrin.h:1128

_mm_sub_epi16
__m128i _mm_sub_epi16(__m128i a, __m128i b)
Definition: emmintrin.h:1265

_mm_add_epi64
__m128i _mm_add_epi64(__m128i a, __m128i b)
Definition: emmintrin.h:1138

_mm_cmpgt_epi32
__m128i _mm_cmpgt_epi32(__m128i a, __m128i b)
Definition: emmintrin.h:1454

_mm_set1_pd
__m128d _mm_set1_pd(double w)
Definition: emmintrin.h:1033

_mm_unpacklo_epi32
__m128i _mm_unpacklo_epi32(__m128i a, __m128i b)
Definition: emmintrin.h:1840

_mm_div_pd
__m128d _mm_div_pd(__m128d a, __m128d b)
Definition: emmintrin.h:606

_mm_srl_epi16
__m128i _mm_srl_epi16(__m128i a, __m128i count)
Definition: emmintrin.h:1402

_mm_max_pd
__m128d _mm_max_pd(__m128d a, __m128d b)
Definition: emmintrin.h:637

_mm_unpacklo_pd
__m128d _mm_unpacklo_pd(__m128d a, __m128d b)
Definition: emmintrin.h:1887

_mm_subs_epu16
__m128i _mm_subs_epu16(__m128i a, __m128i b)
Definition: emmintrin.h:1312

_mm_unpacklo_epi64
__m128i _mm_unpacklo_epi64(__m128i a, __m128i b)
Definition: emmintrin.h:1850

_mm_max_epu8
__m128i _mm_max_epu8(__m128i a, __m128i b)
Definition: emmintrin.h:1203

fvec.h

count
GLuint GLuint GLsizei count
Definition: gl.h:1545

c
const GLubyte * c
Definition: glext.h:8905

b
GLboolean GLboolean GLboolean b
Definition: glext.h:6204

p
GLfloat GLfloat p
Definition: glext.h:8902

a
GLboolean GLboolean GLboolean GLboolean a
Definition: glext.h:6204

m
const GLfloat * m
Definition: glext.h:10848

i
GLsizei GLenum const GLvoid GLsizei GLenum GLbyte GLbyte GLbyte GLdouble GLdouble GLdouble GLfloat GLfloat GLfloat GLint GLint GLint GLshort GLshort GLshort GLubyte GLubyte GLubyte GLuint GLuint GLuint GLushort GLushort GLushort GLbyte GLbyte GLbyte GLbyte GLdouble GLdouble GLdouble GLdouble GLfloat GLfloat GLfloat GLfloat GLint GLint GLint GLint GLshort GLshort GLshort GLshort GLubyte GLubyte GLubyte GLubyte GLuint GLuint GLuint GLuint GLushort GLushort GLushort GLushort GLboolean const GLdouble const GLfloat const GLint const GLshort const GLbyte const GLdouble const GLfloat const GLint const GLshort const GLdouble const GLfloat const GLint const GLshort const GLdouble const GLfloat const GLint const GLshort const GLdouble const GLfloat const GLint const GLshort const GLdouble const GLdouble const GLfloat const GLfloat const GLint const GLint const GLshort const GLshort const GLdouble const GLfloat const GLint const GLshort const GLdouble const GLfloat const GLint const GLshort const GLdouble const GLfloat const GLint const GLshort const GLdouble const GLfloat const GLint const GLshort const GLdouble const GLfloat const GLint const GLshort const GLdouble const GLfloat const GLint const GLshort const GLdouble const GLfloat const GLint const GLshort GLenum GLenum GLenum GLfloat GLenum GLint GLenum GLenum GLenum GLfloat GLenum GLenum GLint GLenum GLfloat GLenum GLint GLint GLushort GLenum GLenum GLfloat GLenum GLenum GLint GLfloat const GLubyte GLenum GLenum GLenum const GLfloat GLenum GLenum const GLint GLenum GLint GLint GLsizei GLsizei GLint GLenum GLenum const GLvoid GLenum GLenum const GLfloat GLenum GLenum const GLint GLenum GLenum const GLdouble GLenum GLenum const GLfloat GLenum GLenum const GLint GLsizei GLuint GLfloat GLuint GLbitfield GLfloat GLint GLuint GLboolean GLenum GLfloat GLenum GLbitfield GLenum GLfloat GLfloat GLint GLint const GLfloat GLenum GLfloat GLfloat GLint GLint GLfloat GLfloat GLint GLint const GLfloat GLint GLfloat GLfloat GLint GLfloat GLfloat GLint GLfloat GLfloat const GLdouble const GLfloat const GLdouble const GLfloat GLint i
Definition: glfuncs.h:248

d
#define d
Definition: ke_i.h:81

s1
struct S1 s1

s2
struct S2 s2

eq
#define eq(received, expected, label, type)
Definition: locale.c:144

assert.h