d8/dcb/libm__sse2_8c_source.html

/*

 * PROJECT:     ReactOS CRT

 * LICENSE:     MIT (https://spdx.org/licenses/MIT)

 * PURPOSE:     Simplified implementation of __libm_sse2_*

 * COPYRIGHT:   Copyright 2025 Timo Kreuzer <timo.kreuzer@reactos.org>

 */


#include <emmintrin.h>

#include <math.h>


#if defined(_MSC_VER) && !defined(__clang__)

#pragma function(acos,asin,atan,atan2,cos)

#pragma function(exp,log,log10,pow,sin,tan)

#define __ATTRIBUTE_SSE2__

#else

#define __ATTRIBUTE_SSE2__ __attribute__((__target__("sse2")))

#endif


#ifdef __GNUC__

#pragma GCC diagnostic ignored "-Wuninitialized"

#endif


__ATTRIBUTE_SSE2__ __m128d __libm_sse2_acos(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = acos(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128 __libm_sse2_acosf(__m128 Xmm0)

{

    __m128d Xmm0d = _mm_cvtss_sd(Xmm0d, Xmm0);

    double x = _mm_cvtsd_f64(Xmm0d);

    double result = acos(x);

    __m128d result128 = _mm_set_sd(result);

    return _mm_cvtpd_ps(result128);

}


__ATTRIBUTE_SSE2__ __m128d __libm_sse2_asin(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = asin(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128 __libm_sse2_asinf(__m128 Xmm0)

{

    __m128d Xmm0d = _mm_cvtss_sd(Xmm0d, Xmm0);

    double x = _mm_cvtsd_f64(Xmm0d);

    double result = asin(x);

    __m128d result128 = _mm_set_sd(result);

    return _mm_cvtpd_ps(result128);

}


__ATTRIBUTE_SSE2__ __m128d __libm_sse2_atan(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = atan(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128 __libm_sse2_atanf(__m128 Xmm0)

{

    __m128d Xmm0d = _mm_cvtss_sd(Xmm0d, Xmm0);

    double x = _mm_cvtsd_f64(Xmm0d);

    double result = atan(x);

    __m128d result128 = _mm_set_sd(result);

    return _mm_cvtpd_ps(result128);

}


__ATTRIBUTE_SSE2__ __m128d __libm_sse2_atan2(__m128d Xmm0, __m128d Xmm1)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double y = _mm_cvtsd_f64(Xmm1);

    double result = atan2(x, y);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128d __libm_sse2_cos(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = cos(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128 __libm_sse2_cosf(__m128 Xmm0)

{

    __m128d Xmm0d = _mm_cvtss_sd(Xmm0d, Xmm0);

    double x = _mm_cvtsd_f64(Xmm0d);

    double result = cos(x);

    __m128d result128 = _mm_set_sd(result);

    return _mm_cvtpd_ps(result128);

}


__ATTRIBUTE_SSE2__ __m128d __libm_sse2_exp(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = exp(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128 __libm_sse2_expf(__m128 Xmm0)

{

    __m128d Xmm0d = _mm_cvtss_sd(Xmm0d, Xmm0);

    double x = _mm_cvtsd_f64(Xmm0d);

    double result = exp(x);

    __m128d result128 = _mm_set_sd(result);

    return _mm_cvtpd_ps(result128);

}


__ATTRIBUTE_SSE2__ __m128d __libm_sse2_log(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = log(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128 __libm_sse2_logf(__m128 Xmm0)

{

    __m128d Xmm0d = _mm_cvtss_sd(Xmm0d, Xmm0);

    double x = _mm_cvtsd_f64(Xmm0d);

    double result = log(x);

    __m128d result128 = _mm_set_sd(result);

    return _mm_cvtpd_ps(result128);

}


__ATTRIBUTE_SSE2__ __m128d __libm_sse2_log10(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = log10(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128 __libm_sse2_log10f(__m128 Xmm0)

{

    __m128d Xmm0d = _mm_cvtss_sd(Xmm0d, Xmm0);

    double x = _mm_cvtsd_f64(Xmm0d);

    double result = log10(x);

    __m128d result128 = _mm_set_sd(result);

    return _mm_cvtpd_ps(result128);

}


__ATTRIBUTE_SSE2__ __m128d __libm_sse2_pow(__m128d Xmm0, __m128d Xmm1)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double y = _mm_cvtsd_f64(Xmm1);

    double result = pow(x, y);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128 __libm_sse2_powf(__m128 Xmm0, __m128 Xmm1)

{

    float x = _mm_cvtss_f32(Xmm0);

    float y = _mm_cvtss_f32(Xmm1);

    float result = powf(x, y);

    return _mm_set_ss(result);

}


__ATTRIBUTE_SSE2__ __m128d __libm_sse2_sin(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = sin(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128 __libm_sse2_sinf(__m128 Xmm0)

{

    __m128d Xmm0d = _mm_cvtss_sd(Xmm0d, Xmm0);

    double x = _mm_cvtsd_f64(Xmm0d);

    double result = sin(x);

    __m128d result128 = _mm_set_sd(result);

    return _mm_cvtpd_ps(result128);

}


__ATTRIBUTE_SSE2__ __m128d __libm_sse2_tan(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = tan(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128 __libm_sse2_tanf(__m128 Xmm0)

{

    __m128d Xmm0d = _mm_cvtss_sd(Xmm0d, Xmm0);

    double x = _mm_cvtsd_f64(Xmm0d);

    double result = tan(x);

    __m128d result128 = _mm_set_sd(result);

    return _mm_cvtpd_ps(result128);

}


__ATTRIBUTE_SSE2__ __m128d _libm_sse2_acos_precise(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = acos(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128d _libm_sse2_asin_precise(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = asin(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128d _libm_sse2_atan_precise(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = atan(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128d _libm_sse2_cos_precise(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = cos(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128d _libm_sse2_exp_precise(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = exp(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128d _libm_sse2_log_precise(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = log(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128d _libm_sse2_log10_precise(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = log10(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128d _libm_sse2_pow_precise(__m128d Xmm0, __m128d Xmm1)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double y = _mm_cvtsd_f64(Xmm1);

    double result = pow(x, y);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128d _libm_sse2_sin_precise(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = sin(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128d _libm_sse2_sqrt_precise(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = sqrt(x);

    return _mm_set_sd(result);

}


__ATTRIBUTE_SSE2__ __m128d _libm_sse2_tan_precise(__m128d Xmm0)

{

    double x = _mm_cvtsd_f64(Xmm0);

    double result = tan(x);

    return _mm_set_sd(result);

}

powf
_ACRTIMP float __cdecl powf(float, float)
Definition: powf.c:14

sqrt
_ACRTIMP double __cdecl sqrt(double)
Definition: sqrt.c:5

atan
_ACRTIMP double __cdecl atan(double)
Definition: atan.c:44

sin
_ACRTIMP double __cdecl sin(double)
Definition: sin.c:21

tan
_ACRTIMP double __cdecl tan(double)
Definition: tan.c:122

asin
_ACRTIMP double __cdecl asin(double)
Definition: asin.c:31

cos
_ACRTIMP double __cdecl cos(double)
Definition: cos.c:21

atan2
_ACRTIMP double __cdecl atan2(double, double)
Definition: atan2.c:52

acos
_ACRTIMP double __cdecl acos(double)
Definition: acos.c:28

emmintrin.h

_mm_cvtpd_ps
__m128 _mm_cvtpd_ps(__m128d a)
Definition: emmintrin.h:855

_mm_set_sd
__m128d _mm_set_sd(double w)
Definition: emmintrin.h:1037

_mm_cvtss_sd
__m128d _mm_cvtss_sd(__m128d a, __m128 b)
Definition: emmintrin.h:900

_mm_cvtsd_f64
double _mm_cvtsd_f64(__m128d a)
Definition: emmintrin.h:931

log10
double log10(double x)
Definition: freeldr.c:190

pow
double pow(double x, double y)
Definition: freeldr.c:178

x
GLint GLint GLint GLint GLint x
Definition: gl.h:1548

y
GLint GLint GLint GLint GLint GLint y
Definition: gl.h:1548

result
GLuint64EXT * result
Definition: glext.h:11304

__libm_sse2_cosf
__ATTRIBUTE_SSE2__ __m128 __libm_sse2_cosf(__m128 Xmm0)
Definition: libm_sse2.c:86

_libm_sse2_cos_precise
__ATTRIBUTE_SSE2__ __m128d _libm_sse2_cos_precise(__m128d Xmm0)
Definition: libm_sse2.c:212

__libm_sse2_log10f
__ATTRIBUTE_SSE2__ __m128 __libm_sse2_log10f(__m128 Xmm0)
Definition: libm_sse2.c:134

__libm_sse2_atan
__ATTRIBUTE_SSE2__ __m128d __libm_sse2_atan(__m128d Xmm0)
Definition: libm_sse2.c:55

__libm_sse2_acos
__ATTRIBUTE_SSE2__ __m128d __libm_sse2_acos(__m128d Xmm0)
Definition: libm_sse2.c:23

_libm_sse2_log10_precise
__ATTRIBUTE_SSE2__ __m128d _libm_sse2_log10_precise(__m128d Xmm0)
Definition: libm_sse2.c:233

__libm_sse2_asin
__ATTRIBUTE_SSE2__ __m128d __libm_sse2_asin(__m128d Xmm0)
Definition: libm_sse2.c:39

__libm_sse2_asinf
__ATTRIBUTE_SSE2__ __m128 __libm_sse2_asinf(__m128 Xmm0)
Definition: libm_sse2.c:46

_libm_sse2_acos_precise
__ATTRIBUTE_SSE2__ __m128d _libm_sse2_acos_precise(__m128d Xmm0)
Definition: libm_sse2.c:191

__ATTRIBUTE_SSE2__
#define __ATTRIBUTE_SSE2__
Definition: libm_sse2.c:16

_libm_sse2_pow_precise
__ATTRIBUTE_SSE2__ __m128d _libm_sse2_pow_precise(__m128d Xmm0, __m128d Xmm1)
Definition: libm_sse2.c:240

_libm_sse2_asin_precise
__ATTRIBUTE_SSE2__ __m128d _libm_sse2_asin_precise(__m128d Xmm0)
Definition: libm_sse2.c:198

_libm_sse2_exp_precise
__ATTRIBUTE_SSE2__ __m128d _libm_sse2_exp_precise(__m128d Xmm0)
Definition: libm_sse2.c:219

_libm_sse2_sin_precise
__ATTRIBUTE_SSE2__ __m128d _libm_sse2_sin_precise(__m128d Xmm0)
Definition: libm_sse2.c:248

_libm_sse2_atan_precise
__ATTRIBUTE_SSE2__ __m128d _libm_sse2_atan_precise(__m128d Xmm0)
Definition: libm_sse2.c:205

_libm_sse2_tan_precise
__ATTRIBUTE_SSE2__ __m128d _libm_sse2_tan_precise(__m128d Xmm0)
Definition: libm_sse2.c:262

__libm_sse2_cos
__ATTRIBUTE_SSE2__ __m128d __libm_sse2_cos(__m128d Xmm0)
Definition: libm_sse2.c:79

__libm_sse2_pow
__ATTRIBUTE_SSE2__ __m128d __libm_sse2_pow(__m128d Xmm0, __m128d Xmm1)
Definition: libm_sse2.c:143

__libm_sse2_tan
__ATTRIBUTE_SSE2__ __m128d __libm_sse2_tan(__m128d Xmm0)
Definition: libm_sse2.c:175

__libm_sse2_atanf
__ATTRIBUTE_SSE2__ __m128 __libm_sse2_atanf(__m128 Xmm0)
Definition: libm_sse2.c:62

__libm_sse2_sinf
__ATTRIBUTE_SSE2__ __m128 __libm_sse2_sinf(__m128 Xmm0)
Definition: libm_sse2.c:166

__libm_sse2_expf
__ATTRIBUTE_SSE2__ __m128 __libm_sse2_expf(__m128 Xmm0)
Definition: libm_sse2.c:102

__libm_sse2_logf
__ATTRIBUTE_SSE2__ __m128 __libm_sse2_logf(__m128 Xmm0)
Definition: libm_sse2.c:118

__libm_sse2_powf
__ATTRIBUTE_SSE2__ __m128 __libm_sse2_powf(__m128 Xmm0, __m128 Xmm1)
Definition: libm_sse2.c:151

__libm_sse2_atan2
__ATTRIBUTE_SSE2__ __m128d __libm_sse2_atan2(__m128d Xmm0, __m128d Xmm1)
Definition: libm_sse2.c:71

__libm_sse2_acosf
__ATTRIBUTE_SSE2__ __m128 __libm_sse2_acosf(__m128 Xmm0)
Definition: libm_sse2.c:30

__libm_sse2_exp
__ATTRIBUTE_SSE2__ __m128d __libm_sse2_exp(__m128d Xmm0)
Definition: libm_sse2.c:95

__libm_sse2_log
__ATTRIBUTE_SSE2__ __m128d __libm_sse2_log(__m128d Xmm0)
Definition: libm_sse2.c:111

__libm_sse2_tanf
__ATTRIBUTE_SSE2__ __m128 __libm_sse2_tanf(__m128 Xmm0)
Definition: libm_sse2.c:182

_libm_sse2_log_precise
__ATTRIBUTE_SSE2__ __m128d _libm_sse2_log_precise(__m128d Xmm0)
Definition: libm_sse2.c:226

_libm_sse2_sqrt_precise
__ATTRIBUTE_SSE2__ __m128d _libm_sse2_sqrt_precise(__m128d Xmm0)
Definition: libm_sse2.c:255

__libm_sse2_log10
__ATTRIBUTE_SSE2__ __m128d __libm_sse2_log10(__m128d Xmm0)
Definition: libm_sse2.c:127

__libm_sse2_sin
__ATTRIBUTE_SSE2__ __m128d __libm_sse2_sin(__m128d Xmm0)
Definition: libm_sse2.c:159

exp
DWORD exp
Definition: msg.c:16058

log
#define log(outFile, fmt,...)
Definition: util.h:15

_mm_cvtss_f32
float _mm_cvtss_f32(__m128 a)
Definition: xmmintrin.h:921

_mm_set_ss
__m128 _mm_set_ss(float a)
Definition: xmmintrin.h:1000