aarch64: Add vector implementations of exp routines

Optimised implementations for single and double precision, Advanced SIMD and SVE, copied from Arm Optimized Routines. As previously, data tables are used via a barrier to prevent overly aggressive constant inlining. Special-case handlers are marked NOINLINE to avoid incurring the penalty of switching call standards unnecessarily. Reviewed-by: Szabolcs Nagy <szabolcs.nagy@arm.com>
author: Joe Ramsay <Joe.Ramsay@arm.com> 2023-06-28 12:19:39 +0100
committer: Szabolcs Nagy <szabolcs.nagy@arm.com> 2023-06-30 09:04:26 +0100
commit: 4a9392ffc27ad280f84779eea3ba01f2c134d1d8 (patch)
tree: 8716efd89aadc70338eeff9622cfcbdd7ff7911e /sysdeps/aarch64/fpu/bits
parent: 78c01a5cbeb6717ffa2d4d66bb90ac5c39bd81a9 (diff)
download: glibc-4a9392ffc27ad280f84779eea3ba01f2c134d1d8.tar.gz
glibc-4a9392ffc27ad280f84779eea3ba01f2c134d1d8.tar.xz
glibc-4a9392ffc27ad280f84779eea3ba01f2c134d1d8.zip
1 files changed, 4 insertions, 0 deletions
diff --git a/sysdeps/aarch64/fpu/bits/math-vector.h b/sysdeps/aarch64/fpu/bits/math-vector.h
index 70c737338e..7c200599c1 100644
--- a/sysdeps/aarch64/fpu/bits/math-vector.h
+++ b/sysdeps/aarch64/fpu/bits/math-vector.h
@@ -50,10 +50,12 @@ typedef __SVBool_t __sv_bool_t;
 #  define __vpcs __attribute__ ((__aarch64_vector_pcs__))
 
 __vpcs __f32x4_t _ZGVnN4v_cosf (__f32x4_t);
+__vpcs __f32x4_t _ZGVnN4v_expf (__f32x4_t);
 __vpcs __f32x4_t _ZGVnN4v_logf (__f32x4_t);
 __vpcs __f32x4_t _ZGVnN4v_sinf (__f32x4_t);
 
 __vpcs __f64x2_t _ZGVnN2v_cos (__f64x2_t);
+__vpcs __f64x2_t _ZGVnN2v_exp (__f64x2_t);
 __vpcs __f64x2_t _ZGVnN2v_log (__f64x2_t);
 __vpcs __f64x2_t _ZGVnN2v_sin (__f64x2_t);
 
@@ -63,10 +65,12 @@ __vpcs __f64x2_t _ZGVnN2v_sin (__f64x2_t);
 #ifdef __SVE_VEC_MATH_SUPPORTED
 
 __sv_f32_t _ZGVsMxv_cosf (__sv_f32_t, __sv_bool_t);
+__sv_f32_t _ZGVsMxv_expf (__sv_f32_t, __sv_bool_t);
 __sv_f32_t _ZGVsMxv_logf (__sv_f32_t, __sv_bool_t);
 __sv_f32_t _ZGVsMxv_sinf (__sv_f32_t, __sv_bool_t);
 
 __sv_f64_t _ZGVsMxv_cos (__sv_f64_t, __sv_bool_t);
+__sv_f64_t _ZGVsMxv_exp (__sv_f64_t, __sv_bool_t);
 __sv_f64_t _ZGVsMxv_log (__sv_f64_t, __sv_bool_t);
 __sv_f64_t _ZGVsMxv_sin (__sv_f64_t, __sv_bool_t);
author	Joe Ramsay <Joe.Ramsay@arm.com>	2023-06-28 12:19:39 +0100
committer	Szabolcs Nagy <szabolcs.nagy@arm.com>	2023-06-30 09:04:26 +0100
commit	4a9392ffc27ad280f84779eea3ba01f2c134d1d8 (patch)
tree	8716efd89aadc70338eeff9622cfcbdd7ff7911e /sysdeps/aarch64/fpu/bits
parent	78c01a5cbeb6717ffa2d4d66bb90ac5c39bd81a9 (diff)
download	glibc-4a9392ffc27ad280f84779eea3ba01f2c134d1d8.tar.gz glibc-4a9392ffc27ad280f84779eea3ba01f2c134d1d8.tar.xz glibc-4a9392ffc27ad280f84779eea3ba01f2c134d1d8.zip