x86-64: Add AVX optimized string/memory functions for RTM

Since VZEROUPPER triggers RTM abort while VZEROALL won't, select AVX optimized string/memory functions with xtest jz 1f vzeroall ret 1: vzeroupper ret at function exit on processors with usable RTM, but without 256-bit EVEX instructions to avoid VZEROUPPER inside a transactionally executing RTM region. (cherry picked from commit 7ebba91361badf7531d4e75050627a88d424872f)
author: H.J. Lu <hjl.tools@gmail.com> 2021-03-05 07:26:42 -0800
committer: H.J. Lu <hjl.tools@gmail.com> 2022-01-27 11:33:05 -0800
commit: 2a7cef79d5da8a2b3b1c4b368efb81c69c8403b9 (patch)
tree: 260eacf7020bd8302236aa7c3847ae3c5227b7d1 /sysdeps/x86_64/multiarch/memcmp-avx2-movbe.S
parent: 43e3ba09ece40ba4beb3d3c985190209ecc6a052 (diff)
download: glibc-2a7cef79d5da8a2b3b1c4b368efb81c69c8403b9.tar.gz
glibc-2a7cef79d5da8a2b3b1c4b368efb81c69c8403b9.tar.xz
glibc-2a7cef79d5da8a2b3b1c4b368efb81c69c8403b9.zip
1 files changed, 13 insertions, 15 deletions
diff --git a/sysdeps/x86_64/multiarch/memcmp-avx2-movbe.S b/sysdeps/x86_64/multiarch/memcmp-avx2-movbe.S
index 67fc575b59..87f9478eaf 100644
--- a/sysdeps/x86_64/multiarch/memcmp-avx2-movbe.S
+++ b/sysdeps/x86_64/multiarch/memcmp-avx2-movbe.S
@@ -47,6 +47,10 @@
 #  define VZEROUPPER	vzeroupper
 # endif
 
+# ifndef SECTION
+#  define SECTION(p)	p##.avx
+# endif
+
 # define VEC_SIZE 32
 # define VEC_MASK ((1 << VEC_SIZE) - 1)
 
@@ -55,7 +59,7 @@
            memcmp has to use UNSIGNED comparison for elemnts.
 */
 
-	.section .text.avx,"ax",@progbits
+	.section SECTION(.text),"ax",@progbits
 ENTRY (MEMCMP)
 # ifdef USE_AS_WMEMCMP
 	shl	$2, %RDX_LP
@@ -123,8 +127,8 @@ ENTRY (MEMCMP)
 	vptest	%ymm0, %ymm5
 	jnc	L(4x_vec_end)
 	xorl	%eax, %eax
-	VZEROUPPER
-	ret
+L(return_vzeroupper):
+	ZERO_UPPER_VEC_REGISTERS_RETURN
 
 	.p2align 4
 L(last_2x_vec):
@@ -144,8 +148,7 @@ L(last_vec):
 	vpmovmskb %ymm2, %eax
 	subl    $VEC_MASK, %eax
 	jnz	L(first_vec)
-	VZEROUPPER
-	ret
+	VZEROUPPER_RETURN
 
 	.p2align 4
 L(first_vec):
@@ -164,8 +167,7 @@ L(wmemcmp_return):
 	movzbl	(%rsi, %rcx), %edx
 	sub	%edx, %eax
 # endif
-	VZEROUPPER
-	ret
+	VZEROUPPER_RETURN
 
 # ifdef USE_AS_WMEMCMP
 	.p2align 4
@@ -367,8 +369,7 @@ L(last_4x_vec):
 	vpmovmskb %ymm2, %eax
 	subl    $VEC_MASK, %eax
 	jnz	L(first_vec)
-	VZEROUPPER
-	ret
+	VZEROUPPER_RETURN
 
 	.p2align 4
 L(4x_vec_end):
@@ -394,8 +395,7 @@ L(4x_vec_end):
 	movzbl	(VEC_SIZE * 3)(%rsi, %rcx), %edx
 	sub	%edx, %eax
 # endif
-	VZEROUPPER
-	ret
+	VZEROUPPER_RETURN
 
 	.p2align 4
 L(first_vec_x1):
@@ -410,8 +410,7 @@ L(first_vec_x1):
 	movzbl	VEC_SIZE(%rsi, %rcx), %edx
 	sub	%edx, %eax
 # endif
-	VZEROUPPER
-	ret
+	VZEROUPPER_RETURN
 
 	.p2align 4
 L(first_vec_x2):
@@ -426,7 +425,6 @@ L(first_vec_x2):
 	movzbl	(VEC_SIZE * 2)(%rsi, %rcx), %edx
 	sub	%edx, %eax
 # endif
-	VZEROUPPER
-	ret
+	VZEROUPPER_RETURN
 END (MEMCMP)
 #endif
author	H.J. Lu <hjl.tools@gmail.com>	2021-03-05 07:26:42 -0800
committer	H.J. Lu <hjl.tools@gmail.com>	2022-01-27 11:33:05 -0800
commit	2a7cef79d5da8a2b3b1c4b368efb81c69c8403b9 (patch)
tree	260eacf7020bd8302236aa7c3847ae3c5227b7d1 /sysdeps/x86_64/multiarch/memcmp-avx2-movbe.S
parent	43e3ba09ece40ba4beb3d3c985190209ecc6a052 (diff)
download	glibc-2a7cef79d5da8a2b3b1c4b368efb81c69c8403b9.tar.gz glibc-2a7cef79d5da8a2b3b1c4b368efb81c69c8403b9.tar.xz glibc-2a7cef79d5da8a2b3b1c4b368efb81c69c8403b9.zip