x86-64: Optimize memrchr with AVX2

Optimize memrchr with AVX2 to search 32 bytes with a single vector compare instruction. It is as fast as SSE2 memrchr for small data sizes and up to 1X faster for large data sizes on Haswell. Select AVX2 memrchr on AVX2 machines where vzeroupper is preferred and AVX unaligned load is fast. * sysdeps/x86_64/multiarch/Makefile (sysdep_routines): Add memrchr-sse2 and memrchr-avx2. * sysdeps/x86_64/multiarch/ifunc-impl-list.c (__libc_ifunc_impl_list): Add tests for __memrchr_avx2 and __memrchr_sse2. * sysdeps/x86_64/multiarch/memrchr-avx2.S: New file. * sysdeps/x86_64/multiarch/memrchr-sse2.S: Likewise. * sysdeps/x86_64/multiarch/memrchr.c: Likewise.
author: H.J. Lu <hjl.tools@gmail.com> 2017-06-09 05:44:30 -0700
committer: H.J. Lu <hjl.tools@gmail.com> 2017-06-09 05:44:41 -0700
commit: 5ac7aa1d7cce8580f8225c33c819991abca102b9 (patch)
tree: a03a58010d692384042b6430b288e8197d77f1b4 /sysdeps/x86_64/multiarch/Makefile
parent: 8fe57365bfb5a417d911ab715a5671b3b1d7b155 (diff)
download: glibc-5ac7aa1d7cce8580f8225c33c819991abca102b9.tar.gz
glibc-5ac7aa1d7cce8580f8225c33c819991abca102b9.tar.xz
glibc-5ac7aa1d7cce8580f8225c33c819991abca102b9.zip
1 files changed, 1 insertions, 0 deletions
diff --git a/sysdeps/x86_64/multiarch/Makefile b/sysdeps/x86_64/multiarch/Makefile
index 4523f51095..2fa390b3dd 100644
--- a/sysdeps/x86_64/multiarch/Makefile
+++ b/sysdeps/x86_64/multiarch/Makefile
@@ -7,6 +7,7 @@ ifeq ($(subdir),string)
 sysdep_routines += strncat-c stpncpy-c strncpy-c strcmp-ssse3 \
 		   strcmp-sse2-unaligned strncmp-ssse3 \
 		   memchr-sse2 rawmemchr-sse2 memchr-avx2 rawmemchr-avx2 \
+		   memrchr-sse2 memrchr-avx2 \
 		   memcmp-avx2-movbe \
 		   memcmp-sse4 memcpy-ssse3 \
 		   memmove-ssse3 \
author	H.J. Lu <hjl.tools@gmail.com>	2017-06-09 05:44:30 -0700
committer	H.J. Lu <hjl.tools@gmail.com>	2017-06-09 05:44:41 -0700
commit	5ac7aa1d7cce8580f8225c33c819991abca102b9 (patch)
tree	a03a58010d692384042b6430b288e8197d77f1b4 /sysdeps/x86_64/multiarch/Makefile
parent	8fe57365bfb5a417d911ab715a5671b3b1d7b155 (diff)
download	glibc-5ac7aa1d7cce8580f8225c33c819991abca102b9.tar.gz glibc-5ac7aa1d7cce8580f8225c33c819991abca102b9.tar.xz glibc-5ac7aa1d7cce8580f8225c33c819991abca102b9.zip