]> git.proxmox.com Git - wasi-libc.git/commitdiff
Update to musl 1.1.23.
authorDan Gohman <sunfish@mozilla.com>
Fri, 19 Jul 2019 19:40:16 +0000 (12:40 -0700)
committerDan Gohman <sunfish@mozilla.com>
Thu, 8 Aug 2019 00:53:41 +0000 (17:53 -0700)
See the WHATSNEW file for details; among other things, this contains new
math library implementation for log/exp/pow.

255 files changed:
expected/wasm32-wasi/defined-symbols.txt
expected/wasm32-wasi/predefined-macros.txt
libc-top-half/README.md
libc-top-half/musl/COPYRIGHT
libc-top-half/musl/INSTALL
libc-top-half/musl/VERSION
libc-top-half/musl/WHATSNEW
libc-top-half/musl/arch/aarch64/bits/syscall.h.in
libc-top-half/musl/arch/aarch64/fp_arch.h [new file with mode: 0644]
libc-top-half/musl/arch/arm/atomic_arch.h
libc-top-half/musl/arch/arm/bits/syscall.h.in
libc-top-half/musl/arch/generic/fp_arch.h [new file with mode: 0644]
libc-top-half/musl/arch/i386/bits/syscall.h.in
libc-top-half/musl/arch/i386/syscall_arch.h
libc-top-half/musl/arch/m68k/bits/syscall.h.in
libc-top-half/musl/arch/microblaze/bits/syscall.h.in
libc-top-half/musl/arch/microblaze/syscall_arch.h
libc-top-half/musl/arch/mips/bits/syscall.h.in
libc-top-half/musl/arch/mips/bits/termios.h
libc-top-half/musl/arch/mips/syscall_arch.h
libc-top-half/musl/arch/mips64/bits/syscall.h.in
libc-top-half/musl/arch/mips64/bits/termios.h
libc-top-half/musl/arch/mips64/syscall_arch.h
libc-top-half/musl/arch/mipsn32/bits/syscall.h.in
libc-top-half/musl/arch/mipsn32/bits/termios.h
libc-top-half/musl/arch/mipsn32/syscall_arch.h
libc-top-half/musl/arch/or1k/bits/syscall.h.in
libc-top-half/musl/arch/or1k/syscall_arch.h
libc-top-half/musl/arch/powerpc/bits/syscall.h.in
libc-top-half/musl/arch/powerpc/bits/termios.h
libc-top-half/musl/arch/powerpc/syscall_arch.h
libc-top-half/musl/arch/powerpc64/bits/signal.h
libc-top-half/musl/arch/powerpc64/bits/syscall.h.in
libc-top-half/musl/arch/powerpc64/bits/termios.h
libc-top-half/musl/arch/riscv64/atomic_arch.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/alltypes.h.in [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/endian.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/fcntl.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/fenv.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/float.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/ipc.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/limits.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/msg.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/posix.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/reg.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/sem.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/setjmp.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/shm.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/signal.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/socket.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/stat.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/stdint.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/syscall.h.in [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/bits/user.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/crt_arch.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/pthread_arch.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/reloc.h [new file with mode: 0644]
libc-top-half/musl/arch/riscv64/syscall_arch.h [new file with mode: 0644]
libc-top-half/musl/arch/s390x/bits/socket.h
libc-top-half/musl/arch/s390x/bits/syscall.h.in
libc-top-half/musl/arch/sh/bits/syscall.h.in
libc-top-half/musl/arch/wasm32/fp_arch.h [new file with mode: 0644]
libc-top-half/musl/arch/x32/bits/syscall.h.in
libc-top-half/musl/arch/x86_64/bits/syscall.h.in
libc-top-half/musl/configure
libc-top-half/musl/crt/crt1.c
libc-top-half/musl/crt/rcrt1.c
libc-top-half/musl/include/elf.h
libc-top-half/musl/include/fcntl.h
libc-top-half/musl/include/math.h
libc-top-half/musl/include/netinet/in.h
libc-top-half/musl/include/sys/fanotify.h
libc-top-half/musl/include/sys/prctl.h
libc-top-half/musl/include/sys/socket.h
libc-top-half/musl/include/sys/types.h
libc-top-half/musl/ldso/dynlink.c
libc-top-half/musl/src/aio/lio_listio.c
libc-top-half/musl/src/complex/__cexp.c
libc-top-half/musl/src/complex/__cexpf.c
libc-top-half/musl/src/complex/cabs.c
libc-top-half/musl/src/complex/cabsf.c
libc-top-half/musl/src/complex/cabsl.c
libc-top-half/musl/src/complex/cacos.c
libc-top-half/musl/src/complex/cacosf.c
libc-top-half/musl/src/complex/cacosh.c
libc-top-half/musl/src/complex/cacoshf.c
libc-top-half/musl/src/complex/cacoshl.c
libc-top-half/musl/src/complex/cacosl.c
libc-top-half/musl/src/complex/carg.c
libc-top-half/musl/src/complex/cargf.c
libc-top-half/musl/src/complex/cargl.c
libc-top-half/musl/src/complex/casin.c
libc-top-half/musl/src/complex/casinf.c
libc-top-half/musl/src/complex/casinh.c
libc-top-half/musl/src/complex/casinhf.c
libc-top-half/musl/src/complex/casinhl.c
libc-top-half/musl/src/complex/casinl.c
libc-top-half/musl/src/complex/catan.c
libc-top-half/musl/src/complex/catanf.c
libc-top-half/musl/src/complex/catanh.c
libc-top-half/musl/src/complex/catanhf.c
libc-top-half/musl/src/complex/catanhl.c
libc-top-half/musl/src/complex/catanl.c
libc-top-half/musl/src/complex/ccos.c
libc-top-half/musl/src/complex/ccosf.c
libc-top-half/musl/src/complex/ccosh.c
libc-top-half/musl/src/complex/ccoshf.c
libc-top-half/musl/src/complex/ccoshl.c
libc-top-half/musl/src/complex/ccosl.c
libc-top-half/musl/src/complex/cexp.c
libc-top-half/musl/src/complex/cexpf.c
libc-top-half/musl/src/complex/cexpl.c
libc-top-half/musl/src/complex/cimag.c
libc-top-half/musl/src/complex/cimagf.c
libc-top-half/musl/src/complex/cimagl.c
libc-top-half/musl/src/complex/clog.c
libc-top-half/musl/src/complex/clogf.c
libc-top-half/musl/src/complex/clogl.c
libc-top-half/musl/src/complex/conj.c
libc-top-half/musl/src/complex/conjf.c
libc-top-half/musl/src/complex/conjl.c
libc-top-half/musl/src/complex/cpow.c
libc-top-half/musl/src/complex/cpowf.c
libc-top-half/musl/src/complex/cpowl.c
libc-top-half/musl/src/complex/cproj.c
libc-top-half/musl/src/complex/cprojf.c
libc-top-half/musl/src/complex/cprojl.c
libc-top-half/musl/src/complex/csin.c
libc-top-half/musl/src/complex/csinf.c
libc-top-half/musl/src/complex/csinh.c
libc-top-half/musl/src/complex/csinhf.c
libc-top-half/musl/src/complex/csinhl.c
libc-top-half/musl/src/complex/csinl.c
libc-top-half/musl/src/complex/csqrt.c
libc-top-half/musl/src/complex/csqrtf.c
libc-top-half/musl/src/complex/csqrtl.c
libc-top-half/musl/src/complex/ctan.c
libc-top-half/musl/src/complex/ctanf.c
libc-top-half/musl/src/complex/ctanh.c
libc-top-half/musl/src/complex/ctanhf.c
libc-top-half/musl/src/complex/ctanhl.c
libc-top-half/musl/src/complex/ctanl.c
libc-top-half/musl/src/env/__init_tls.c
libc-top-half/musl/src/env/__libc_start_main.c
libc-top-half/musl/src/fenv/riscv64/fenv-sf.c [new file with mode: 0644]
libc-top-half/musl/src/fenv/riscv64/fenv.S [new file with mode: 0644]
libc-top-half/musl/src/include/errno.h
libc-top-half/musl/src/internal/aarch64/syscall.s [deleted file]
libc-top-half/musl/src/internal/arm/syscall.s [deleted file]
libc-top-half/musl/src/internal/complex_impl.h [new file with mode: 0644]
libc-top-half/musl/src/internal/defsysinfo.c [new file with mode: 0644]
libc-top-half/musl/src/internal/dynlink.h
libc-top-half/musl/src/internal/i386/defsysinfo.s [new file with mode: 0644]
libc-top-half/musl/src/internal/i386/syscall.s [deleted file]
libc-top-half/musl/src/internal/libc.c
libc-top-half/musl/src/internal/libm.h
libc-top-half/musl/src/internal/m68k/syscall.s [deleted file]
libc-top-half/musl/src/internal/microblaze/syscall.s [deleted file]
libc-top-half/musl/src/internal/mips/syscall.s [deleted file]
libc-top-half/musl/src/internal/mips64/syscall.s [deleted file]
libc-top-half/musl/src/internal/mipsn32/syscall.s [deleted file]
libc-top-half/musl/src/internal/or1k/syscall.s [deleted file]
libc-top-half/musl/src/internal/powerpc/syscall.s [deleted file]
libc-top-half/musl/src/internal/powerpc64/syscall.s [deleted file]
libc-top-half/musl/src/internal/s390x/syscall.s [deleted file]
libc-top-half/musl/src/internal/sh/syscall.s [deleted file]
libc-top-half/musl/src/internal/syscall.c [deleted file]
libc-top-half/musl/src/internal/syscall.h
libc-top-half/musl/src/internal/x32/syscall.s [deleted file]
libc-top-half/musl/src/internal/x86_64/syscall.s [deleted file]
libc-top-half/musl/src/ipc/msgctl.c
libc-top-half/musl/src/ipc/msgget.c
libc-top-half/musl/src/ipc/msgrcv.c
libc-top-half/musl/src/ipc/msgsnd.c
libc-top-half/musl/src/ipc/semctl.c
libc-top-half/musl/src/ipc/semget.c
libc-top-half/musl/src/ipc/semop.c
libc-top-half/musl/src/ipc/semtimedop.c
libc-top-half/musl/src/ipc/shmat.c
libc-top-half/musl/src/ipc/shmctl.c
libc-top-half/musl/src/ipc/shmdt.c
libc-top-half/musl/src/ipc/shmget.c
libc-top-half/musl/src/ldso/aarch64/tlsdesc.s
libc-top-half/musl/src/ldso/powerpc/dlsym.s
libc-top-half/musl/src/ldso/powerpc64/dlsym.s
libc-top-half/musl/src/ldso/riscv64/dlsym.s [new file with mode: 0644]
libc-top-half/musl/src/linux/cache.c
libc-top-half/musl/src/linux/getdents.c
libc-top-half/musl/src/math/__math_divzero.c [new file with mode: 0644]
libc-top-half/musl/src/math/__math_divzerof.c [new file with mode: 0644]
libc-top-half/musl/src/math/__math_invalid.c [new file with mode: 0644]
libc-top-half/musl/src/math/__math_invalidf.c [new file with mode: 0644]
libc-top-half/musl/src/math/__math_oflow.c [new file with mode: 0644]
libc-top-half/musl/src/math/__math_oflowf.c [new file with mode: 0644]
libc-top-half/musl/src/math/__math_uflow.c [new file with mode: 0644]
libc-top-half/musl/src/math/__math_uflowf.c [new file with mode: 0644]
libc-top-half/musl/src/math/__math_xflow.c [new file with mode: 0644]
libc-top-half/musl/src/math/__math_xflowf.c [new file with mode: 0644]
libc-top-half/musl/src/math/exp.c
libc-top-half/musl/src/math/exp2.c
libc-top-half/musl/src/math/exp2f.c
libc-top-half/musl/src/math/exp2f_data.c [new file with mode: 0644]
libc-top-half/musl/src/math/exp2f_data.h [new file with mode: 0644]
libc-top-half/musl/src/math/exp_data.c [new file with mode: 0644]
libc-top-half/musl/src/math/exp_data.h [new file with mode: 0644]
libc-top-half/musl/src/math/expf.c
libc-top-half/musl/src/math/log.c
libc-top-half/musl/src/math/log2.c
libc-top-half/musl/src/math/log2_data.c [new file with mode: 0644]
libc-top-half/musl/src/math/log2_data.h [new file with mode: 0644]
libc-top-half/musl/src/math/log2f.c
libc-top-half/musl/src/math/log2f_data.c [new file with mode: 0644]
libc-top-half/musl/src/math/log2f_data.h [new file with mode: 0644]
libc-top-half/musl/src/math/log_data.c [new file with mode: 0644]
libc-top-half/musl/src/math/log_data.h [new file with mode: 0644]
libc-top-half/musl/src/math/logf.c
libc-top-half/musl/src/math/logf_data.c [new file with mode: 0644]
libc-top-half/musl/src/math/logf_data.h [new file with mode: 0644]
libc-top-half/musl/src/math/pow.c
libc-top-half/musl/src/math/pow_data.c [new file with mode: 0644]
libc-top-half/musl/src/math/pow_data.h [new file with mode: 0644]
libc-top-half/musl/src/math/powf.c
libc-top-half/musl/src/math/powf_data.c [new file with mode: 0644]
libc-top-half/musl/src/math/powf_data.h [new file with mode: 0644]
libc-top-half/musl/src/math/riscv64/copysign.c [new file with mode: 0644]
libc-top-half/musl/src/math/riscv64/copysignf.c [new file with mode: 0644]
libc-top-half/musl/src/math/riscv64/fabs.c [new file with mode: 0644]
libc-top-half/musl/src/math/riscv64/fabsf.c [new file with mode: 0644]
libc-top-half/musl/src/math/riscv64/fma.c [new file with mode: 0644]
libc-top-half/musl/src/math/riscv64/fmaf.c [new file with mode: 0644]
libc-top-half/musl/src/math/riscv64/fmax.c [new file with mode: 0644]
libc-top-half/musl/src/math/riscv64/fmaxf.c [new file with mode: 0644]
libc-top-half/musl/src/math/riscv64/fmin.c [new file with mode: 0644]
libc-top-half/musl/src/math/riscv64/fminf.c [new file with mode: 0644]
libc-top-half/musl/src/math/riscv64/sqrt.c [new file with mode: 0644]
libc-top-half/musl/src/math/riscv64/sqrtf.c [new file with mode: 0644]
libc-top-half/musl/src/passwd/putgrent.c
libc-top-half/musl/src/passwd/putpwent.c
libc-top-half/musl/src/process/fork.c
libc-top-half/musl/src/process/posix_spawn.c
libc-top-half/musl/src/setjmp/riscv64/longjmp.S [new file with mode: 0644]
libc-top-half/musl/src/setjmp/riscv64/setjmp.S [new file with mode: 0644]
libc-top-half/musl/src/signal/riscv64/restore.s [new file with mode: 0644]
libc-top-half/musl/src/signal/riscv64/sigsetjmp.s [new file with mode: 0644]
libc-top-half/musl/src/signal/sigaltstack.c
libc-top-half/musl/src/signal/sigset.c
libc-top-half/musl/src/stdio/fgetwc.c
libc-top-half/musl/src/stdio/fmemopen.c
libc-top-half/musl/src/thread/__syscall_cp.c
libc-top-half/musl/src/thread/pthread_create.c
libc-top-half/musl/src/thread/riscv64/__set_thread_area.s [new file with mode: 0644]
libc-top-half/musl/src/thread/riscv64/__unmapself.s [new file with mode: 0644]
libc-top-half/musl/src/thread/riscv64/clone.s [new file with mode: 0644]
libc-top-half/musl/src/thread/riscv64/syscall_cp.s [new file with mode: 0644]
libc-top-half/musl/src/unistd/ualarm.c

index ef518849e49d9e601dd4d15dcd925f288e318a28..050b55427b2e8eadc68623672cf384ba9951a83b 100644 (file)
@@ -41,6 +41,8 @@ __env_rm_add
 __env_rm_add
 __env_rm_add
 __environ
+__exp2f_data
+__exp_data
 __expo2
 __expo2f
 __fbufsize
@@ -134,6 +136,20 @@ __lgammal_r
 __libc
 __loc_is_allocated
 __localtime_r
+__log2_data
+__log2f_data
+__log_data
+__logf_data
+__math_divzero
+__math_divzerof
+__math_invalid
+__math_invalidf
+__math_oflow
+__math_oflowf
+__math_uflow
+__math_uflowf
+__math_xflow
+__math_xflowf
 __memrchr
 __mo_lookup
 __month_to_secs
@@ -152,6 +168,8 @@ __pio2_lo
 __pleval
 __polevll
 __posix_getopt
+__pow_log_data
+__powf_log2_data
 __prepare_for_exit
 __progname
 __progname_full
index 0198f97ad7df64483560f9a4b3144ee9d925b2f5..1d6ea06f8fe10b58d15e465d64caf8d926e327bf 100644 (file)
 #define INADDRSZ NS_INADDRSZ
 #define INADDR_ALLHOSTS_GROUP ((in_addr_t) 0xe0000001)
 #define INADDR_ALLRTRS_GROUP ((in_addr_t) 0xe0000002)
+#define INADDR_ALLSNOOPERS_GROUP ((in_addr_t) 0xe000006a)
 #define INADDR_ANY ((in_addr_t) 0x00000000)
 #define INADDR_BROADCAST ((in_addr_t) 0xffffffff)
 #define INADDR_LOOPBACK ((in_addr_t) 0x7f000001)
 #define IPV6_RECVRTHDR 56
 #define IPV6_RECVTCLASS 66
 #define IPV6_ROUTER_ALERT 22
+#define IPV6_ROUTER_ALERT_ISOLATE 30
 #define IPV6_RTHDR 57
 #define IPV6_RTHDRDSTOPTS 55
 #define IPV6_RTHDR_LOOSE 0
index 0788799545083168bdfe9bae8de7d265161dc03c..1de0584519d3132f101877ad15d6b2c1643f3f36 100644 (file)
@@ -1,5 +1,5 @@
 Code in the musl directory is based on musl revision
-e97681d6f2c44bf5fa9ecdd30607cb63c780062e, which is v1.1.22, from
+b07d45eb01e900f0176894fdedab62285f5cb8be, which is v1.1.23, from
 git://git.musl-libc.org/musl.
 
 Whole files which are unused are omitted. Changes to upstream code are wrapped
index b8a76045f0f86357e40f9a9cf324eef5fcdafb42..2525ffb540e49c6c85356ef480bf895ba03cb032 100644 (file)
@@ -1,7 +1,7 @@
 musl as a whole is licensed under the following standard MIT license:
 
 ----------------------------------------------------------------------
-Copyright Â© 2005-2014 Rich Felker, et al.
+Copyright Â© 2005-2019 Rich Felker, et al.
 
 Permission is hereby granted, free of charge, to any person obtaining
 a copy of this software and associated documentation files (the
@@ -27,11 +27,15 @@ Authors/contributors include:
 
 A. Wilcox
 Alex Dowad
+Alex Suykov
 Alexander Monakov
+Andre McCurdy
 Andrew Kelley
 Anthony G. Basile
+Aric Belsito
 Arvid Picciani
 Bartosz Brachaczek
+Benjamin Peterson
 Bobby Bingham
 Boris Brezillon
 Brent Cook
@@ -40,11 +44,14 @@ Clément Vasseur
 Daniel Micay
 Daniel Sabogal
 Daurnimator
+David Carlier
 David Edelsohn
 Denys Vlasenko
 Dmitry Ivanov
 Dmitry V. Levin
+Drew DeVault
 Emil Renner Berthing
+Fangrui Song
 Felix Fietkau
 Felix Janda
 Gianluca Anzolin
@@ -61,6 +68,7 @@ John Spencer
 Josiah Worcester
 Julien Ramseier
 Justin Cormack
+Kaarle Ritvanen
 Khem Raj
 Kylie McClain
 Leah Neukirchen
@@ -68,28 +76,35 @@ Luca Barbato
 Luka Perkov
 M Farkas-Dyck (Strake)
 Mahesh Bodapati
+Markus Wichmann
 Masanori Ogino
+Michael Clark
 Michael Forney
 Mikhail Kremnyov
 Natanael Copa
 Nicholas J. Kain
 orc
 Pascal Cuoq
+Patrick Oppenlander
 Petr Hosek
 Petr Skocik
 Pierre Carrier
 Reini Urban
 Rich Felker
 Richard Pennington
+Ryan Fairfax
 Samuel Holland
+Segev Finer
 Shiz
 sin
 Solar Designer
 Stefan Kristiansson
+Stefan O'Rear
 Szabolcs Nagy
 Timo Teräs
 Trutz Behn
 Valentin Ochs
+Will Dietz
 William Haddon
 William Pitcock
 
index a2a142bfb7b0af817e8c6f463c0c42fa2ab1613b..322ee9766251dd9cfdd02735cf592ee5db1a8084 100644 (file)
@@ -63,7 +63,7 @@ and ABI combinations:
       is required
 
 * MIPS64
-    * ABI is n64 (LP64)
+    * ABI is n64 (LP64) or n32 (ILP32)
     * Big-endian default; little-endian variants also supported
     * Default ABI variant uses FPU registers; alternate soft-float ABI
       that does not use FPU registers or instructions is available
@@ -96,6 +96,11 @@ and ABI combinations:
 
 * OpenRISC 1000 (or1k)
 
+* RISC-V 64
+    * Little endian
+    * Hard, soft, and hard-single/soft-double floating point ABIs
+    * Standard ELF; no shared-text NOMMU support
+
 
 
 Build and Installation Procedure
index c442f5e77fe87952bb51a958f830f9308419804e..32ffe1201e74072c00a43c47ad97d9adf9538c58 100644 (file)
@@ -1 +1 @@
-1.1.22
+1.1.23
index 147229e4911b4ca64b468a05657369f458f8de36..b46e9ae15841a633f53f50fe66d9738654b4f338 100644 (file)
@@ -2077,3 +2077,41 @@ bugs fixed:
 
 arch-specfic bugs fixed:
 - s390x had wrong values for POSIX_FADV_DONTNEED/_NOREUSE
+
+
+
+1.1.23 release notes
+
+new features:
+- riscv64 port
+- configure now allows customizing AR and RANLIB vars
+- header-level support for new linux features in 5.1
+
+major internal changes:
+- removed extern __syscall; syscall header code is now fully self-contained
+
+performance:
+- new math library implementation for log/exp/pow
+- aarch64 dynamic tlsdesc function is streamlined
+
+compatibility & conformance:
+- O_TTY_INIT is now defined
+- sys/types.h no longer pollutes namespace with sys/sysmacros.h in any profile
+- powerpc asm is now compatible with clang internal assembler
+
+changes for new POSIX interpretations:
+- fgetwc now sets stream error indicator on encoding errors
+- fmemopen no longer rejects 0 size
+
+bugs fixed:
+- static TLS for shared libraries was allocated wrong on "Variant I" archs
+- crash in dladdr reading through uninitialized pointer on non-match
+- sigaltstack wrongly errored out on invalid ss_size when doing SS_DISABLE
+- getdents function misbehaved with buffer length larger than INT_MAX
+- set*id could deadlock after fork from multithreaded process
+
+arch-specfic bugs fixed:
+- s390x SO_PEERSEC definition was wrong
+- passing of 64-bit syscall arguments was broken on microblaze
+- posix_fadvise was broken on mips due to missing 7-arg syscall support
+- vrregset_t layout and member naming was wrong on powerpc64
index 4db851629be93fb0d8c822cf1d453bbea60731a3..eed5a612c08f794e45c2a6d1b9159eb2e48e664b 100644 (file)
 #define __NR_io_pgetevents 292
 #define __NR_rseq 293
 #define __NR_kexec_file_load 294
+#define __NR_pidfd_send_signal 424
+#define __NR_io_uring_setup 425
+#define __NR_io_uring_enter 426
+#define __NR_io_uring_register 427
 
diff --git a/libc-top-half/musl/arch/aarch64/fp_arch.h b/libc-top-half/musl/arch/aarch64/fp_arch.h
new file mode 100644 (file)
index 0000000..f3d445b
--- /dev/null
@@ -0,0 +1,25 @@
+#define fp_barrierf fp_barrierf
+static inline float fp_barrierf(float x)
+{
+       __asm__ __volatile__ ("" : "+w"(x));
+       return x;
+}
+
+#define fp_barrier fp_barrier
+static inline double fp_barrier(double x)
+{
+       __asm__ __volatile__ ("" : "+w"(x));
+       return x;
+}
+
+#define fp_force_evalf fp_force_evalf
+static inline void fp_force_evalf(float x)
+{
+       __asm__ __volatile__ ("" : "+w"(x));
+}
+
+#define fp_force_eval fp_force_eval
+static inline void fp_force_eval(double x)
+{
+       __asm__ __volatile__ ("" : "+w"(x));
+}
index e427836a64efa931b1e5fd2036dd8da18d497c1a..9e3937cc0f84d4116df3269063f66d9d959a24ae 100644 (file)
@@ -83,7 +83,7 @@ static inline void a_crash()
                : : : "memory");
 }
 
-#if __ARM_ARCH >= 5
+#if __ARM_ARCH >= 5 && (!__thumb__ || __thumb2__)
 
 #define a_clz_32 a_clz_32
 static inline int a_clz_32(uint32_t x)
index 1787099de24ee4ed87ee8afc6c94d2cc19a77378..8ce1d70a4ae9c6b5bcd29e5a0af9235c9cf855d1 100644 (file)
 #define __NR_statx     397
 #define __NR_rseq      398
 #define __NR_io_pgetevents     399
+#define __NR_migrate_pages     400
+#define __NR_kexec_file_load   401
+#define __NR_clock_gettime64   403
+#define __NR_clock_settime64   404
+#define __NR_clock_adjtime64   405
+#define __NR_clock_getres_time64       406
+#define __NR_clock_nanosleep_time64    407
+#define __NR_timer_gettime64   408
+#define __NR_timer_settime64   409
+#define __NR_timerfd_gettime64 410
+#define __NR_timerfd_settime64 411
+#define __NR_utimensat_time64  412
+#define __NR_pselect6_time64   413
+#define __NR_ppoll_time64      414
+#define __NR_io_pgetevents_time64      416
+#define __NR_recvmmsg_time64   417
+#define __NR_mq_timedsend_time64       418
+#define __NR_mq_timedreceive_time64    419
+#define __NR_semtimedop_time64 420
+#define __NR_rt_sigtimedwait_time64    421
+#define __NR_futex_time64      422
+#define __NR_sched_rr_get_interval_time64      423
+#define __NR_pidfd_send_signal 424
+#define __NR_io_uring_setup    425
+#define __NR_io_uring_enter    426
+#define __NR_io_uring_register 427
 
 #define __ARM_NR_breakpoint    0x0f0001
 #define __ARM_NR_cacheflush    0x0f0002
diff --git a/libc-top-half/musl/arch/generic/fp_arch.h b/libc-top-half/musl/arch/generic/fp_arch.h
new file mode 100644 (file)
index 0000000..e69de29
index 47f4ae0318c41b10b2ae881b876ef8bcf0ecd2a8..fdfdc7108bc4f30dffa4d5f4a8a7b2fb1fa8dcad 100644 (file)
 #define __NR_arch_prctl                384
 #define __NR_io_pgetevents     385
 #define __NR_rseq              386
+#define __NR_semget            393
+#define __NR_semctl            394
+#define __NR_shmget            395
+#define __NR_shmctl            396
+#define __NR_shmat             397
+#define __NR_shmdt             398
+#define __NR_msgget            399
+#define __NR_msgsnd            400
+#define __NR_msgrcv            401
+#define __NR_msgctl            402
+#define __NR_clock_gettime64   403
+#define __NR_clock_settime64   404
+#define __NR_clock_adjtime64   405
+#define __NR_clock_getres_time64 406
+#define __NR_clock_nanosleep_time64 407
+#define __NR_timer_gettime64   408
+#define __NR_timer_settime64   409
+#define __NR_timerfd_gettime64 410
+#define __NR_timerfd_settime64 411
+#define __NR_utimensat_time64  412
+#define __NR_pselect6_time64   413
+#define __NR_ppoll_time64      414
+#define __NR_io_pgetevents_time64 416
+#define __NR_recvmmsg_time64   417
+#define __NR_mq_timedsend_time64 418
+#define __NR_mq_timedreceive_time64 419
+#define __NR_semtimedop_time64 420
+#define __NR_rt_sigtimedwait_time64 421
+#define __NR_futex_time64      422
+#define __NR_sched_rr_get_interval_time64 423
+#define __NR_pidfd_send_signal 424
+#define __NR_io_uring_setup    425
+#define __NR_io_uring_enter    426
+#define __NR_io_uring_register 427
 
index 4c9d874aa3ebc6fa2da64cfdfd0d57d624d8b858..22b0b28b8349c5e80f59b44637b5bec56f071050 100644 (file)
@@ -3,52 +3,82 @@
 ((union { long long ll; long l[2]; }){ .ll = x }).l[1]
 #define __SYSCALL_LL_O(x) __SYSCALL_LL_E((x))
 
+#if SYSCALL_NO_TLS
+#define SYSCALL_INSNS "int $128"
+#else
+#define SYSCALL_INSNS "call *%%gs:16"
+#endif
+
+#define SYSCALL_INSNS_12 "xchg %%ebx,%%edx ; " SYSCALL_INSNS " ; xchg %%ebx,%%edx"
+#define SYSCALL_INSNS_34 "xchg %%ebx,%%edi ; " SYSCALL_INSNS " ; xchg %%ebx,%%edi"
+
 static inline long __syscall0(long n)
 {
        unsigned long __ret;
-       __asm__ __volatile__ (".hidden __vsyscall ; call __vsyscall" : "=a"(__ret) : "a"(n) : "memory");
+       __asm__ __volatile__ (SYSCALL_INSNS : "=a"(__ret) : "a"(n) : "memory");
        return __ret;
 }
 
 static inline long __syscall1(long n, long a1)
 {
        unsigned long __ret;
-       __asm__ __volatile__ (".hidden __vsyscall ; call __vsyscall" : "=a"(__ret) : "a"(n), "d"(a1) : "memory");
+       __asm__ __volatile__ (SYSCALL_INSNS_12 : "=a"(__ret) : "a"(n), "d"(a1) : "memory");
        return __ret;
 }
 
 static inline long __syscall2(long n, long a1, long a2)
 {
        unsigned long __ret;
-       __asm__ __volatile__ (".hidden __vsyscall ; call __vsyscall" : "=a"(__ret) : "a"(n), "d"(a1), "c"(a2) : "memory");
+       __asm__ __volatile__ (SYSCALL_INSNS_12 : "=a"(__ret) : "a"(n), "d"(a1), "c"(a2) : "memory");
        return __ret;
 }
 
 static inline long __syscall3(long n, long a1, long a2, long a3)
 {
        unsigned long __ret;
-       __asm__ __volatile__ (".hidden __vsyscall ; call __vsyscall" : "=a"(__ret) : "a"(n), "d"(a1), "c"(a2), "D"(a3) : "memory");
+#if !defined(__PIC__) || !defined(BROKEN_EBX_ASM)
+       __asm__ __volatile__ (SYSCALL_INSNS : "=a"(__ret) : "a"(n), "b"(a1), "c"(a2), "d"(a3) : "memory");
+#else
+       __asm__ __volatile__ (SYSCALL_INSNS_34 : "=a"(__ret) : "a"(n), "D"(a1), "c"(a2), "d"(a3) : "memory");
+#endif
        return __ret;
 }
 
 static inline long __syscall4(long n, long a1, long a2, long a3, long a4)
 {
        unsigned long __ret;
-       __asm__ __volatile__ (".hidden __vsyscall ; call __vsyscall" : "=a"(__ret) : "a"(n), "d"(a1), "c"(a2), "D"(a3), "S"(a4) : "memory");
+#if !defined(__PIC__) || !defined(BROKEN_EBX_ASM)
+       __asm__ __volatile__ (SYSCALL_INSNS : "=a"(__ret) : "a"(n), "b"(a1), "c"(a2), "d"(a3), "S"(a4) : "memory");
+#else
+       __asm__ __volatile__ (SYSCALL_INSNS_34 : "=a"(__ret) : "a"(n), "D"(a1), "c"(a2), "d"(a3), "S"(a4) : "memory");
+#endif
        return __ret;
 }
 
 static inline long __syscall5(long n, long a1, long a2, long a3, long a4, long a5)
 {
        unsigned long __ret;
-       __asm__ __volatile__ ("push %6 ; .hidden __vsyscall ; call __vsyscall ; add $4,%%esp" : "=a"(__ret) : "a"(n), "d"(a1), "c"(a2), "D"(a3), "S"(a4), "g"(a5) : "memory");
+#if !defined(__PIC__) || !defined(BROKEN_EBX_ASM)
+       __asm__ __volatile__ (SYSCALL_INSNS
+               : "=a"(__ret) : "a"(n), "b"(a1), "c"(a2), "d"(a3), "S"(a4), "D"(a5) : "memory");
+#else
+       __asm__ __volatile__ ("pushl %2 ; push %%ebx ; mov 4(%%esp),%%ebx ; " SYSCALL_INSNS " ; pop %%ebx ; add $4,%%esp"
+               : "=a"(__ret) : "a"(n), "g"(a1), "c"(a2), "d"(a3), "S"(a4), "D"(a5) : "memory");
+#endif
        return __ret;
 }
 
 static inline long __syscall6(long n, long a1, long a2, long a3, long a4, long a5, long a6)
 {
        unsigned long __ret;
-       __asm__ __volatile__ ("push %6 ; .hidden __vsyscall6 ; call __vsyscall6 ; add $4,%%esp" : "=a"(__ret) : "a"(n), "d"(a1), "c"(a2), "D"(a3), "S"(a4), "g"(0+(long[]){a5, a6}) : "memory");
+#if !defined(__PIC__) || !defined(BROKEN_EBX_ASM)
+       __asm__ __volatile__ ("pushl %7 ; push %%ebp ; mov 4(%%esp),%%ebp ; " SYSCALL_INSNS " ; pop %%ebp ; add $4,%%esp"
+               : "=a"(__ret) : "a"(n), "b"(a1), "c"(a2), "d"(a3), "S"(a4), "D"(a5), "g"(a6) : "memory");
+#else
+       unsigned long a1a6[2] = { a1, a6 };
+       __asm__ __volatile__ ("pushl %1 ; push %%ebx ; push %%ebp ; mov 8(%%esp),%%ebx ; mov 4(%%ebx),%%ebp ; mov (%%ebx),%%ebx ; " SYSCALL_INSNS " ; pop %%ebp ; pop %%ebx ; add $4,%%esp"
+               : "=a"(__ret) : "g"(&a1a6), "a"(n), "c"(a2), "d"(a3), "S"(a4), "D"(a5) : "memory");
+#endif
        return __ret;
 }
 
index 89cf114c1335bca2b0d3cab878c994a92c4df875..c7859b99526d4b550c6731c2e71329f370535ae0 100644 (file)
 #define __NR_preadv2           377
 #define __NR_pwritev2          378
 #define __NR_statx             379
+#define __NR_seccomp           380
+#define __NR_pkey_mprotect     381
+#define __NR_pkey_alloc                382
+#define __NR_pkey_free         383
+#define __NR_rseq              384
+#define __NR_semget            393
+#define __NR_semctl            394
+#define __NR_shmget            395
+#define __NR_shmctl            396
+#define __NR_shmat             397
+#define __NR_shmdt             398
+#define __NR_msgget            399
+#define __NR_msgsnd            400
+#define __NR_msgrcv            401
+#define __NR_msgctl            402
+#define __NR_clock_gettime64   403
+#define __NR_clock_settime64   404
+#define __NR_clock_adjtime64   405
+#define __NR_clock_getres_time64 406
+#define __NR_clock_nanosleep_time64 407
+#define __NR_timer_gettime64   408
+#define __NR_timer_settime64   409
+#define __NR_timerfd_gettime64 410
+#define __NR_timerfd_settime64 411
+#define __NR_utimensat_time64  412
+#define __NR_pselect6_time64   413
+#define __NR_ppoll_time64      414
+#define __NR_io_pgetevents_time64 416
+#define __NR_recvmmsg_time64   417
+#define __NR_mq_timedsend_time64 418
+#define __NR_mq_timedreceive_time64 419
+#define __NR_semtimedop_time64 420
+#define __NR_rt_sigtimedwait_time64 421
+#define __NR_futex_time64      422
+#define __NR_sched_rr_get_interval_time64 423
+#define __NR_pidfd_send_signal 424
+#define __NR_io_uring_setup    425
+#define __NR_io_uring_enter    426
+#define __NR_io_uring_register 427
index f05839613b49cf4b242bffe2df504cb749500848..91bc244e7172af2dd4f48851d8815ccaaf7bae58 100644 (file)
 #define __NR_statx 398
 #define __NR_io_pgetevents 399
 #define __NR_rseq 400
+#define __NR_clock_gettime64 403
+#define __NR_clock_settime64 404
+#define __NR_clock_adjtime64 405
+#define __NR_clock_getres_time64 406
+#define __NR_clock_nanosleep_time64 407
+#define __NR_timer_gettime64 408
+#define __NR_timer_settime64 409
+#define __NR_timerfd_gettime64 410
+#define __NR_timerfd_settime64 411
+#define __NR_utimensat_time64 412
+#define __NR_pselect6_time64 413
+#define __NR_ppoll_time64 414
+#define __NR_io_pgetevents_time64 416
+#define __NR_recvmmsg_time64 417
+#define __NR_mq_timedsend_time64 418
+#define __NR_mq_timedreceive_time64 419
+#define __NR_semtimedop_time64 420
+#define __NR_rt_sigtimedwait_time64 421
+#define __NR_futex_time64 422
+#define __NR_sched_rr_get_interval_time64 423
+#define __NR_pidfd_send_signal 424
+#define __NR_io_uring_setup 425
+#define __NR_io_uring_enter 426
+#define __NR_io_uring_register 427
 
index 6cf631ad5d317070671c114b8c3080ae021ba6f4..169013f80e4eea1e0f1adfde0516562d673fae80 100644 (file)
@@ -1,9 +1,7 @@
 #define __SYSCALL_LL_E(x) \
 ((union { long long ll; long l[2]; }){ .ll = x }).l[0], \
 ((union { long long ll; long l[2]; }){ .ll = x }).l[1]
-#define __SYSCALL_LL_O(x) 0, __SYSCALL_LL_E((x))
-
-#ifndef __clang__
+#define __SYSCALL_LL_O(x) __SYSCALL_LL_E((x))
 
 static __inline long __syscall0(long n)
 {
@@ -96,11 +94,4 @@ static inline long __syscall6(long n, long a, long b, long c, long d, long e, lo
        return r3;
 }
 
-#else
-
-#undef SYSCALL_NO_INLINE
-#define SYSCALL_NO_INLINE
-
-#endif
-
 #define SYSCALL_IPC_BROKEN_MODE
index be8c32075b603b64d744c8351862e7d4419f1369..6175a7c228b96c44a38c59decf9ce1d19238cd4f 100644 (file)
 #define __NR_statx                   4366
 #define __NR_rseq                    4367
 #define __NR_io_pgetevents           4368
+#define __NR_semget                  4393
+#define __NR_semctl                  4394
+#define __NR_shmget                  4395
+#define __NR_shmctl                  4396
+#define __NR_shmat                   4397
+#define __NR_shmdt                   4398
+#define __NR_msgget                  4399
+#define __NR_msgsnd                  4400
+#define __NR_msgrcv                  4401
+#define __NR_msgctl                  4402
+#define __NR_clock_gettime64         4403
+#define __NR_clock_settime64         4404
+#define __NR_clock_adjtime64         4405
+#define __NR_clock_getres_time64     4406
+#define __NR_clock_nanosleep_time64  4407
+#define __NR_timer_gettime64         4408
+#define __NR_timer_settime64         4409
+#define __NR_timerfd_gettime64       4410
+#define __NR_timerfd_settime64       4411
+#define __NR_utimensat_time64        4412
+#define __NR_pselect6_time64         4413
+#define __NR_ppoll_time64            4414
+#define __NR_io_pgetevents_time64    4416
+#define __NR_recvmmsg_time64         4417
+#define __NR_mq_timedsend_time64     4418
+#define __NR_mq_timedreceive_time64  4419
+#define __NR_semtimedop_time64       4420
+#define __NR_rt_sigtimedwait_time64  4421
+#define __NR_futex_time64            4422
+#define __NR_sched_rr_get_interval_time64 4423
+#define __NR_pidfd_send_signal       4424
+#define __NR_io_uring_setup          4425
+#define __NR_io_uring_enter          4426
+#define __NR_io_uring_register       4427
 
index f7b9dd2e8b5bc55bbaf68ba7341fb48163f04e95..9d571f78f69025c0ab625518964e96ff13752a43 100644 (file)
@@ -165,5 +165,5 @@ struct termios {
 #define EXTPROC 0200000
 
 #define XTABS  0014000
-#define TIOCSER_TEMT 0x01
+#define TIOCSER_TEMT 1
 #endif
index 01de67b8cbcc303dc28b52224217001a8d134cc6..43bcdee7af65da1b9f46bf255d7f173ce974ace4 100644 (file)
@@ -3,8 +3,6 @@
 ((union { long long ll; long l[2]; }){ .ll = x }).l[1]
 #define __SYSCALL_LL_O(x) 0, __SYSCALL_LL_E((x))
 
-hidden long (__syscall)(long, ...);
-
 #define SYSCALL_RLIM_INFINITY (-1UL/2)
 
 #if _MIPSEL || __MIPSEL || __MIPSEL__
@@ -104,8 +102,22 @@ static inline long __syscall4(long n, long a, long b, long c, long d)
 
 static inline long __syscall5(long n, long a, long b, long c, long d, long e)
 {
-       long r2 = (__syscall)(n, a, b, c, d, e);
-       if (r2 > -4096UL) return r2;
+       register long r4 __asm__("$4") = a;
+       register long r5 __asm__("$5") = b;
+       register long r6 __asm__("$6") = c;
+       register long r7 __asm__("$7") = d;
+       register long r8 __asm__("$8") = e;
+       register long r2 __asm__("$2");
+       __asm__ __volatile__ (
+               "subu $sp,$sp,32 ; sw $8,16($sp) ; "
+               "addu $2,$0,%3 ; syscall ;"
+               "addu $sp,$sp,32"
+               : "=&r"(r2), "=r"(r7), "+r"(r8)
+               : "ir"(n), "0"(r2), "1"(r7), "r"(r4), "r"(r5), "r"(r6)
+               : "$1", "$3", "$9", "$10", "$11", "$12", "$13",
+                 "$14", "$15", "$24", "$25", "hi", "lo", "memory");
+       if (r7) return -r2;
+       long ret = r2;
        if (n == SYS_stat64 || n == SYS_fstat64 || n == SYS_lstat64) __stat_fix(b);
        if (n == SYS_fstatat64) __stat_fix(c);
        return r2;
@@ -113,8 +125,48 @@ static inline long __syscall5(long n, long a, long b, long c, long d, long e)
 
 static inline long __syscall6(long n, long a, long b, long c, long d, long e, long f)
 {
-       long r2 = (__syscall)(n, a, b, c, d, e, f);
-       if (r2 > -4096UL) return r2;
+       register long r4 __asm__("$4") = a;
+       register long r5 __asm__("$5") = b;
+       register long r6 __asm__("$6") = c;
+       register long r7 __asm__("$7") = d;
+       register long r8 __asm__("$8") = e;
+       register long r9 __asm__("$9") = f;
+       register long r2 __asm__("$2");
+       __asm__ __volatile__ (
+               "subu $sp,$sp,32 ; sw $8,16($sp) ; sw $9,20($sp) ; "
+               "addu $2,$0,%4 ; syscall ;"
+               "addu $sp,$sp,32"
+               : "=&r"(r2), "=r"(r7), "+r"(r8), "+r"(r9)
+               : "ir"(n), "0"(r2), "1"(r7), "r"(r4), "r"(r5), "r"(r6)
+               : "$1", "$3", "$10", "$11", "$12", "$13",
+                 "$14", "$15", "$24", "$25", "hi", "lo", "memory");
+       if (r7) return -r2;
+       long ret = r2;
+       if (n == SYS_stat64 || n == SYS_fstat64 || n == SYS_lstat64) __stat_fix(b);
+       if (n == SYS_fstatat64) __stat_fix(c);
+       return r2;
+}
+
+static inline long __syscall7(long n, long a, long b, long c, long d, long e, long f, long g)
+{
+       register long r4 __asm__("$4") = a;
+       register long r5 __asm__("$5") = b;
+       register long r6 __asm__("$6") = c;
+       register long r7 __asm__("$7") = d;
+       register long r8 __asm__("$8") = e;
+       register long r9 __asm__("$9") = f;
+       register long r10 __asm__("$10") = g;
+       register long r2 __asm__("$2");
+       __asm__ __volatile__ (
+               "subu $sp,$sp,32 ; sw $8,16($sp) ; sw $9,20($sp) ; sw $10,24($sp) ; "
+               "addu $2,$0,%5 ; syscall ;"
+               "addu $sp,$sp,32"
+               : "=&r"(r2), "=r"(r7), "+r"(r8), "+r"(r9), "+r"(r10)
+               : "ir"(n), "0"(r2), "1"(r7), "r"(r4), "r"(r5), "r"(r6)
+               : "$1", "$3", "$11", "$12", "$13",
+                 "$14", "$15", "$24", "$25", "hi", "lo", "memory");
+       if (r7) return -r2;
+       long ret = r2;
        if (n == SYS_stat64 || n == SYS_fstat64 || n == SYS_lstat64) __stat_fix(b);
        if (n == SYS_fstatat64) __stat_fix(c);
        return r2;
index f814aa48c5ff3473b29ba67578a0f9d30d3b6b37..ca99e453f763526d0c854d35d05b1250dd61c148 100644 (file)
 #define __NR_pkey_alloc                        5324
 #define __NR_pkey_free                 5325
 #define __NR_statx                     5326
-#define __NR_rseq                      4327
-#define __NR_io_pgetevents             4328
+#define __NR_rseq                      5327
+#define __NR_io_pgetevents             5328
+#define __NR_pidfd_send_signal         5424
+#define __NR_io_uring_setup            5425
+#define __NR_io_uring_enter            5426
+#define __NR_io_uring_register         5427
 
index f7b9dd2e8b5bc55bbaf68ba7341fb48163f04e95..9d571f78f69025c0ab625518964e96ff13752a43 100644 (file)
@@ -165,5 +165,5 @@ struct termios {
 #define EXTPROC 0200000
 
 #define XTABS  0014000
-#define TIOCSER_TEMT 0x01
+#define TIOCSER_TEMT 1
 #endif
index 5eabdf46b0534ab71fc78d7edfdb0f50d2fc385d..99eebc3261253e5dcb6b2901a8bad9c9dbade3bf 100644 (file)
@@ -1,9 +1,6 @@
 #define __SYSCALL_LL_E(x) (x)
 #define __SYSCALL_LL_O(x) (x)
 
-__attribute__((visibility("hidden")))
-long (__syscall)(long, ...);
-
 #define SYSCALL_RLIM_INFINITY (-1UL/2)
 
 #include <sys/stat.h>
@@ -79,16 +76,14 @@ static inline long __syscall2(long n, long a, long b)
 {
        struct kernel_stat kst;
        long ret;
-       register long r4 __asm__("$4");
-       register long r5 __asm__("$5");
+       register long r4 __asm__("$4") = a;
+       register long r5 __asm__("$5") = b;
        register long r7 __asm__("$7");
        register long r2 __asm__("$2");
 
-       r5 = b;
        if (n == SYS_stat || n == SYS_fstat || n == SYS_lstat)
                r5 = (long) &kst;
 
-       r4 = a;
        __asm__ __volatile__ (
                "daddu $2,$0,%2 ; syscall"
                : "=&r"(r2), "=r"(r7) : "ir"(n), "0"(r2), "1"(r7),
@@ -109,18 +104,15 @@ static inline long __syscall3(long n, long a, long b, long c)
 {
        struct kernel_stat kst;
        long ret;
-       register long r4 __asm__("$4");
-       register long r5 __asm__("$5");
-       register long r6 __asm__("$6");
+       register long r4 __asm__("$4") = a;
+       register long r5 __asm__("$5") = b;
+       register long r6 __asm__("$6") = c;
        register long r7 __asm__("$7");
        register long r2 __asm__("$2");
 
-       r5 = b;
        if (n == SYS_stat || n == SYS_fstat || n == SYS_lstat)
                r5 = (long) &kst;
 
-       r4 = a;
-       r6 = c;
        __asm__ __volatile__ (
                "daddu $2,$0,%2 ; syscall"
                : "=&r"(r2), "=r"(r7) : "ir"(n), "0"(r2), "1"(r7),
@@ -141,16 +133,12 @@ static inline long __syscall4(long n, long a, long b, long c, long d)
 {
        struct kernel_stat kst;
        long ret;
-       register long r4 __asm__("$4");
-       register long r5 __asm__("$5");
-       register long r6 __asm__("$6");
-       register long r7 __asm__("$7");
+       register long r4 __asm__("$4") = a;
+       register long r5 __asm__("$5") = b;
+       register long r6 __asm__("$6") = c;
+       register long r7 __asm__("$7") = d;
        register long r2 __asm__("$2");
 
-       r4 = a;
-       r5 = b;
-       r6 = c;
-       r7 = d;
        if (n == SYS_stat || n == SYS_fstat || n == SYS_lstat)
                r5 = (long) &kst;
        if (n == SYS_newfstatat)
@@ -176,48 +164,71 @@ static inline long __syscall4(long n, long a, long b, long c, long d)
 
 static inline long __syscall5(long n, long a, long b, long c, long d, long e)
 {
-       long r2;
-       long old_b = b;
-       long old_c = c;
        struct kernel_stat kst;
+       long ret;
+       register long r4 __asm__("$4") = a;
+       register long r5 __asm__("$5") = b;
+       register long r6 __asm__("$6") = c;
+       register long r7 __asm__("$7") = d;
+       register long r8 __asm__("$8") = e;
+       register long r2 __asm__("$2");
 
        if (n == SYS_stat || n == SYS_fstat || n == SYS_lstat)
-               b = (long) &kst;
+               r5 = (long) &kst;
        if (n == SYS_newfstatat)
-               c = (long) &kst;
+               r6 = (long) &kst;
 
-       r2 = (__syscall)(n, a, b, c, d, e);
-       if (r2 > -4096UL) return r2;
+       __asm__ __volatile__ (
+               "daddu $2,$0,%2 ; syscall"
+               : "=&r"(r2), "=r"(r7) : "ir"(n), "0"(r2), "1"(r7),
+                 "r"(r4), "r"(r5), "r"(r6), "r"(r8)
+               : "$1", "$3", "$9", "$10", "$11", "$12", "$13",
+                 "$14", "$15", "$24", "$25", "hi", "lo", "memory");
+
+       if (r7) return -r2;
+       ret = r2;
 
        if (n == SYS_stat || n == SYS_fstat || n == SYS_lstat)
-               __stat_fix(&kst, (struct stat *)old_b);
+               __stat_fix(&kst, (struct stat *)b);
        if (n == SYS_newfstatat)
-               __stat_fix(&kst, (struct stat *)old_c);
+               __stat_fix(&kst, (struct stat *)c);
 
-       return r2;
+       return ret;
 }
 
 static inline long __syscall6(long n, long a, long b, long c, long d, long e, long f)
 {
-       long r2;
-       long old_b = b;
-       long old_c = c;
        struct kernel_stat kst;
+       long ret;
+       register long r4 __asm__("$4") = a;
+       register long r5 __asm__("$5") = b;
+       register long r6 __asm__("$6") = c;
+       register long r7 __asm__("$7") = d;
+       register long r8 __asm__("$8") = e;
+       register long r9 __asm__("$9") = f;
+       register long r2 __asm__("$2");
 
        if (n == SYS_stat || n == SYS_fstat || n == SYS_lstat)
-               b = (long) &kst;
+               r5 = (long) &kst;
        if (n == SYS_newfstatat)
-               c = (long) &kst;
+               r6 = (long) &kst;
 
-       r2 = (__syscall)(n, a, b, c, d, e, f);
-       if (r2 > -4096UL) return r2;
+       __asm__ __volatile__ (
+               "daddu $2,$0,%2 ; syscall"
+               : "=&r"(r2), "=r"(r7) : "ir"(n), "0"(r2), "1"(r7),
+                 "r"(r4), "r"(r5), "r"(r6), "r"(r8), "r"(r9)
+               : "$1", "$3", "$10", "$11", "$12", "$13",
+                 "$14", "$15", "$24", "$25", "hi", "lo", "memory");
+
+       if (r7) return -r2;
+       ret = r2;
 
        if (n == SYS_stat || n == SYS_fstat || n == SYS_lstat)
-               __stat_fix(&kst, (struct stat *)old_b);
+               __stat_fix(&kst, (struct stat *)b);
        if (n == SYS_newfstatat)
-               __stat_fix(&kst, (struct stat *)old_c);
+               __stat_fix(&kst, (struct stat *)c);
 
-       return r2;
+       return ret;
 }
 
 #define VDSO_USEFUL
index c172618075ffe7dc0b0fa0415755a99318c18177..f31ee4463f88bbed5983cc01de965259847398d0 100644 (file)
 #define __NR_statx                     6330
 #define __NR_rseq                      6331
 #define __NR_io_pgetevents             6332
+#define __NR_clock_gettime64           6403
+#define __NR_clock_settime64           6404
+#define __NR_clock_adjtime64           6405
+#define __NR_clock_getres_time64       6406
+#define __NR_clock_nanosleep_time64    6407
+#define __NR_timer_gettime64           6408
+#define __NR_timer_settime64           6409
+#define __NR_timerfd_gettime64         6410
+#define __NR_timerfd_settime64         6411
+#define __NR_utimensat_time64          6412
+#define __NR_pselect6_time64           6413
+#define __NR_ppoll_time64              6414
+#define __NR_io_pgetevents_time64      6416
+#define __NR_recvmmsg_time64           6417
+#define __NR_mq_timedsend_time64       6418
+#define __NR_mq_timedreceive_time64    6419
+#define __NR_semtimedop_time64         6420
+#define __NR_rt_sigtimedwait_time64    6421
+#define __NR_futex_time64              6422
+#define __NR_sched_rr_get_interval_time64 6423
+#define __NR_pidfd_send_signal         6424
+#define __NR_io_uring_setup            6425
+#define __NR_io_uring_enter            6426
+#define __NR_io_uring_register         6427
 
index f7b9dd2e8b5bc55bbaf68ba7341fb48163f04e95..9d571f78f69025c0ab625518964e96ff13752a43 100644 (file)
@@ -165,5 +165,5 @@ struct termios {
 #define EXTPROC 0200000
 
 #define XTABS  0014000
-#define TIOCSER_TEMT 0x01
+#define TIOCSER_TEMT 1
 #endif
index f6a1fbaed0cbbe180ec81ccde2af49a67ccf5b7e..7b11740f07b78b7e715ca741d82d726488213a3a 100644 (file)
@@ -1,8 +1,6 @@
 #define __SYSCALL_LL_E(x) (x)
 #define __SYSCALL_LL_O(x) (x)
 
-hidden long (__syscall)(long, ...);
-
 #define SYSCALL_RLIM_INFINITY (-1UL/2)
 
 #if _MIPSEL || __MIPSEL || __MIPSEL__
@@ -102,8 +100,18 @@ static inline long __syscall4(long n, long a, long b, long c, long d)
 
 static inline long __syscall5(long n, long a, long b, long c, long d, long e)
 {
-       long r2 = (__syscall)(n, a, b, c, d, e);
-       if (r2 > -4096UL) return r2;
+       register long r4 __asm__("$4") = a;
+       register long r5 __asm__("$5") = b;
+       register long r6 __asm__("$6") = c;
+       register long r7 __asm__("$7") = d;
+       register long r8 __asm__("$8") = e;
+       register long r2 __asm__("$2");
+       __asm__ __volatile__ (
+               "addu $2,$0,%2 ; syscall"
+               : "=&r"(r2), "=r"(r7) : "ir"(n), "0"(r2), "1"(r7),
+                 "r"(r4), "r"(r5), "r"(r6), "r"(r8)
+               : "$1", "$3", "$9", "$10", "$11", "$12", "$13",
+                 "$14", "$15", "$24", "$25", "hi", "lo", "memory");
        if (n == SYS_stat || n == SYS_fstat || n == SYS_lstat) __stat_fix(b);
        if (n == SYS_newfstatat) __stat_fix(c);
        return r2;
@@ -111,8 +119,19 @@ static inline long __syscall5(long n, long a, long b, long c, long d, long e)
 
 static inline long __syscall6(long n, long a, long b, long c, long d, long e, long f)
 {
-       long r2 = (__syscall)(n, a, b, c, d, e, f);
-       if (r2 > -4096UL) return r2;
+       register long r4 __asm__("$4") = a;
+       register long r5 __asm__("$5") = b;
+       register long r6 __asm__("$6") = c;
+       register long r7 __asm__("$7") = d;
+       register long r8 __asm__("$8") = e;
+       register long r9 __asm__("$9") = f;
+       register long r2 __asm__("$2");
+       __asm__ __volatile__ (
+               "addu $2,$0,%2 ; syscall"
+               : "=&r"(r2), "=r"(r7) : "ir"(n), "0"(r2), "1"(r7),
+                 "r"(r4), "r"(r5), "r"(r6), "r"(r8), "r"(r9)
+               : "$1", "$3", "$10", "$11", "$12", "$13",
+                 "$14", "$15", "$24", "$25", "hi", "lo", "memory");
        if (n == SYS_stat || n == SYS_fstat || n == SYS_lstat) __stat_fix(b);
        if (n == SYS_newfstatat) __stat_fix(c);
        return r2;
index 4c3df0a3cf8b292d5bf6c649d1d4c9c686ae4c76..33a868619f1746d9cea766bc9f6b56c9b449dce5 100644 (file)
 #define __NR_io_pgetevents 292
 #define __NR_rseq 293
 #define __NR_kexec_file_load 294
+#define __NR_clock_gettime64 403
+#define __NR_clock_settime64 404
+#define __NR_clock_adjtime64 405
+#define __NR_clock_getres_time64 406
+#define __NR_clock_nanosleep_time64 407
+#define __NR_timer_gettime64 408
+#define __NR_timer_settime64 409
+#define __NR_timerfd_gettime64 410
+#define __NR_timerfd_settime64 411
+#define __NR_utimensat_time64 412
+#define __NR_pselect6_time64 413
+#define __NR_ppoll_time64 414
+#define __NR_io_pgetevents_time64 416
+#define __NR_recvmmsg_time64 417
+#define __NR_mq_timedsend_time64 418
+#define __NR_mq_timedreceive_time64 419
+#define __NR_semtimedop_time64 420
+#define __NR_rt_sigtimedwait_time64 421
+#define __NR_futex_time64 422
+#define __NR_sched_rr_get_interval_time64 423
+#define __NR_pidfd_send_signal 424
+#define __NR_io_uring_setup 425
+#define __NR_io_uring_enter 426
+#define __NR_io_uring_register 427
 
index caff7ece45f12ca9567f7a662bcd91713f985756..5a9b074a02b409a958751f4f22e2d1e375261723 100644 (file)
@@ -5,8 +5,6 @@
 
 #define SYSCALL_MMAP2_UNIT 8192ULL
 
-#ifndef __clang__
-
 static __inline long __syscall0(long n)
 {
        register unsigned long r11 __asm__("r11") = n;
@@ -113,10 +111,3 @@ static inline long __syscall6(long n, long a, long b, long c, long d, long e, lo
                                "r23", "r25", "r27", "r29", "r31");
        return r11;
 }
-
-#else
-
-#undef SYSCALL_NO_INLINE
-#define SYSCALL_NO_INLINE
-
-#endif
index 54e155f2ac6fd22f1a6d8fb59e5bc59b8010f3d2..0a6c9addff1d18a63a3a1b87650032fb5492850e 100644 (file)
 #define __NR_pkey_mprotect         386
 #define __NR_rseq                  387
 #define __NR_io_pgetevents         388
+#define __NR_semget                393
+#define __NR_semctl                394
+#define __NR_shmget                395
+#define __NR_shmctl                396
+#define __NR_shmat                 397
+#define __NR_shmdt                 398
+#define __NR_msgget                399
+#define __NR_msgsnd                400
+#define __NR_msgrcv                401
+#define __NR_msgctl                402
+#define __NR_clock_gettime64       403
+#define __NR_clock_settime64       404
+#define __NR_clock_adjtime64       405
+#define __NR_clock_getres_time64   406
+#define __NR_clock_nanosleep_time64 407
+#define __NR_timer_gettime64       408
+#define __NR_timer_settime64       409
+#define __NR_timerfd_gettime64     410
+#define __NR_timerfd_settime64     411
+#define __NR_utimensat_time64      412
+#define __NR_pselect6_time64       413
+#define __NR_ppoll_time64          414
+#define __NR_io_pgetevents_time64  416
+#define __NR_recvmmsg_time64       417
+#define __NR_mq_timedsend_time64   418
+#define __NR_mq_timedreceive_time64 419
+#define __NR_semtimedop_time64     420
+#define __NR_rt_sigtimedwait_time64 421
+#define __NR_futex_time64          422
+#define __NR_sched_rr_get_interval_time64 423
+#define __NR_pidfd_send_signal     424
+#define __NR_io_uring_setup        425
+#define __NR_io_uring_enter        426
+#define __NR_io_uring_register     427
 
index e3f22e8644c2498dbabf48ee7f45fc1f52c1e6cd..da1f406bcb7d3869227d93fd5117a11c4bb1e99a 100644 (file)
@@ -167,5 +167,5 @@ struct termios {
 #define EXTPROC 0x10000000
 
 #define XTABS   00006000
-#define TIOCSER_TEMT 0x01
+#define TIOCSER_TEMT 1
 #endif
index 004060e6d6ede1274acb8b849eadb5458a37652f..e26a3c34c26a821dda8765cd6eb4ab63d068df50 100644 (file)
@@ -3,7 +3,89 @@
 ((union { long long ll; long l[2]; }){ .ll = x }).l[1]
 #define __SYSCALL_LL_O(x) 0, __SYSCALL_LL_E((x))
 
-#undef SYSCALL_NO_INLINE
-#define SYSCALL_NO_INLINE
+static inline long __syscall0(long n)
+{
+       register long r0 __asm__("r0") = n;
+       register long r3 __asm__("r3");
+       __asm__ __volatile__("sc ; bns+ 1f ; neg %1, %1 ; 1:"
+       : "+r"(r0), "=r"(r3)
+       :: "memory", "cr0", "r4", "r5", "r6", "r7", "r8", "r9", "r10", "r11", "r12");
+       return r3;
+}
+
+static inline long __syscall1(long n, long a)
+{
+       register long r0 __asm__("r0") = n;
+       register long r3 __asm__("r3") = a;
+       __asm__ __volatile__("sc ; bns+ 1f ; neg %1, %1 ; 1:"
+       : "+r"(r0), "+r"(r3)
+       :: "memory", "cr0", "r4", "r5", "r6", "r7", "r8", "r9", "r10", "r11", "r12");
+       return r3;
+}
+
+static inline long __syscall2(long n, long a, long b)
+{
+       register long r0 __asm__("r0") = n;
+       register long r3 __asm__("r3") = a;
+       register long r4 __asm__("r4") = b;
+       __asm__ __volatile__("sc ; bns+ 1f ; neg %1, %1 ; 1:"
+       : "+r"(r0), "+r"(r3), "+r"(r4)
+       :: "memory", "cr0", "r5", "r6", "r7", "r8", "r9", "r10", "r11", "r12");
+       return r3;
+}
+
+static inline long __syscall3(long n, long a, long b, long c)
+{
+       register long r0 __asm__("r0") = n;
+       register long r3 __asm__("r3") = a;
+       register long r4 __asm__("r4") = b;
+       register long r5 __asm__("r5") = c;
+       __asm__ __volatile__("sc ; bns+ 1f ; neg %1, %1 ; 1:"
+       : "+r"(r0), "+r"(r3), "+r"(r4), "+r"(r5)
+       :: "memory", "cr0", "r6", "r7", "r8", "r9", "r10", "r11", "r12");
+       return r3;
+}
+
+static inline long __syscall4(long n, long a, long b, long c, long d)
+{
+       register long r0 __asm__("r0") = n;
+       register long r3 __asm__("r3") = a;
+       register long r4 __asm__("r4") = b;
+       register long r5 __asm__("r5") = c;
+       register long r6 __asm__("r6") = d;
+       __asm__ __volatile__("sc ; bns+ 1f ; neg %1, %1 ; 1:"
+       : "+r"(r0), "+r"(r3), "+r"(r4), "+r"(r5), "+r"(r6)
+       :: "memory", "cr0", "r7", "r8", "r9", "r10", "r11", "r12");
+       return r3;
+}
+
+static inline long __syscall5(long n, long a, long b, long c, long d, long e)
+{
+       register long r0 __asm__("r0") = n;
+       register long r3 __asm__("r3") = a;
+       register long r4 __asm__("r4") = b;
+       register long r5 __asm__("r5") = c;
+       register long r6 __asm__("r6") = d;
+       register long r7 __asm__("r7") = e;
+       __asm__ __volatile__("sc ; bns+ 1f ; neg %1, %1 ; 1:"
+       : "+r"(r0), "+r"(r3), "+r"(r4), "+r"(r5), "+r"(r6), "+r"(r7)
+       :: "memory", "cr0", "r8", "r9", "r10", "r11", "r12");
+       return r3;
+}
+
+static inline long __syscall6(long n, long a, long b, long c, long d, long e, long f)
+{
+       register long r0 __asm__("r0") = n;
+       register long r3 __asm__("r3") = a;
+       register long r4 __asm__("r4") = b;
+       register long r5 __asm__("r5") = c;
+       register long r6 __asm__("r6") = d;
+       register long r7 __asm__("r7") = e;
+       register long r8 __asm__("r8") = f;
+       __asm__ __volatile__("sc ; bns+ 1f ; neg %1, %1 ; 1:"
+       : "+r"(r0), "+r"(r3), "+r"(r4), "+r"(r5), "+r"(r6), "+r"(r7), "+r"(r8)
+       :: "memory", "cr0", "r9", "r10", "r11", "r12");
+       return r3;
+}
 
 #define SYSCALL_FADVISE_6_ARG
index 34693a682ae1dda53726ad59a575373f4fd85cfe..2cc0604c5e4b279a4d89aae2b094010a053bfe0a 100644 (file)
@@ -16,11 +16,18 @@ typedef struct {
 } fpregset_t;
 
 typedef struct {
-       unsigned __int128 vrregs[32];
-       unsigned _pad[3];
-       unsigned vrsave;
-       unsigned vscr;
-       unsigned _pad2[3];
+#ifdef __GNUC__
+       __attribute__((__aligned__(16)))
+#endif
+       unsigned vrregs[32][4];
+       struct {
+#if __BIG_ENDIAN__
+               unsigned _pad[3], vscr_word;
+#else
+               unsigned vscr_word, _pad[3];
+#endif
+       } vscr;
+       unsigned vrsave, _pad[3];
 } vrregset_t;
 
 typedef struct sigcontext {
index 4e29cedf83726cde0096b60c5f7acbb9ea7a53b7..0c894a2325cbe663e222505bc42adaf97b945a74 100644 (file)
 #define __NR_pkey_mprotect          386
 #define __NR_rseq                   387
 #define __NR_io_pgetevents          388
+#define __NR_semtimedop             392
+#define __NR_semget                 393
+#define __NR_semctl                 394
+#define __NR_shmget                 395
+#define __NR_shmctl                 396
+#define __NR_shmat                  397
+#define __NR_shmdt                  398
+#define __NR_msgget                 399
+#define __NR_msgsnd                 400
+#define __NR_msgrcv                 401
+#define __NR_msgctl                 402
+#define __NR_pidfd_send_signal      424
+#define __NR_io_uring_setup         425
+#define __NR_io_uring_enter         426
+#define __NR_io_uring_register      427
 
index e3f22e8644c2498dbabf48ee7f45fc1f52c1e6cd..da1f406bcb7d3869227d93fd5117a11c4bb1e99a 100644 (file)
@@ -167,5 +167,5 @@ struct termios {
 #define EXTPROC 0x10000000
 
 #define XTABS   00006000
-#define TIOCSER_TEMT 0x01
+#define TIOCSER_TEMT 1
 #endif
diff --git a/libc-top-half/musl/arch/riscv64/atomic_arch.h b/libc-top-half/musl/arch/riscv64/atomic_arch.h
new file mode 100644 (file)
index 0000000..98f12fc
--- /dev/null
@@ -0,0 +1,34 @@
+#define a_barrier a_barrier
+static inline void a_barrier()
+{
+       __asm__ __volatile__ ("fence rw,rw" : : : "memory");
+}
+
+#define a_cas a_cas
+static inline int a_cas(volatile int *p, int t, int s)
+{
+       int old, tmp;
+       __asm__("\n1:   lr.w.aqrl %0, %2\n"
+               "       bne %0, %3, 1f\n"
+               "       sc.w.aqrl %1, %4, %2\n"
+               "       bnez %1, 1b\n"
+               "1:"
+               : "=&r"(old), "+r"(tmp), "+A"(*p)
+               : "r"(t), "r"(s));
+       return old;
+}
+
+#define a_cas_p a_cas_p
+static inline void *a_cas_p(volatile void *p, void *t, void *s)
+{
+       void *old;
+       int tmp;
+       __asm__("\n1:   lr.d.aqrl %0, %2\n"
+               "       bne %0, %3, 1f\n"
+               "       sc.d.aqrl %1, %4, %2\n"
+               "       bnez %1, 1b\n"
+               "1:"
+               : "=&r"(old), "+r"(tmp), "+A"(*(long *)p)
+               : "r"(t), "r"(s));
+       return old;
+}
diff --git a/libc-top-half/musl/arch/riscv64/bits/alltypes.h.in b/libc-top-half/musl/arch/riscv64/bits/alltypes.h.in
new file mode 100644 (file)
index 0000000..ae9ba41
--- /dev/null
@@ -0,0 +1,29 @@
+#define _Addr long
+#define _Int64 long
+#define _Reg long
+
+TYPEDEF __builtin_va_list va_list;
+TYPEDEF __builtin_va_list __isoc_va_list;
+
+#ifndef __cplusplus
+TYPEDEF int wchar_t;
+#endif
+
+TYPEDEF int blksize_t;
+TYPEDEF unsigned int nlink_t;
+
+TYPEDEF float float_t;
+TYPEDEF double double_t;
+
+TYPEDEF struct { long long __ll; long double __ld; } max_align_t;
+
+TYPEDEF long time_t;
+TYPEDEF long suseconds_t;
+
+TYPEDEF struct { union { int __i[14]; volatile int __vi[14]; unsigned long __s[7]; } __u; } pthread_attr_t;
+TYPEDEF struct { union { int __i[10]; volatile int __vi[10]; volatile void *volatile __p[5]; } __u; } pthread_mutex_t;
+TYPEDEF struct { union { int __i[10]; volatile int __vi[10]; volatile void *volatile __p[5]; } __u; } mtx_t;
+TYPEDEF struct { union { int __i[12]; volatile int __vi[12]; void *__p[6]; } __u; } pthread_cond_t;
+TYPEDEF struct { union { int __i[12]; volatile int __vi[12]; void *__p[6]; } __u; } cnd_t;
+TYPEDEF struct { union { int __i[14]; volatile int __vi[14]; void *__p[7]; } __u; } pthread_rwlock_t;
+TYPEDEF struct { union { int __i[8]; volatile int __vi[8]; void *__p[4]; } __u; } pthread_barrier_t;
diff --git a/libc-top-half/musl/arch/riscv64/bits/endian.h b/libc-top-half/musl/arch/riscv64/bits/endian.h
new file mode 100644 (file)
index 0000000..172c338
--- /dev/null
@@ -0,0 +1 @@
+#define __BYTE_ORDER __LITTLE_ENDIAN
diff --git a/libc-top-half/musl/arch/riscv64/bits/fcntl.h b/libc-top-half/musl/arch/riscv64/bits/fcntl.h
new file mode 100644 (file)
index 0000000..ecb4d18
--- /dev/null
@@ -0,0 +1,38 @@
+#define O_CREAT        0100
+#define O_EXCL         0200
+#define O_NOCTTY       0400
+#define O_TRUNC       01000
+#define O_APPEND      02000
+#define O_NONBLOCK    04000
+#define O_DSYNC      010000
+#define O_SYNC     04010000
+#define O_RSYNC    04010000
+#define O_DIRECTORY 0200000
+#define O_NOFOLLOW  0400000
+#define O_CLOEXEC  02000000
+
+#define O_ASYNC      020000
+#define O_DIRECT     040000
+#define O_LARGEFILE 0100000
+#define O_NOATIME  01000000
+#define O_PATH    010000000
+#define O_TMPFILE 020200000
+#define O_NDELAY O_NONBLOCK
+
+#define F_DUPFD  0
+#define F_GETFD  1
+#define F_SETFD  2
+#define F_GETFL  3
+#define F_SETFL  4
+#define F_GETLK  5
+#define F_SETLK  6
+#define F_SETLKW 7
+#define F_SETOWN 8
+#define F_GETOWN 9
+#define F_SETSIG 10
+#define F_GETSIG 11
+
+#define F_SETOWN_EX 15
+#define F_GETOWN_EX 16
+
+#define F_GETOWNER_UIDS 17
diff --git a/libc-top-half/musl/arch/riscv64/bits/fenv.h b/libc-top-half/musl/arch/riscv64/bits/fenv.h
new file mode 100644 (file)
index 0000000..806ec40
--- /dev/null
@@ -0,0 +1,17 @@
+#define FE_INVALID      16
+#define FE_DIVBYZERO    8
+#define FE_OVERFLOW     4
+#define FE_UNDERFLOW    2
+#define FE_INEXACT      1
+
+#define FE_ALL_EXCEPT   31
+
+#define FE_TONEAREST    0
+#define FE_DOWNWARD     2
+#define FE_UPWARD       3
+#define FE_TOWARDZERO   1
+
+typedef unsigned int fexcept_t;
+typedef unsigned int fenv_t;
+
+#define FE_DFL_ENV      ((const fenv_t *) -1)
diff --git a/libc-top-half/musl/arch/riscv64/bits/float.h b/libc-top-half/musl/arch/riscv64/bits/float.h
new file mode 100644 (file)
index 0000000..719c790
--- /dev/null
@@ -0,0 +1,16 @@
+#define FLT_EVAL_METHOD 0
+
+#define LDBL_TRUE_MIN 6.47517511943802511092443895822764655e-4966L
+#define LDBL_MIN 3.36210314311209350626267781732175260e-4932L
+#define LDBL_MAX 1.18973149535723176508575932662800702e+4932L
+#define LDBL_EPSILON 1.92592994438723585305597794258492732e-34L
+
+#define LDBL_MANT_DIG 113
+#define LDBL_MIN_EXP (-16381)
+#define LDBL_MAX_EXP 16384
+
+#define LDBL_DIG 33
+#define LDBL_MIN_10_EXP (-4931)
+#define LDBL_MAX_10_EXP 4932
+
+#define DECIMAL_DIG 36
diff --git a/libc-top-half/musl/arch/riscv64/bits/ipc.h b/libc-top-half/musl/arch/riscv64/bits/ipc.h
new file mode 100644 (file)
index 0000000..6f3328a
--- /dev/null
@@ -0,0 +1,14 @@
+struct ipc_perm {
+       key_t __ipc_perm_key;
+       uid_t uid;
+       gid_t gid;
+       uid_t cuid;
+       gid_t cgid;
+       mode_t mode;
+       unsigned short __ipc_perm_seq;
+
+       unsigned long __pad1;
+       unsigned long __pad2;
+};
+
+#define IPC_64 0
diff --git a/libc-top-half/musl/arch/riscv64/bits/limits.h b/libc-top-half/musl/arch/riscv64/bits/limits.h
new file mode 100644 (file)
index 0000000..0226588
--- /dev/null
@@ -0,0 +1,7 @@
+#if defined(_POSIX_SOURCE) || defined(_POSIX_C_SOURCE) \
+ || defined(_XOPEN_SOURCE) || defined(_GNU_SOURCE) || defined(_BSD_SOURCE)
+#define LONG_BIT 64
+#endif
+
+#define LONG_MAX  0x7fffffffffffffffL
+#define LLONG_MAX  0x7fffffffffffffffLL
diff --git a/libc-top-half/musl/arch/riscv64/bits/msg.h b/libc-top-half/musl/arch/riscv64/bits/msg.h
new file mode 100644 (file)
index 0000000..641e170
--- /dev/null
@@ -0,0 +1,13 @@
+struct msqid_ds {
+       struct ipc_perm msg_perm;
+       time_t msg_stime;
+       time_t msg_rtime;
+       time_t msg_ctime;
+       unsigned long msg_cbytes;
+       msgqnum_t msg_qnum;
+       msglen_t msg_qbytes;
+       pid_t msg_lspid;
+       pid_t msg_lrpid;
+       unsigned long __pad1;
+       unsigned long __pad2;
+};
diff --git a/libc-top-half/musl/arch/riscv64/bits/posix.h b/libc-top-half/musl/arch/riscv64/bits/posix.h
new file mode 100644 (file)
index 0000000..8068ce9
--- /dev/null
@@ -0,0 +1,2 @@
+#define _POSIX_V6_LP64_OFF64 1
+#define _POSIX_V7_LP64_OFF64 1
diff --git a/libc-top-half/musl/arch/riscv64/bits/reg.h b/libc-top-half/musl/arch/riscv64/bits/reg.h
new file mode 100644 (file)
index 0000000..c800788
--- /dev/null
@@ -0,0 +1,8 @@
+#undef __WORDSIZE
+#define __WORDSIZE 64
+#define REG_PC 0
+#define REG_RA 1
+#define REG_SP 2
+#define REG_TP 4
+#define REG_S0 8
+#define REG_A0 10
diff --git a/libc-top-half/musl/arch/riscv64/bits/sem.h b/libc-top-half/musl/arch/riscv64/bits/sem.h
new file mode 100644 (file)
index 0000000..5f93c12
--- /dev/null
@@ -0,0 +1,9 @@
+struct semid_ds {
+       struct ipc_perm sem_perm;
+       time_t sem_otime;
+       time_t sem_ctime;
+       unsigned short sem_nsems;
+       char __sem_nsems_pad[sizeof(time_t)-sizeof(short)];
+       time_t __unused3;
+       time_t __unused4;
+};
diff --git a/libc-top-half/musl/arch/riscv64/bits/setjmp.h b/libc-top-half/musl/arch/riscv64/bits/setjmp.h
new file mode 100644 (file)
index 0000000..ad7e401
--- /dev/null
@@ -0,0 +1 @@
+typedef unsigned long __jmp_buf[26];
diff --git a/libc-top-half/musl/arch/riscv64/bits/shm.h b/libc-top-half/musl/arch/riscv64/bits/shm.h
new file mode 100644 (file)
index 0000000..4c3c9fb
--- /dev/null
@@ -0,0 +1,25 @@
+#define SHMLBA 4096
+
+struct shmid_ds
+{
+       struct ipc_perm shm_perm;
+       size_t shm_segsz;
+       time_t shm_atime;
+       time_t shm_dtime;
+       time_t shm_ctime;
+       pid_t shm_cpid;
+       pid_t shm_lpid;
+       unsigned long shm_nattch;
+       unsigned long __pad1;
+       unsigned long __pad2;
+};
+
+struct shminfo {
+       unsigned long shmmax, shmmin, shmmni, shmseg, shmall, __unused[4];
+};
+
+struct shm_info {
+       int __used_ids;
+       unsigned long shm_tot, shm_rss, shm_swp;
+       unsigned long __swap_attempts, __swap_successes;
+};
diff --git a/libc-top-half/musl/arch/riscv64/bits/signal.h b/libc-top-half/musl/arch/riscv64/bits/signal.h
new file mode 100644 (file)
index 0000000..4c94a8f
--- /dev/null
@@ -0,0 +1,112 @@
+#if defined(_POSIX_SOURCE) || defined(_POSIX_C_SOURCE) \
+ || defined(_XOPEN_SOURCE) || defined(_GNU_SOURCE) || defined(_BSD_SOURCE)
+
+#if defined(_XOPEN_SOURCE) || defined(_GNU_SOURCE) || defined(_BSD_SOURCE)
+# define MINSIGSTKSZ 2048
+# define SIGSTKSZ 8192
+#endif
+
+/* gregs[0] holds the program counter. */
+
+#if defined(_GNU_SOURCE) || defined(_BSD_SOURCE)
+typedef unsigned long greg_t;
+typedef unsigned long gregset_t[32];
+
+struct __riscv_f_ext_state {
+       unsigned int f[32];
+       unsigned int fcsr;
+};
+
+struct __riscv_d_ext_state {
+       unsigned long long f[32];
+       unsigned int fcsr;
+};
+
+struct __riscv_q_ext_state {
+       unsigned long long f[64] __attribute__((aligned(16)));
+       unsigned int fcsr;
+       unsigned int reserved[3];
+};
+
+union __riscv_fp_state {
+       struct __riscv_f_ext_state f;
+       struct __riscv_d_ext_state d;
+       struct __riscv_q_ext_state q;
+};
+
+typedef union __riscv_fp_state fpregset_t;
+
+typedef struct sigcontext {
+       gregset_t gregs;
+       fpregset_t fpregs;
+} mcontext_t;
+
+#else
+typedef struct {
+       unsigned long gregs[32];
+       unsigned long long fpregs[66];
+} mcontext_t;
+#endif
+
+struct sigaltstack {
+       void *ss_sp;
+       int ss_flags;
+       size_t ss_size;
+};
+
+typedef struct __ucontext
+{
+       unsigned long uc_flags;
+       struct __ucontext *uc_link;
+       stack_t uc_stack;
+       sigset_t uc_sigmask;
+       mcontext_t uc_mcontext;
+} ucontext_t;
+
+#define SA_NOCLDSTOP 1
+#define SA_NOCLDWAIT 2
+#define SA_SIGINFO   4
+#define SA_ONSTACK   0x08000000
+#define SA_RESTART   0x10000000
+#define SA_NODEFER   0x40000000
+#define SA_RESETHAND 0x80000000
+#define SA_RESTORER  0x04000000
+
+#endif
+
+#define SIGHUP     1
+#define SIGINT     2
+#define SIGQUIT    3
+#define SIGILL     4
+#define SIGTRAP    5
+#define SIGABRT    6
+#define SIGIOT     SIGABRT
+#define SIGBUS     7
+#define SIGFPE     8
+#define SIGKILL    9
+#define SIGUSR1   10
+#define SIGSEGV   11
+#define SIGUSR2   12
+#define SIGPIPE   13
+#define SIGALRM   14
+#define SIGTERM   15
+#define SIGSTKFLT 16
+#define SIGCHLD   17
+#define SIGCONT   18
+#define SIGSTOP   19
+#define SIGTSTP   20
+#define SIGTTIN   21
+#define SIGTTOU   22
+#define SIGURG    23
+#define SIGXCPU   24
+#define SIGXFSZ   25
+#define SIGVTALRM 26
+#define SIGPROF   27
+#define SIGWINCH  28
+#define SIGIO     29
+#define SIGPOLL   SIGIO
+#define SIGPWR    30
+#define SIGSYS    31
+#define SIGUNUSED SIGSYS
+
+#define _NSIG     65
diff --git a/libc-top-half/musl/arch/riscv64/bits/socket.h b/libc-top-half/musl/arch/riscv64/bits/socket.h
new file mode 100644 (file)
index 0000000..aae537d
--- /dev/null
@@ -0,0 +1,19 @@
+#include <endian.h>
+
+struct msghdr {
+       void *msg_name;
+       socklen_t msg_namelen;
+       struct iovec *msg_iov;
+       int msg_iovlen, __pad1;
+       void *msg_control;
+       socklen_t msg_controllen;
+       int __pad2;
+       int msg_flags;
+};
+
+struct cmsghdr {
+       socklen_t cmsg_len;
+       int __pad1;
+       int cmsg_level;
+       int cmsg_type;
+};
diff --git a/libc-top-half/musl/arch/riscv64/bits/stat.h b/libc-top-half/musl/arch/riscv64/bits/stat.h
new file mode 100644 (file)
index 0000000..b7f4221
--- /dev/null
@@ -0,0 +1,18 @@
+struct stat {
+       dev_t st_dev;
+       ino_t st_ino;
+       mode_t st_mode;
+       nlink_t st_nlink;
+       uid_t st_uid;
+       gid_t st_gid;
+       dev_t st_rdev;
+       unsigned long __pad;
+       off_t st_size;
+       blksize_t st_blksize;
+       int __pad2;
+       blkcnt_t st_blocks;
+       struct timespec st_atim;
+       struct timespec st_mtim;
+       struct timespec st_ctim;
+       unsigned __unused[2];
+};
diff --git a/libc-top-half/musl/arch/riscv64/bits/stdint.h b/libc-top-half/musl/arch/riscv64/bits/stdint.h
new file mode 100644 (file)
index 0000000..1bb147f
--- /dev/null
@@ -0,0 +1,20 @@
+typedef int32_t int_fast16_t;
+typedef int32_t int_fast32_t;
+typedef uint32_t uint_fast16_t;
+typedef uint32_t uint_fast32_t;
+
+#define INT_FAST16_MIN  INT32_MIN
+#define INT_FAST32_MIN  INT32_MIN
+
+#define INT_FAST16_MAX  INT32_MAX
+#define INT_FAST32_MAX  INT32_MAX
+
+#define UINT_FAST16_MAX UINT32_MAX
+#define UINT_FAST32_MAX UINT32_MAX
+
+#define INTPTR_MIN      INT64_MIN
+#define INTPTR_MAX      INT64_MAX
+#define UINTPTR_MAX     UINT64_MAX
+#define PTRDIFF_MIN     INT64_MIN
+#define PTRDIFF_MAX     INT64_MAX
+#define SIZE_MAX        UINT64_MAX
diff --git a/libc-top-half/musl/arch/riscv64/bits/syscall.h.in b/libc-top-half/musl/arch/riscv64/bits/syscall.h.in
new file mode 100644 (file)
index 0000000..03d7f86
--- /dev/null
@@ -0,0 +1,277 @@
+#define __NR_io_setup 0
+#define __NR_io_destroy 1
+#define __NR_io_submit 2
+#define __NR_io_cancel 3
+#define __NR_io_getevents 4
+#define __NR_setxattr 5
+#define __NR_lsetxattr 6
+#define __NR_fsetxattr 7
+#define __NR_getxattr 8
+#define __NR_lgetxattr 9
+#define __NR_fgetxattr 10
+#define __NR_listxattr 11
+#define __NR_llistxattr 12
+#define __NR_flistxattr 13
+#define __NR_removexattr 14
+#define __NR_lremovexattr 15
+#define __NR_fremovexattr 16
+#define __NR_getcwd 17
+#define __NR_lookup_dcookie 18
+#define __NR_eventfd2 19
+#define __NR_epoll_create1 20
+#define __NR_epoll_ctl 21
+#define __NR_epoll_pwait 22
+#define __NR_dup 23
+#define __NR_dup3 24
+#define __NR_fcntl 25
+#define __NR_inotify_init1 26
+#define __NR_inotify_add_watch 27
+#define __NR_inotify_rm_watch 28
+#define __NR_ioctl 29
+#define __NR_ioprio_set 30
+#define __NR_ioprio_get 31
+#define __NR_flock 32
+#define __NR_mknodat 33
+#define __NR_mkdirat 34
+#define __NR_unlinkat 35
+#define __NR_symlinkat 36
+#define __NR_linkat 37
+#define __NR_umount2 39
+#define __NR_mount 40
+#define __NR_pivot_root 41
+#define __NR_nfsservctl 42
+#define __NR_statfs 43
+#define __NR_fstatfs 44
+#define __NR_truncate 45
+#define __NR_ftruncate 46
+#define __NR_fallocate 47
+#define __NR_faccessat 48
+#define __NR_chdir 49
+#define __NR_fchdir 50
+#define __NR_chroot 51
+#define __NR_fchmod 52
+#define __NR_fchmodat 53
+#define __NR_fchownat 54
+#define __NR_fchown 55
+#define __NR_openat 56
+#define __NR_close 57
+#define __NR_vhangup 58
+#define __NR_pipe2 59
+#define __NR_quotactl 60
+#define __NR_getdents64 61
+#define __NR_lseek 62
+#define __NR_read 63
+#define __NR_write 64
+#define __NR_readv 65
+#define __NR_writev 66
+#define __NR_pread64 67
+#define __NR_pwrite64 68
+#define __NR_preadv 69
+#define __NR_pwritev 70
+#define __NR_sendfile 71
+#define __NR_pselect6 72
+#define __NR_ppoll 73
+#define __NR_signalfd4 74
+#define __NR_vmsplice 75
+#define __NR_splice 76
+#define __NR_tee 77
+#define __NR_readlinkat 78
+#define __NR_fstatat 79
+#define __NR_fstat 80
+#define __NR_sync 81
+#define __NR_fsync 82
+#define __NR_fdatasync 83
+#define __NR_sync_file_range 84
+#define __NR_timerfd_create 85
+#define __NR_timerfd_settime 86
+#define __NR_timerfd_gettime 87
+#define __NR_utimensat 88
+#define __NR_acct 89
+#define __NR_capget 90
+#define __NR_capset 91
+#define __NR_personality 92
+#define __NR_exit 93
+#define __NR_exit_group 94
+#define __NR_waitid 95
+#define __NR_set_tid_address 96
+#define __NR_unshare 97
+#define __NR_futex 98
+#define __NR_set_robust_list 99
+#define __NR_get_robust_list 100
+#define __NR_nanosleep 101
+#define __NR_getitimer 102
+#define __NR_setitimer 103
+#define __NR_kexec_load 104
+#define __NR_init_module 105
+#define __NR_delete_module 106
+#define __NR_timer_create 107
+#define __NR_timer_gettime 108
+#define __NR_timer_getoverrun 109
+#define __NR_timer_settime 110
+#define __NR_timer_delete 111
+#define __NR_clock_settime 112
+#define __NR_clock_gettime 113
+#define __NR_clock_getres 114
+#define __NR_clock_nanosleep 115
+#define __NR_syslog 116
+#define __NR_ptrace 117
+#define __NR_sched_setparam 118
+#define __NR_sched_setscheduler 119
+#define __NR_sched_getscheduler 120
+#define __NR_sched_getparam 121
+#define __NR_sched_setaffinity 122
+#define __NR_sched_getaffinity 123
+#define __NR_sched_yield 124
+#define __NR_sched_get_priority_max 125
+#define __NR_sched_get_priority_min 126
+#define __NR_sched_rr_get_interval 127
+#define __NR_restart_syscall 128
+#define __NR_kill 129
+#define __NR_tkill 130
+#define __NR_tgkill 131
+#define __NR_sigaltstack 132
+#define __NR_rt_sigsuspend 133
+#define __NR_rt_sigaction 134
+#define __NR_rt_sigprocmask 135
+#define __NR_rt_sigpending 136
+#define __NR_rt_sigtimedwait 137
+#define __NR_rt_sigqueueinfo 138
+#define __NR_rt_sigreturn 139
+#define __NR_setpriority 140
+#define __NR_getpriority 141
+#define __NR_reboot 142
+#define __NR_setregid 143
+#define __NR_setgid 144
+#define __NR_setreuid 145
+#define __NR_setuid 146
+#define __NR_setresuid 147
+#define __NR_getresuid 148
+#define __NR_setresgid 149
+#define __NR_getresgid 150
+#define __NR_setfsuid 151
+#define __NR_setfsgid 152
+#define __NR_times 153
+#define __NR_setpgid 154
+#define __NR_getpgid 155
+#define __NR_getsid 156
+#define __NR_setsid 157
+#define __NR_getgroups 158
+#define __NR_setgroups 159
+#define __NR_uname 160
+#define __NR_sethostname 161
+#define __NR_setdomainname 162
+#define __NR_getrlimit 163
+#define __NR_setrlimit 164
+#define __NR_getrusage 165
+#define __NR_umask 166
+#define __NR_prctl 167
+#define __NR_getcpu 168
+#define __NR_gettimeofday 169
+#define __NR_settimeofday 170
+#define __NR_adjtimex 171
+#define __NR_getpid 172
+#define __NR_getppid 173
+#define __NR_getuid 174
+#define __NR_geteuid 175
+#define __NR_getgid 176
+#define __NR_getegid 177
+#define __NR_gettid 178
+#define __NR_sysinfo 179
+#define __NR_mq_open 180
+#define __NR_mq_unlink 181
+#define __NR_mq_timedsend 182
+#define __NR_mq_timedreceive 183
+#define __NR_mq_notify 184
+#define __NR_mq_getsetattr 185
+#define __NR_msgget 186
+#define __NR_msgctl 187
+#define __NR_msgrcv 188
+#define __NR_msgsnd 189
+#define __NR_semget 190
+#define __NR_semctl 191
+#define __NR_semtimedop 192
+#define __NR_semop 193
+#define __NR_shmget 194
+#define __NR_shmctl 195
+#define __NR_shmat 196
+#define __NR_shmdt 197
+#define __NR_socket 198
+#define __NR_socketpair 199
+#define __NR_bind 200
+#define __NR_listen 201
+#define __NR_accept 202
+#define __NR_connect 203
+#define __NR_getsockname 204
+#define __NR_getpeername 205
+#define __NR_sendto 206
+#define __NR_recvfrom 207
+#define __NR_setsockopt 208
+#define __NR_getsockopt 209
+#define __NR_shutdown 210
+#define __NR_sendmsg 211
+#define __NR_recvmsg 212
+#define __NR_readahead 213
+#define __NR_brk 214
+#define __NR_munmap 215
+#define __NR_mremap 216
+#define __NR_add_key 217
+#define __NR_request_key 218
+#define __NR_keyctl 219
+#define __NR_clone 220
+#define __NR_execve 221
+#define __NR_mmap 222
+#define __NR_fadvise64 223
+#define __NR_swapon 224
+#define __NR_swapoff 225
+#define __NR_mprotect 226
+#define __NR_msync 227
+#define __NR_mlock 228
+#define __NR_munlock 229
+#define __NR_mlockall 230
+#define __NR_munlockall 231
+#define __NR_mincore 232
+#define __NR_madvise 233
+#define __NR_remap_file_pages 234
+#define __NR_mbind 235
+#define __NR_get_mempolicy 236
+#define __NR_set_mempolicy 237
+#define __NR_migrate_pages 238
+#define __NR_move_pages 239
+#define __NR_rt_tgsigqueueinfo 240
+#define __NR_perf_event_open 241
+#define __NR_accept4 242
+#define __NR_recvmmsg 243
+#define __NR_arch_specific_syscall 244
+#define __NR_wait4 260
+#define __NR_prlimit64 261
+#define __NR_fanotify_init 262
+#define __NR_fanotify_mark 263
+#define __NR_name_to_handle_at 264
+#define __NR_open_by_handle_at 265
+#define __NR_clock_adjtime 266
+#define __NR_syncfs 267
+#define __NR_setns 268
+#define __NR_sendmmsg 269
+#define __NR_process_vm_readv 270
+#define __NR_process_vm_writev 271
+#define __NR_kcmp 272
+#define __NR_finit_module 273
+#define __NR_sched_setattr 274
+#define __NR_sched_getattr 275
+#define __NR_renameat2 276
+#define __NR_seccomp 277
+#define __NR_getrandom 278
+#define __NR_memfd_create 279
+#define __NR_bpf 280
+#define __NR_execveat 281
+#define __NR_userfaultfd 282
+#define __NR_membarrier 283
+#define __NR_mlock2 284
+#define __NR_copy_file_range 285
+#define __NR_preadv2 286
+#define __NR_pwritev2 287
+#define __NR_pkey_mprotect 288
+#define __NR_pkey_alloc 289
+#define __NR_pkey_free 290
+#define __NR_sysriscv __NR_arch_specific_syscall
+#define __NR_riscv_flush_icache (__NR_sysriscv + 15)
diff --git a/libc-top-half/musl/arch/riscv64/bits/user.h b/libc-top-half/musl/arch/riscv64/bits/user.h
new file mode 100644 (file)
index 0000000..bd0f0fc
--- /dev/null
@@ -0,0 +1,43 @@
+struct user_regs_struct {
+       unsigned long pc;
+       unsigned long ra;
+       unsigned long sp;
+       unsigned long gp;
+       unsigned long tp;
+       unsigned long t0;
+       unsigned long t1;
+       unsigned long t2;
+       unsigned long s0;
+       unsigned long s1;
+       unsigned long a0;
+       unsigned long a1;
+       unsigned long a2;
+       unsigned long a3;
+       unsigned long a4;
+       unsigned long a5;
+       unsigned long a6;
+       unsigned long a7;
+       unsigned long s2;
+       unsigned long s3;
+       unsigned long s4;
+       unsigned long s5;
+       unsigned long s6;
+       unsigned long s7;
+       unsigned long s8;
+       unsigned long s9;
+       unsigned long s10;
+       unsigned long s11;
+       unsigned long t3;
+       unsigned long t4;
+       unsigned long t5;
+       unsigned long t6;
+};
+
+struct user_fpregs_struct {
+       double f[32];
+       unsigned int fcsr;
+};
+
+#define ELF_NGREG 32
+typedef unsigned long elf_greg_t, elf_gregset_t[ELF_NGREG];
+typedef struct user_fpregs_struct elf_fpregset_t;
diff --git a/libc-top-half/musl/arch/riscv64/crt_arch.h b/libc-top-half/musl/arch/riscv64/crt_arch.h
new file mode 100644 (file)
index 0000000..6b93fcf
--- /dev/null
@@ -0,0 +1,19 @@
+__asm__(
+".section .sdata,\"aw\"\n"
+".text\n"
+".global " START "\n"
+".type " START ",%function\n"
+START ":\n"
+".weak __global_pointer$\n"
+".hidden __global_pointer$\n"
+".option push\n"
+".option norelax\n\t"
+"lla gp, __global_pointer$\n"
+".option pop\n\t"
+"mv a0, sp\n"
+".weak _DYNAMIC\n"
+".hidden _DYNAMIC\n\t"
+"lla a1, _DYNAMIC\n\t"
+"andi sp, sp, -16\n\t"
+"tail " START "_c"
+);
diff --git a/libc-top-half/musl/arch/riscv64/pthread_arch.h b/libc-top-half/musl/arch/riscv64/pthread_arch.h
new file mode 100644 (file)
index 0000000..1268b72
--- /dev/null
@@ -0,0 +1,14 @@
+static inline struct pthread *__pthread_self()
+{
+       char *tp;
+       __asm__ __volatile__("mv %0, tp" : "=r"(tp));
+       return (void *)(tp - sizeof(struct pthread));
+}
+
+#define TLS_ABOVE_TP
+#define GAP_ABOVE_TP 0
+#define TP_ADJ(p) ((char *)p + sizeof(struct pthread))
+
+#define DTP_OFFSET 0x800
+
+#define MC_PC gregs[0]
diff --git a/libc-top-half/musl/arch/riscv64/reloc.h b/libc-top-half/musl/arch/riscv64/reloc.h
new file mode 100644 (file)
index 0000000..1ca1381
--- /dev/null
@@ -0,0 +1,22 @@
+#if defined __riscv_float_abi_soft
+#define RISCV_FP_SUFFIX "-sf"
+#elif defined __riscv_float_abi_single
+#define RISCV_FP_SUFFIX "-sp"
+#elif defined __riscv_float_abi_double
+#define RISCV_FP_SUFFIX ""
+#endif
+
+#define LDSO_ARCH "riscv64" RISCV_FP_SUFFIX
+
+#define TPOFF_K 0
+
+#define REL_SYMBOLIC    R_RISCV_64
+#define REL_PLT         R_RISCV_JUMP_SLOT
+#define REL_RELATIVE    R_RISCV_RELATIVE
+#define REL_COPY        R_RISCV_COPY
+#define REL_DTPMOD      R_RISCV_TLS_DTPMOD64
+#define REL_DTPOFF      R_RISCV_TLS_DTPREL64
+#define REL_TPOFF       R_RISCV_TLS_TPREL64
+
+#define CRTJMP(pc,sp) __asm__ __volatile__( \
+       "mv sp, %1 ; jr %0" : : "r"(pc), "r"(sp) : "memory" )
diff --git a/libc-top-half/musl/arch/riscv64/syscall_arch.h b/libc-top-half/musl/arch/riscv64/syscall_arch.h
new file mode 100644 (file)
index 0000000..1aaeb63
--- /dev/null
@@ -0,0 +1,76 @@
+#define __SYSCALL_LL_E(x) (x)
+#define __SYSCALL_LL_O(x) (x)
+
+#define __asm_syscall(...) \
+       __asm__ __volatile__ ("ecall\n\t" \
+       : "+r"(a0) : __VA_ARGS__ : "memory"); \
+       return a0; \
+
+static inline long __syscall0(long n)
+{
+       register long a7 __asm__("a7") = n;
+       register long a0 __asm__("a0");
+       __asm_syscall("r"(a7))
+}
+
+static inline long __syscall1(long n, long a)
+{
+       register long a7 __asm__("a7") = n;
+       register long a0 __asm__("a0") = a;
+       __asm_syscall("r"(a7), "0"(a0))
+}
+
+static inline long __syscall2(long n, long a, long b)
+{
+       register long a7 __asm__("a7") = n;
+       register long a0 __asm__("a0") = a;
+       register long a1 __asm__("a1") = b;
+       __asm_syscall("r"(a7), "0"(a0), "r"(a1))
+}
+
+static inline long __syscall3(long n, long a, long b, long c)
+{
+       register long a7 __asm__("a7") = n;
+       register long a0 __asm__("a0") = a;
+       register long a1 __asm__("a1") = b;
+       register long a2 __asm__("a2") = c;
+       __asm_syscall("r"(a7), "0"(a0), "r"(a1), "r"(a2))
+}
+
+static inline long __syscall4(long n, long a, long b, long c, long d)
+{
+       register long a7 __asm__("a7") = n;
+       register long a0 __asm__("a0") = a;
+       register long a1 __asm__("a1") = b;
+       register long a2 __asm__("a2") = c;
+       register long a3 __asm__("a3") = d;
+       __asm_syscall("r"(a7), "0"(a0), "r"(a1), "r"(a2), "r"(a3))
+}
+
+static inline long __syscall5(long n, long a, long b, long c, long d, long e)
+{
+       register long a7 __asm__("a7") = n;
+       register long a0 __asm__("a0") = a;
+       register long a1 __asm__("a1") = b;
+       register long a2 __asm__("a2") = c;
+       register long a3 __asm__("a3") = d;
+       register long a4 __asm__("a4") = e;
+       __asm_syscall("r"(a7), "0"(a0), "r"(a1), "r"(a2), "r"(a3), "r"(a4))
+}
+
+static inline long __syscall6(long n, long a, long b, long c, long d, long e, long f)
+{
+       register long a7 __asm__("a7") = n;
+       register long a0 __asm__("a0") = a;
+       register long a1 __asm__("a1") = b;
+       register long a2 __asm__("a2") = c;
+       register long a3 __asm__("a3") = d;
+       register long a4 __asm__("a4") = e;
+       register long a5 __asm__("a5") = f;
+       __asm_syscall("r"(a7), "0"(a0), "r"(a1), "r"(a2), "r"(a3), "r"(a4), "r"(a5))
+}
+
+#define VDSO_USEFUL
+/* We don't have a clock_gettime function.
+#define VDSO_CGT_SYM "__vdso_clock_gettime"
+#define VDSO_CGT_VER "LINUX_2.6" */
index 2b81bfec98246781cebe123cf6c2d4cc1b4b1701..bd4b20c4298ac1c0a22e2650a636ea2009bf229e 100644 (file)
@@ -15,30 +15,3 @@ struct cmsghdr {
        int cmsg_level;
        int cmsg_type;
 };
-
-#define SO_DEBUG        1
-#define SO_REUSEADDR    2
-#define SO_TYPE         3
-#define SO_ERROR        4
-#define SO_DONTROUTE    5
-#define SO_BROADCAST    6
-#define SO_SNDBUF       7
-#define SO_RCVBUF       8
-#define SO_KEEPALIVE    9
-#define SO_OOBINLINE    10
-#define SO_NO_CHECK     11
-#define SO_PRIORITY     12
-#define SO_LINGER       13
-#define SO_BSDCOMPAT    14
-#define SO_REUSEPORT    15
-#define SO_PASSCRED     16
-#define SO_PEERCRED     17
-#define SO_RCVLOWAT     18
-#define SO_SNDLOWAT     19
-#define SO_RCVTIMEO     20
-#define SO_SNDTIMEO     21
-#define SO_ACCEPTCONN   30
-#define SO_SNDBUFFORCE  32
-#define SO_RCVBUFFORCE  33
-#define SO_PROTOCOL     38
-#define SO_DOMAIN       39
index 85a18e792bcb27e9c4b9479b2d9cd66fa4ed1a1f..72fd2cce1f3f47bec3155dadd1efac47e773870b 100644 (file)
 #define __NR_kexec_file_load            381
 #define __NR_io_pgetevents              382
 #define __NR_rseq                       383
+#define __NR_pkey_mprotect              384
+#define __NR_pkey_alloc                 385
+#define __NR_pkey_free                  386
+#define __NR_semtimedop                 392
+#define __NR_semget                     393
+#define __NR_semctl                     394
+#define __NR_shmget                     395
+#define __NR_shmctl                     396
+#define __NR_shmat                      397
+#define __NR_shmdt                      398
+#define __NR_msgget                     399
+#define __NR_msgsnd                     400
+#define __NR_msgrcv                     401
+#define __NR_msgctl                     402
+#define __NR_pidfd_send_signal          424
+#define __NR_io_uring_setup             425
+#define __NR_io_uring_enter             426
+#define __NR_io_uring_register          427
 
index 420f4a0fdad9410bb1e2eb680f0d0b8561fc5730..ad35fc64ee6dfc98de3478227aa1b598595bb5ad 100644 (file)
 #define __NR_copy_file_range        380
 #define __NR_preadv2                381
 #define __NR_pwritev2               382
+#define __NR_statx                  383
+#define __NR_pkey_mprotect          384
+#define __NR_pkey_alloc             385
+#define __NR_pkey_free              386
+#define __NR_rseq                   387
+#define __NR_semget                 393
+#define __NR_semctl                 394
+#define __NR_shmget                 395
+#define __NR_shmctl                 396
+#define __NR_shmat                  397
+#define __NR_shmdt                  398
+#define __NR_msgget                 399
+#define __NR_msgsnd                 400
+#define __NR_msgrcv                 401
+#define __NR_msgctl                 402
+#define __NR_clock_gettime64        403
+#define __NR_clock_settime64        404
+#define __NR_clock_adjtime64        405
+#define __NR_clock_getres_time64    406
+#define __NR_clock_nanosleep_time64 407
+#define __NR_timer_gettime64        408
+#define __NR_timer_settime64        409
+#define __NR_timerfd_gettime64      410
+#define __NR_timerfd_settime64      411
+#define __NR_utimensat_time64       412
+#define __NR_pselect6_time64        413
+#define __NR_ppoll_time64           414
+#define __NR_io_pgetevents_time64   416
+#define __NR_recvmmsg_time64        417
+#define __NR_mq_timedsend_time64    418
+#define __NR_mq_timedreceive_time64 419
+#define __NR_semtimedop_time64      420
+#define __NR_rt_sigtimedwait_time64 421
+#define __NR_futex_time64           422
+#define __NR_sched_rr_get_interval_time64 423
+#define __NR_pidfd_send_signal      424
+#define __NR_io_uring_setup         425
+#define __NR_io_uring_enter         426
+#define __NR_io_uring_register      427
 
diff --git a/libc-top-half/musl/arch/wasm32/fp_arch.h b/libc-top-half/musl/arch/wasm32/fp_arch.h
new file mode 100644 (file)
index 0000000..707d512
--- /dev/null
@@ -0,0 +1,25 @@
+// WebAssembly has no floating-point exceptions or alternate rounding modes,
+// so there's no need to prevent expressions from moving or force their
+// evaluation.
+
+#define fp_barrierf fp_barrierf
+static inline float fp_barrierf(float x)
+{
+       return x;
+}
+
+#define fp_barrier fp_barrier
+static inline double fp_barrier(double x)
+{
+       return x;
+}
+
+#define fp_force_evalf fp_force_evalf
+static inline void fp_force_evalf(float x)
+{
+}
+
+#define fp_force_eval fp_force_eval
+static inline void fp_force_eval(double x)
+{
+}
index 67d89f9114f800d8118bc9a6254a3d3f96dde1d1..77ec432fe5884b48264a054d1db126fc99df6a5d 100644 (file)
 #define __NR_statx (0x40000000 + 332)
 #define __NR_io_pgetevents (0x40000000 + 333)
 #define __NR_rseq (0x40000000 + 334)
+#define __NR_pidfd_send_signal (0x40000000 + 424)
+#define __NR_io_uring_setup (0x40000000 + 425)
+#define __NR_io_uring_enter (0x40000000 + 426)
+#define __NR_io_uring_register (0x40000000 + 427)
 
 #define __NR_rt_sigaction (0x40000000 + 512)
 #define __NR_rt_sigreturn (0x40000000 + 513)
index 9cdb7789503d626a7ef223d18351d1b94ed0eedc..49572ef2defd83500963ee05419d85e33986ebc9 100644 (file)
 #define __NR_statx                             332
 #define __NR_io_pgetevents                     333
 #define __NR_rseq                              334
+#define __NR_pidfd_send_signal                 424
+#define __NR_io_uring_setup                    425
+#define __NR_io_uring_enter                    426
+#define __NR_io_uring_register                 427
 
index c43619099a6046f451bb511142fe3f497d635696..ae13e0e5796d08dd005f5df06c2097ffeb593563 100755 (executable)
@@ -172,6 +172,8 @@ case "$arg" in
 --host=*|--target=*) target=${arg#*=} ;;
 --build=*) build=${arg#*=} ;;
 -* ) echo "$0: unknown option $arg" ;;
+AR=*) AR=${arg#*=} ;;
+RANLIB=*) RANLIB=${arg#*=} ;;
 CC=*) CC=${arg#*=} ;;
 CFLAGS=*) CFLAGS=${arg#*=} ;;
 CPPFLAGS=*) CPPFLAGS=${arg#*=} ;;
@@ -322,6 +324,7 @@ microblaze*) ARCH=microblaze ;;
 or1k*) ARCH=or1k ;;
 powerpc64*|ppc64*) ARCH=powerpc64 ;;
 powerpc*|ppc*) ARCH=powerpc ;;
+riscv64*) ARCH=riscv64 ;;
 sh[1-9bel-]*|sh|superh*) ARCH=sh ;;
 s390x*) ARCH=s390x ;;
 wasm32) ARCH=wasm32 ;;
@@ -575,6 +578,20 @@ printf "using compiler runtime libraries: %s\n" "$LIBCC"
 SUBARCH=
 t="$CFLAGS_C99FSE $CPPFLAGS $CFLAGS"
 
+if test "$ARCH" = "i386" ; then
+printf "checking whether compiler can use ebx in PIC asm constraints... "
+cat > "$tmpc" <<EOF
+int foo(int x) { __asm__ ( "" : "+b"(x) ); return x; }
+EOF
+if $CC $CFLAGS_C99FSE $CPPFLAGS $CFLAGS -fPIC \
+  -c -o /dev/null "$tmpc" >/dev/null 2>&1 ; then
+printf "yes\n"
+else
+printf "no\n"
+CFLAGS_AUTO="$CFLAGS_AUTO -DBROKEN_EBX_ASM"
+fi
+fi
+
 if test "$ARCH" = "x86_64" ; then
 trycppif __ILP32__ "$t" && ARCH=x32
 fi
@@ -642,6 +659,11 @@ trycppif __LITTLE_ENDIAN__ "$t" && SUBARCH=${SUBARCH}le
 trycppif _SOFT_FLOAT "$t" && fail "$0: error: soft-float not supported on powerpc64"
 fi
 
+if test "$ARCH" = "riscv64" ; then
+trycppif __riscv_float_abi_soft "$t" && SUBARCH=${SUBARCH}-sf
+trycppif __riscv_float_abi_single "$t" && SUBARCH=${SUBARCH}-sp
+fi
+
 if test "$ARCH" = "sh" ; then
 tryflag CFLAGS_AUTO -Wa,--isa=any
 trycppif __BIG_ENDIAN__ "$t" && SUBARCH=${SUBARCH}eb
@@ -716,6 +738,8 @@ cat << EOF
 # This version of config.mak was generated by:
 # $cmdline
 # Any changes made here will be lost if configure is re-run
+AR = ${AR:-\$(CROSS_COMPILE)ar}
+RANLIB = ${RANLIB:-\$(CROSS_COMPILE)ranlib}
 ARCH = $ARCH
 SUBARCH = $SUBARCH
 ASMSUBARCH = $ASMSUBARCH
index 7b12665f173b38663fdc71ebea8a15d104a5d08f..8fe8ab5d8c3ea005ce9e0eb07e72cadb4747b0ab 100644 (file)
@@ -8,7 +8,7 @@
 int main();
 weak void _init();
 weak void _fini();
-_Noreturn int __libc_start_main(int (*)(), int, char **,
+int __libc_start_main(int (*)(), int, char **,
        void (*)(), void(*)(), void(*)());
 
 void _start_c(long *p)
index 7bb3322f5237054ed6a944d1c8cfd01fb8b3f525..901dff6819546c2cdd8d376ba9b1fdc8e08b03c5 100644 (file)
@@ -5,10 +5,10 @@
 int main();
 weak void _init();
 weak void _fini();
-_Noreturn int __libc_start_main(int (*)(), int, char **,
+int __libc_start_main(int (*)(), int, char **,
        void (*)(), void(*)(), void(*)());
 
-hidden _Noreturn void __dls2(unsigned char *base, size_t *sp)
+hidden void __dls2(unsigned char *base, size_t *sp)
 {
        __libc_start_main(main, *sp, (void *)(sp+1), _init, _fini, 0);
 }
index aad522e484508f98b9e7dd322227c0c7330d77bb..549f92c1aa8841b8527f5ca1153d20637132c7f7 100644 (file)
@@ -683,6 +683,8 @@ typedef struct {
 #define NT_ARM_SYSTEM_CALL     0x404
 #define NT_ARM_SVE     0x405
 #define NT_ARM_PAC_MASK        0x406
+#define NT_ARM_PACA_KEYS       0x407
+#define NT_ARM_PACG_KEYS       0x408
 #define NT_METAG_CBUF  0x500
 #define NT_METAG_RPIPE 0x501
 #define NT_METAG_TLS   0x502
@@ -3226,6 +3228,62 @@ enum
 #define R_BPF_NONE             0
 #define R_BPF_MAP_FD           1
 
+#define R_RISCV_NONE            0
+#define R_RISCV_32              1
+#define R_RISCV_64              2
+#define R_RISCV_RELATIVE        3
+#define R_RISCV_COPY            4
+#define R_RISCV_JUMP_SLOT       5
+#define R_RISCV_TLS_DTPMOD32    6
+#define R_RISCV_TLS_DTPMOD64    7
+#define R_RISCV_TLS_DTPREL32    8
+#define R_RISCV_TLS_DTPREL64    9
+#define R_RISCV_TLS_TPREL32     10
+#define R_RISCV_TLS_TPREL64     11
+
+#define R_RISCV_BRANCH          16
+#define R_RISCV_JAL             17
+#define R_RISCV_CALL            18
+#define R_RISCV_CALL_PLT        19
+#define R_RISCV_GOT_HI20        20
+#define R_RISCV_TLS_GOT_HI20    21
+#define R_RISCV_TLS_GD_HI20     22
+#define R_RISCV_PCREL_HI20      23
+#define R_RISCV_PCREL_LO12_I    24
+#define R_RISCV_PCREL_LO12_S    25
+#define R_RISCV_HI20            26
+#define R_RISCV_LO12_I          27
+#define R_RISCV_LO12_S          28
+#define R_RISCV_TPREL_HI20      29
+#define R_RISCV_TPREL_LO12_I    30
+#define R_RISCV_TPREL_LO12_S    31
+#define R_RISCV_TPREL_ADD       32
+#define R_RISCV_ADD8            33
+#define R_RISCV_ADD16           34
+#define R_RISCV_ADD32           35
+#define R_RISCV_ADD64           36
+#define R_RISCV_SUB8            37
+#define R_RISCV_SUB16           38
+#define R_RISCV_SUB32           39
+#define R_RISCV_SUB64           40
+#define R_RISCV_GNU_VTINHERIT   41
+#define R_RISCV_GNU_VTENTRY     42
+#define R_RISCV_ALIGN           43
+#define R_RISCV_RVC_BRANCH      44
+#define R_RISCV_RVC_JUMP        45
+#define R_RISCV_RVC_LUI         46
+#define R_RISCV_GPREL_I         47
+#define R_RISCV_GPREL_S         48
+#define R_RISCV_TPREL_I         49
+#define R_RISCV_TPREL_S         50
+#define R_RISCV_RELAX           51
+#define R_RISCV_SUB6            52
+#define R_RISCV_SET6            53
+#define R_RISCV_SET8            54
+#define R_RISCV_SET16           55
+#define R_RISCV_SET32           56
+#define R_RISCV_32_PCREL        57
+
 #ifdef __cplusplus
 }
 #endif
index f79a51a768bd53f5ff7e7029fe088738e4e104f3..969b6f7b2dec686c7ad13e69c5a37c68412937ce 100644 (file)
@@ -41,8 +41,9 @@ int posix_fadvise(int, off_t, off_t, int);
 int posix_fallocate(int, off_t, off_t);
 
 #ifdef __wasilibc_unmodified_upstream /* Use alternate WASI libc headers */
-#define O_SEARCH  O_PATH
-#define O_EXEC    O_PATH
+#define O_SEARCH   O_PATH
+#define O_EXEC     O_PATH
+#define O_TTY_INIT 0
 
 #define O_ACCMODE (03|O_SEARCH)
 #define O_RDONLY  00
@@ -133,6 +134,7 @@ int posix_fallocate(int, off_t, off_t);
 #define F_SEAL_SHRINK  0x0002
 #define F_SEAL_GROW    0x0004
 #define F_SEAL_WRITE   0x0008
+#define F_SEAL_FUTURE_WRITE    0x0010
 
 #define F_GET_RW_HINT          1035
 #define F_SET_RW_HINT          1036
index db4b9d29b1640d22e8ad3f984f44ea5203de8a20..515cc66be0b3ba3297ff84f78bd759406b1486d3 100644 (file)
@@ -36,6 +36,18 @@ extern "C" {
 #define FP_SUBNORMAL 3
 #define FP_NORMAL    4
 
+#ifdef __FP_FAST_FMA
+#define FP_FAST_FMA 1
+#endif
+
+#ifdef __FP_FAST_FMAF
+#define FP_FAST_FMAF 1
+#endif
+
+#ifdef __FP_FAST_FMAL
+#define FP_FAST_FMAL 1
+#endif
+
 #ifdef __wasilibc_unmodified_upstream /* Use the compiler's definition of the fpclassify-like operations */
 int __fpclassify(double);
 int __fpclassifyf(float);
index c56f780b02bb1d676eab1f45a53ed4fad538419d..b39685a3e43cad5de07019a6e4dd8d6b2cfcd2b3 100644 (file)
@@ -64,6 +64,7 @@ struct ipv6_mreq {
 #define INADDR_UNSPEC_GROUP     ((in_addr_t) 0xe0000000)
 #define INADDR_ALLHOSTS_GROUP   ((in_addr_t) 0xe0000001)
 #define INADDR_ALLRTRS_GROUP    ((in_addr_t) 0xe0000002)
+#define INADDR_ALLSNOOPERS_GROUP ((in_addr_t) 0xe000006a)
 #define INADDR_MAX_LOCAL_GROUP  ((in_addr_t) 0xe00000ff)
 
 #define IN6ADDR_ANY_INIT      { { { 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0 } } }
@@ -350,6 +351,7 @@ struct ip6_mtuinfo {
 #define IPV6_JOIN_ANYCAST       27
 #define IPV6_LEAVE_ANYCAST      28
 #define IPV6_MULTICAST_ALL      29
+#define IPV6_ROUTER_ALERT_ISOLATE 30
 #define IPV6_IPSEC_POLICY       34
 #define IPV6_XFRM_POLICY        35
 #define IPV6_HDRINCL            36
index daab76b13ba7f99b6de071ec82a0d6a1283bb712..b637c8f58a18318f4f0beae3011fb000d653b14f 100644 (file)
@@ -5,6 +5,8 @@
 extern "C" {
 #endif
 
+#include <sys/statfs.h>
+
 struct fanotify_event_metadata {
        unsigned event_len;
        unsigned char vers;
@@ -19,6 +21,18 @@ struct fanotify_event_metadata {
        int pid;
 };
 
+struct fanotify_event_info_header {
+       unsigned char info_type;
+       unsigned char pad;
+       unsigned short len;
+};
+
+struct fanotify_event_info_fid {
+       struct fanotify_event_info_header hdr;
+       fsid_t fsid;
+       unsigned char handle[];
+};
+
 struct fanotify_response {
        int fd;
        unsigned response;
@@ -26,15 +40,25 @@ struct fanotify_response {
 
 #define FAN_ACCESS 0x01
 #define FAN_MODIFY 0x02
+#define FAN_ATTRIB 0x04
 #define FAN_CLOSE_WRITE 0x08
 #define FAN_CLOSE_NOWRITE 0x10
 #define FAN_OPEN 0x20
+#define FAN_MOVED_FROM 0x40
+#define FAN_MOVED_TO 0x80
+#define FAN_CREATE 0x100
+#define FAN_DELETE 0x200
+#define FAN_DELETE_SELF 0x400
+#define FAN_MOVE_SELF 0x800
+#define FAN_OPEN_EXEC 0x1000
 #define FAN_Q_OVERFLOW 0x4000
 #define FAN_OPEN_PERM 0x10000
 #define FAN_ACCESS_PERM 0x20000
+#define FAN_OPEN_EXEC_PERM 0x40000
 #define FAN_ONDIR 0x40000000
 #define FAN_EVENT_ON_CHILD 0x08000000
 #define FAN_CLOSE (FAN_CLOSE_WRITE | FAN_CLOSE_NOWRITE)
+#define FAN_MOVE (FAN_MOVED_FROM | FAN_MOVED_TO)
 #define FAN_CLOEXEC 0x01
 #define FAN_NONBLOCK 0x02
 #define FAN_CLASS_NOTIF 0
@@ -43,22 +67,30 @@ struct fanotify_response {
 #define FAN_ALL_CLASS_BITS (FAN_CLASS_NOTIF | FAN_CLASS_CONTENT | FAN_CLASS_PRE_CONTENT)
 #define FAN_UNLIMITED_QUEUE 0x10
 #define FAN_UNLIMITED_MARKS 0x20
+#define FAN_ENABLE_AUDIT 0x40
+#define FAN_REPORT_TID 0x100
+#define FAN_REPORT_FID 0x200
 #define FAN_ALL_INIT_FLAGS (FAN_CLOEXEC | FAN_NONBLOCK | FAN_ALL_CLASS_BITS | FAN_UNLIMITED_QUEUE | FAN_UNLIMITED_MARKS)
 #define FAN_MARK_ADD 0x01
 #define FAN_MARK_REMOVE 0x02
 #define FAN_MARK_DONT_FOLLOW 0x04
 #define FAN_MARK_ONLYDIR 0x08
-#define FAN_MARK_MOUNT 0x10
 #define FAN_MARK_IGNORED_MASK 0x20
 #define FAN_MARK_IGNORED_SURV_MODIFY 0x40
 #define FAN_MARK_FLUSH 0x80
+#define FAN_MARK_INODE 0x00
+#define FAN_MARK_MOUNT 0x10
+#define FAN_MARK_FILESYSTEM 0x100
+#define FAN_MARK_TYPE_MASK (FAN_MARK_INODE | FAN_MARK_MOUNT | FAN_MARK_FILESYSTEM)
 #define FAN_ALL_MARK_FLAGS (FAN_MARK_ADD | FAN_MARK_REMOVE | FAN_MARK_DONT_FOLLOW | FAN_MARK_ONLYDIR | FAN_MARK_MOUNT | FAN_MARK_IGNORED_MASK | FAN_MARK_IGNORED_SURV_MODIFY | FAN_MARK_FLUSH)
 #define FAN_ALL_EVENTS (FAN_ACCESS | FAN_MODIFY | FAN_CLOSE | FAN_OPEN)
 #define FAN_ALL_PERM_EVENTS (FAN_OPEN_PERM | FAN_ACCESS_PERM)
 #define FAN_ALL_OUTGOING_EVENTS (FAN_ALL_EVENTS | FAN_ALL_PERM_EVENTS | FAN_Q_OVERFLOW)
 #define FANOTIFY_METADATA_VERSION 3
+#define FAN_EVENT_INFO_TYPE_FID 1
 #define FAN_ALLOW 0x01
 #define FAN_DENY 0x02
+#define FAN_AUDIT 0x10
 #define FAN_NOFD -1
 #define FAN_EVENT_METADATA_LEN (sizeof(struct fanotify_event_metadata))
 #define FAN_EVENT_NEXT(meta, len) ((len) -= (meta)->event_len, (struct fanotify_event_metadata*)(((char *)(meta)) + (meta)->event_len))
index 9cc3a80eb3ee3ef9bef69e0fcd121d958a864c73..07f0d73dc78a5c0e38d1afa94eaf6698178165a1 100644 (file)
@@ -145,6 +145,7 @@ struct prctl_mm_map {
 #define PR_SPEC_ENABLE (1UL << 1)
 #define PR_SPEC_DISABLE (1UL << 2)
 #define PR_SPEC_FORCE_DISABLE (1UL << 3)
+#define PR_SPEC_DISABLE_NOEXEC (1UL << 4)
 
 #define PR_PAC_RESET_KEYS       54
 #define PR_PAC_APIAKEY (1UL << 0)
index 55dcaf5f62e60483c3b4e9e37d4bc7cae36de453..239b038ef8757d1d9254c6742b493503991568af 100644 (file)
@@ -242,6 +242,7 @@ struct linger {
 #define SO_ZEROCOPY             60
 #define SO_TXTIME               61
 #define SCM_TXTIME              SO_TXTIME
+#define SO_BINDTOIFINDEX        62
 
 #ifndef SOL_SOCKET
 #define SOL_SOCKET      1
index 75e489c57345a8d161e73dba60fb6d2d7c1f42b7..0c35541da0754954b9aa13d90322458c92277a53 100644 (file)
@@ -69,7 +69,6 @@ typedef long long quad_t;
 typedef unsigned long long u_quad_t;
 #include <endian.h>
 #include <sys/select.h>
-#include <sys/sysmacros.h>
 #endif
 
 #if defined(_LARGEFILE64_SOURCE) || defined(_GNU_SOURCE)
index 7cb66db972ebbaa070c5c6a572478c9083d4ae3a..d1edb131f7a8e57e1239d325a9149fb148d45e98 100644 (file)
@@ -1,4 +1,5 @@
 #define _GNU_SOURCE
+#define SYSCALL_NO_TLS 1
 #include <stdio.h>
 #include <stdlib.h>
 #include <stdarg.h>
@@ -85,7 +86,6 @@ struct dso {
        size_t relro_start, relro_end;
        uintptr_t *new_dtv;
        unsigned char *new_tls;
-       volatile int new_dtv_idx, new_tls_idx;
        struct td_index *td_index;
        struct dso *fini_next;
        char *shortname;
@@ -1125,9 +1125,9 @@ static struct dso *load_library(const char *name, struct dso *needed_by)
                p->tls_id = ++tls_cnt;
                tls_align = MAXP2(tls_align, p->tls.align);
 #ifdef TLS_ABOVE_TP
-               p->tls.offset = tls_offset + ( (tls_align-1) &
-                       -(tls_offset + (uintptr_t)p->tls.image) );
-               tls_offset += p->tls.size;
+               p->tls.offset = tls_offset + ( (p->tls.align-1) &
+                       (-tls_offset + (uintptr_t)p->tls.image) );
+               tls_offset = p->tls.offset + p->tls.size;
 #else
                tls_offset += p->tls.size + p->tls.align - 1;
                tls_offset -= (tls_offset + (uintptr_t)p->tls.image)
@@ -1644,7 +1644,7 @@ hidden void __dls2(unsigned char *base, size_t *sp)
  * so that loads of the thread pointer and &errno can be pure/const and
  * thereby hoistable. */
 
-_Noreturn void __dls2b(size_t *sp)
+void __dls2b(size_t *sp)
 {
        /* Setup early thread pointer in builtin_tls for ldso/libc itself to
         * use during dynamic linking. If possible it will also serve as the
@@ -1665,7 +1665,7 @@ _Noreturn void __dls2b(size_t *sp)
  * process dependencies and relocations for the main application and
  * transfer control to its entry point. */
 
-_Noreturn void __dls3(size_t *sp)
+void __dls3(size_t *sp)
 {
        static struct dso app, vdso;
        size_t aux[AUX_CNT], *auxv;
@@ -1685,6 +1685,8 @@ _Noreturn void __dls3(size_t *sp)
        libc.auxv = auxv = (void *)(argv+i+1);
        decode_vec(auxv, aux, AUX_CNT);
        __hwcap = aux[AT_HWCAP];
+       search_vec(auxv, &__sysinfo, AT_SYSINFO);
+       __pthread_self()->sysinfo = __sysinfo;
        libc.page_size = aux[AT_PAGESZ];
        libc.secure = ((aux[0]&0x7800)!=0x7800 || aux[AT_UID]!=aux[AT_EUID]
                || aux[AT_GID]!=aux[AT_EGID] || aux[AT_SECURE]);
@@ -1794,10 +1796,9 @@ _Noreturn void __dls3(size_t *sp)
                app.tls_id = tls_cnt = 1;
 #ifdef TLS_ABOVE_TP
                app.tls.offset = GAP_ABOVE_TP;
-               app.tls.offset += -GAP_ABOVE_TP & (app.tls.align-1);
-               tls_offset = app.tls.offset + app.tls.size
-                       + ( -((uintptr_t)app.tls.image + app.tls.size)
-                       & (app.tls.align-1) );
+               app.tls.offset += (-GAP_ABOVE_TP + (uintptr_t)app.tls.image)
+                       & (app.tls.align-1);
+               tls_offset = app.tls.offset + app.tls.size;
 #else
                tls_offset = app.tls.offset = app.tls.size
                        + ( -((uintptr_t)app.tls.image + app.tls.size)
@@ -2216,7 +2217,7 @@ int dladdr(const void *addr_arg, Dl_info *info)
                }
        }
 
-       if (bestsym && besterr > bestsym->st_size-1) {
+       if (best && besterr > bestsym->st_size-1) {
                best = 0;
                bestsym = 0;
        }
index 7b6a03d3c1f7d1edf3197c53d19146dd0563dc2b..0799c15d8b16f362eb3f5d5b813c23f124c214a2 100644 (file)
@@ -113,7 +113,7 @@ int lio_listio(int mode, struct aiocb *restrict const *restrict cbs, int cnt, st
 
        if (st) {
                pthread_attr_t a;
-               sigset_t set;
+               sigset_t set, set_old;
                pthread_t td;
 
                if (sev->sigev_notify == SIGEV_THREAD) {
@@ -128,13 +128,13 @@ int lio_listio(int mode, struct aiocb *restrict const *restrict cbs, int cnt, st
                }
                pthread_attr_setdetachstate(&a, PTHREAD_CREATE_DETACHED);
                sigfillset(&set);
-               pthread_sigmask(SIG_BLOCK, &set, &set);
+               pthread_sigmask(SIG_BLOCK, &set, &set_old);
                if (pthread_create(&td, &a, wait_thread, st)) {
                        free(st);
                        errno = EAGAIN;
                        return -1;
                }
-               pthread_sigmask(SIG_SETMASK, &set, 0);
+               pthread_sigmask(SIG_SETMASK, &set_old, 0);
        }
 
        return 0;
index 05ac28c75c6271219bc66d3c1b27a8750161b1bd..003d20af6efb72252438b68d88c0c39e19bb27b3 100644 (file)
@@ -25,7 +25,7 @@
  * SUCH DAMAGE.
  */
 
-#include "libm.h"
+#include "complex_impl.h"
 
 static const uint32_t k = 1799; /* constant for reduction */
 static const double kln2 = 1246.97177782734161156; /* k * ln2 */
index 69b54045afd4a8e953e19e72e1cf7a0f902d4f89..ee5ff2bce7e8f10f4af7f7c79bdfaf19d329b5ae 100644 (file)
@@ -25,7 +25,7 @@
  * SUCH DAMAGE.
  */
 
-#include "libm.h"
+#include "complex_impl.h"
 
 static const uint32_t k = 235; /* constant for reduction */
 static const float kln2 = 162.88958740F; /* k * ln2 */
index f61d364e47d260ec634f191f0a767aff3b2e39ee..c5ad58ab9353a1ca895ca9bc053cac7e67d0883a 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 double cabs(double complex z)
 {
index 30b25c70315ddd7c483db05e99b8b013ff728f39..619f28d39de57c29eb8c5d152634a41c40ecea42 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 float cabsf(float complex z)
 {
index 40a067c1c59f182d7d96957a3286e4dace5e5449..d37e3f2ea5059ca2cceb12742b565f3b38428909 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
 long double cabsl(long double complex z)
index 27c356364c8c6ffe438767352195e791ed03a23f..c39d257b44b52a679a4e6efe61a38eef739e5b3e 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 // FIXME: Hull et al. "Implementing the complex arcsine and arccosine functions using exception handling" 1997
 
index 11852659523a4c0ea22c44ed47eaef26f4d9c1ff..2e048540fac8c261cb7a625f0f2d66bb23aee5c9 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 // FIXME
 
index 8c68cb01fd6039eafaa856a7f3130a425b7504f6..8e42f1ae86ed5556933a3f0dca8b7a6b9130ffcc 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 /* acosh(z) = i acos(z) */
 
index ade01c0907c8322ffcfe0dc084d35f5ec37be246..d7e6b545474dd299bea83bf8a06e73fab49f6413 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 float complex cacoshf(float complex z)
 {
index 65342557f9a545ef935190b3c64b6bdf2c6ceaa5..d3eaee204f6d51a13c8932e0e2e68fe708536b78 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
 long double complex cacoshl(long double complex z)
index 7fd4a2f6b442404b00e9ea133e0e6e90dec8b057..cc20dcd7d954dad8c681bcba7a6ec6767c554636 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
 long double complex cacosl(long double complex z)
index d2d1b4623a7fc77b2d413c363fd2ccef8d892939..dfe9b97a09e10eedbfbb65c72682fd4a49210ec9 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 double carg(double complex z)
 {
index ce183c4b335be96f5fc66daf5459b30cb3afb751..9a6c19b638dde14964a4de1ffd4ad285eebd0b07 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 float cargf(float complex z)
 {
index e0d504782f1fc36aa7fcb70a9e40248f7a9b4be4..88f95f96e9c02e2e8877c771591259f12c2d9d08 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
 long double cargl(long double complex z)
index 01ed61841ea4dc3447b76ec1b9470114a605fc62..3244bebb169349d946a63bd2b7e984be75821294 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 // FIXME
 
index 4fcb76fc57597b6b899cfa72c666b2aaa20b2765..2cda2f086b252dd49378efbfe0c7b2074701d455 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 // FIXME
 
index b57fe8c40ba3bfe94047e8af1f17b12ff9e4dd89..50bf27ce88ea426e67fec4f140560ac5445067a9 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 /* asinh(z) = -i asin(i z) */
 
index a11bf902d86f9cb7dff2ff5984e63d10ec441d85..93d82e5f4f11f8d7c99e8d4963889f4a1401d86f 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 float complex casinhf(float complex z)
 {
index 714f189359071e31c9da7e52f66cb17df35facc9..68ba3ddfce16b0aaea18c9383beb4c0366f28f29 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
 long double complex casinhl(long double complex z)
index 3b7ceba7a31fff8e87c27dbf0a87dcc63407cb8d..072adc450d2b0ac6c224c734469b3b82f79d537a 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
 long double complex casinl(long double complex z)
index 7dc2afeb50330a3293e1b349499df1eb875a5a59..ccc2fb539af799f97c4411c4e820de23d43797b8 100644 (file)
@@ -58,7 +58,7 @@
  * 2.9e-17.  See also clog().
  */
 
-#include "libm.h"
+#include "complex_impl.h"
 
 #define MAXNUM 1.0e308
 
index 8533bde397fba574164335268dd839a650ef4756..e10d9c09343282a30cb3b63770e126dba3e30615 100644 (file)
@@ -53,7 +53,7 @@
  *    IEEE      -10,+10     30000        2.3e-6      5.2e-8
  */
 
-#include "libm.h"
+#include "complex_impl.h"
 
 #define MAXNUMF 1.0e38F
 
index e248d9b934135c5b474d16223c520109f0ed3d71..c324c7f2bca8017d6e27474a21576c157cf78ad9 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 /* atanh = -i atan(i z) */
 
index 4a5eb04079b9de3af8d3c814a53010fb52618828..b0505f6054053cd5797ee91cf818e4a75cd8045a 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 float complex catanhf(float complex z)
 {
index a5dd538e44535ccc4961eadb593df3f1461a649b..6025c414053c0bdae8808c9ad9fdecda50a135df 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
 long double complex catanhl(long double complex z)
index 5ace7704fdc086461216389aa83b980c161e2c3f..a9fc02db03012604488c7c867cb3618b9212f177 100644 (file)
@@ -59,7 +59,7 @@
 
 #include <complex.h>
 #include <float.h>
-#include "libm.h"
+#include "complex_impl.h"
 
 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
 long double complex catanl(long double complex z)
index 645aec29a9dc013de43e3bb4bfed7d36d671a39b..f32e1fadfbf3439f0d804013f2235bf4bf2497a0 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 /* cos(z) = cosh(i z) */
 
index 9a67241f1cfb47ce688b9f982d9144b764516d31..490be9b3f218b5459cb9ef580a315076206fe1bf 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 float complex ccosf(float complex z)
 {
index 401f3c604237c046fb9f3ebf0aa9656e31ca8a31..c995da7bb2247a88db849199d1d5aea12bec8b30 100644 (file)
@@ -34,7 +34,7 @@
  * These values and the return value were taken from n1124.pdf.
  */
 
-#include "libm.h"
+#include "complex_impl.h"
 
 static const double huge = 0x1p1023;
 
index 90acfe05829f3b2078a5e4af7b45ec6e5ca5bebd..189ce946dd4765ef47cffc897daa24268c486a32 100644 (file)
@@ -28,7 +28,7 @@
  * Hyperbolic cosine of a complex argument.  See s_ccosh.c for details.
  */
 
-#include "libm.h"
+#include "complex_impl.h"
 
 static const float huge = 0x1p127;
 
index 9b2aed9ef16c4e3e412e710a909f51bc167a1daf..ffb4d8a1465f47c1a5ac04d8c9005599fd231416 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 //FIXME
 long double complex ccoshl(long double complex z)
index d787047fec8d5a8df1234f393cd2b8f1a683092b..2530006bfc4262e10b75a75f94e2744d79c739f7 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
 long double complex ccosl(long double complex z)
index 5118e00ea5b74d37b0721d5a3c35169c8e39cc07..7fb489bb930c4b3ae6095534052cc17927ad2aa5 100644 (file)
@@ -25,7 +25,7 @@
  * SUCH DAMAGE.
  */
 
-#include "libm.h"
+#include "complex_impl.h"
 
 static const uint32_t
 exp_ovfl  = 0x40862e42,  /* high bits of MAX_EXP * ln2 ~= 710 */
index 1a09964cbb52df1cc68b857e459450cf6d98910d..00d258f3fcea4e3b363cee35bf1be9058681ebc9 100644 (file)
@@ -25,7 +25,7 @@
  * SUCH DAMAGE.
  */
 
-#include "libm.h"
+#include "complex_impl.h"
 
 static const uint32_t
 exp_ovfl  = 0x42b17218,  /* MAX_EXP * ln2 ~= 88.722839355 */
index a27f85c052c1bf8302ce80d586a3399aced623b7..d4df950e335cbb25c71a49147a8b9a22d26219ac 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 //FIXME
 long double complex cexpl(long double complex z)
index 00955641b14a929373a55f9f3f30839d587f3d20..d6b0e6838c82a2a6ced9b2b809e4dc2f55da5c98 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 double (cimag)(double complex z)
 {
index f7bcd76e439fe0f81a45896f5814ce0fe8b79e75..b7166dcfa940d0ceea494700b1eacb71d0f9f28c 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 float (cimagf)(float complex z)
 {
index 9ec24eeeafc56d93bddaead909538ff896c59908..4db77f201e0d26ec611dc62fb24347e6f9209841 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 long double (cimagl)(long double complex z)
 {
index 12aae9c7e9a02e32f7c68a9a6f98e1218455cca8..b587c2915a002c2a32222bba5cbc170c3dd526bb 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 // FIXME
 
index e9b32e6087bf284e972d3f0ce8377e0f0bfc131f..0389d4723082b4583db00cd7b7abcb67faec9f98 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 // FIXME
 
index 18f16088d7a31082feb0ff51c6453e2ea1f8d64a..88e83e87c92593f85a8cbe370066955d36d922f0 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
 long double complex clogl(long double complex z)
index 0b3f5f46306c78086e026c7d61a0f7b8390dea4e..a3b19a4aa979a4cabdba7e57c4f325b0e18b95b1 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 double complex conj(double complex z)
 {
index 9af6b2c3b4549e5233c5f502fa26037cf1bd952b..b2195c84019a91360ee81bb0c8c1165f85815a59 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 float complex conjf(float complex z)
 {
index 67f11b9dde8ee8a3622cce946941ad57bc0cc3b0..87a4ebecc365320498d2fff6cc9e7fe1d48668b6 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 long double complex conjl(long double complex z)
 {
index f863588fe7881dc9eeda32c620d2cc3cad889757..1137d3911724ced602aceb54cc1b7fff2ee5badb 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 /* pow(z, c) = exp(c log(z)), See C99 G.6.4.1 */
 
index 53c65dcb1112aab6846ede9bfb36c9b1106b1371..f3fd4b7b771bec3368303200823d38233d3a8ebf 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 float complex cpowf(float complex z, float complex c)
 {
index c1a80a7b255bdedf712a067fe3eebcaedf96b78d..be36f046134aa828445d015131424da05b4ec5e5 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
 long double complex cpowl(long double complex z, long double complex c)
index 15f358a14f045c0dd600a3c654b058c4c212326c..9ae1e17c0d8e26c91e0608794427f790bd94b65c 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 double complex cproj(double complex z)
 {
index 653be5e87cfcbf2d64f297fe21bed06423aab9e3..03fab339d9215dc589142444f9440195549339e3 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 float complex cprojf(float complex z)
 {
index 6731aaa2aaaebd74cb8bc22a17f729841e436ad7..38a494c5c4b9c14bee615c8b337f17f6adcdc0e7 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
 long double complex cprojl(long double complex z)
index ad8ae67ad99a59983cd00b6fbd5fe83b2071e667..535c4bf8b0b0cd4432563fc54d49f050c92270b3 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 /* sin(z) = -i sinh(i z) */
 
index 60b3cbaa8681ad3d5f31e40d4a86db764a053227..69f5164eb9982c74559dbf9b2aec8375916205f3 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 float complex csinf(float complex z)
 {
index 0f8035d1ca41f3fc864881eb5ee0b9be36410347..eda0ab59f445d4135ba71336c0898f3eafa7102e 100644 (file)
@@ -34,7 +34,7 @@
  * These values and the return value were taken from n1124.pdf.
  */
 
-#include "libm.h"
+#include "complex_impl.h"
 
 static const double huge = 0x1p1023;
 
index 49697f02f4a35359bce63973f8b446adee6138fb..eb1d98c524a7d3db59eb4fccbf06498bca279721 100644 (file)
@@ -28,7 +28,7 @@
  * Hyperbolic sine of a complex argument z.  See s_csinh.c for details.
  */
 
-#include "libm.h"
+#include "complex_impl.h"
 
 static const float huge = 0x1p127;
 
index c566653b3356f34dacad3cde5312f45bf506db73..09fd18f931126203169cb1dc6ec12d6f19ad9bfa 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 //FIXME
 long double complex csinhl(long double complex z)
index 4e9f86c3ae4dc2094dd55dd79bd88a25ce40d784..90a4eb377777db4abe75970670d473fc94fb6240 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
 long double complex csinl(long double complex z)
index 8a2ba608012230d79a16ce788feb96e4b4d53a0f..c36de00196cfe105bc236c85a426a3e65004d654 100644 (file)
@@ -25,7 +25,7 @@
  * SUCH DAMAGE.
  */
 
-#include "libm.h"
+#include "complex_impl.h"
 
 /*
  * gcc doesn't implement complex multiplication or division correctly,
index ab5102f035b9edc7889ffe3ff24d3b18ffcec50b..a6163974da042e1a1ba3b12836043175f2eb1331 100644 (file)
@@ -25,7 +25,7 @@
  * SUCH DAMAGE.
  */
 
-#include "libm.h"
+#include "complex_impl.h"
 
 /*
  * gcc doesn't implement complex multiplication or division correctly,
index 0600ef3bebcd31389a65a10edb21051843503ab1..225393790420d67b9b5740d9f73e756912b59bfb 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 //FIXME
 long double complex csqrtl(long double complex z)
index c09263744b869b92e03fc5c956a18178b089d655..918717bfcc42233dfdb83493002ea4ca187bde93 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 /* tan(z) = -i tanh(i z) */
 
index 009b1921ba35699471628e8cd3dcfa4b76adcfbc..04c3ff198a24f59fff99d732b816ea07ab418109 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 float complex ctanf(float complex z)
 {
index 3ba3a8997d80349099e4b9b98fcac27fae1f828d..54004cd7dcd97d64ff377022745f45416d9e4bf6 100644 (file)
@@ -63,7 +63,7 @@
  *   precision.  I also handle large x differently.
  */
 
-#include "libm.h"
+#include "complex_impl.h"
 
 double complex ctanh(double complex z)
 {
index 72b76da075cf83f26a3ea7297af2d0e5e052b039..7f422ba7fd3a583fc4062575d625503839d0291d 100644 (file)
@@ -28,7 +28,7 @@
  * Hyperbolic tangent of a complex argument z.  See s_ctanh.c for details.
  */
 
-#include "libm.h"
+#include "complex_impl.h"
 
 float complex ctanhf(float complex z)
 {
index 89a75d1334670296f5be2e3cf7d6df0b4ef088ce..45d5862c8baca5d8586e9681cf10cf499432b668 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 //FIXME
 long double complex ctanhl(long double complex z)
index ac1c3e0ad86d7611b8a9a74ed68a99abbffdbc21..4b87420d8ac18264e1f454c782d08d592f791669 100644 (file)
@@ -1,4 +1,4 @@
-#include "libm.h"
+#include "complex_impl.h"
 
 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
 long double complex ctanl(long double complex z)
index f1874f2a2c37a86f3df6b6b92d6000e89ee60e05..772baba32d54fff8b63e69952aeec60fce48a03f 100644 (file)
@@ -1,3 +1,4 @@
+#define SYSCALL_NO_TLS 1
 #include <elf.h>
 #include <limits.h>
 #include <sys/mman.h>
@@ -21,6 +22,7 @@ int __init_tp(void *p)
        td->tid = __syscall(SYS_set_tid_address, &__thread_list_lock);
        td->locale = &libc.global_locale;
        td->robust_list.head = &td->robust_list.head;
+       td->sysinfo = __sysinfo;
        td->next = td->prev = td;
        return 0;
 }
@@ -113,7 +115,8 @@ static void static_init_tls(size_t *aux)
                & (main_tls.align-1);
 #ifdef TLS_ABOVE_TP
        main_tls.offset = GAP_ABOVE_TP;
-       main_tls.offset += -GAP_ABOVE_TP & (main_tls.align-1);
+       main_tls.offset += (-GAP_ABOVE_TP + (uintptr_t)main_tls.image)
+               & (main_tls.align-1);
 #else
        main_tls.offset = main_tls.size;
 #endif
index 7c95f822e4307153e247344813b7cfa8f216dee4..8fbe526271d812cc467664e9a1c96fb813c528b7 100644 (file)
@@ -28,7 +28,7 @@ void __init_libc(char **envp, char *pn)
        libc.auxv = auxv = (void *)(envp+i+1);
        for (i=0; auxv[i]; i+=2) if (auxv[i]<AUX_CNT) aux[auxv[i]] = auxv[i+1];
        __hwcap = aux[AT_HWCAP];
-       __sysinfo = aux[AT_SYSINFO];
+       if (aux[AT_SYSINFO]) __sysinfo = aux[AT_SYSINFO];
        libc.page_size = aux[AT_PAGESZ];
 
        if (!pn) pn = (void*)aux[AT_EXECFN];
diff --git a/libc-top-half/musl/src/fenv/riscv64/fenv-sf.c b/libc-top-half/musl/src/fenv/riscv64/fenv-sf.c
new file mode 100644 (file)
index 0000000..ecd3cb5
--- /dev/null
@@ -0,0 +1,3 @@
+#ifndef __riscv_flen
+#include "../fenv.c"
+#endif
diff --git a/libc-top-half/musl/src/fenv/riscv64/fenv.S b/libc-top-half/musl/src/fenv/riscv64/fenv.S
new file mode 100644 (file)
index 0000000..f149003
--- /dev/null
@@ -0,0 +1,53 @@
+#ifdef __riscv_flen
+
+.global feclearexcept
+.type feclearexcept, %function
+feclearexcept:
+       csrc fflags, a0
+       li a0, 0
+       ret
+
+.global feraiseexcept
+.type feraiseexcept, %function
+feraiseexcept:
+       csrs fflags, a0
+       li a0, 0
+       ret
+
+.global fetestexcept
+.type fetestexcept, %function
+fetestexcept:
+       frflags t0
+       and a0, t0, a0
+       ret
+
+.global fegetround
+.type fegetround, %function
+fegetround:
+       frrm a0
+       ret
+
+.global __fesetround
+.type __fesetround, %function
+__fesetround:
+       fsrm t0, a0
+       li a0, 0
+       ret
+
+.global fegetenv
+.type fegetenv, %function
+fegetenv:
+       frcsr t0
+       sw t0, 0(a0)
+       li a0, 0
+       ret
+
+.global fesetenv
+.type fesetenv, %function
+fesetenv:
+       lw t1, 0(a0)
+       fscsr t0, t1
+       li a0, 0
+       ret
+
+#endif
index bf3ae154df64a969533774e38d9f525536df00b2..70941d855a191b1d6e08f752a585bf71150ffa64 100644 (file)
@@ -4,6 +4,9 @@
 #include "../../include/errno.h"
 
 #ifdef __wasilibc_unmodified_upstream // Use alternate WASI libc headers
+#ifdef __GNUC__
+__attribute__((const))
+#endif
 hidden int *___errno_location(void);
 
 #undef errno
diff --git a/libc-top-half/musl/src/internal/aarch64/syscall.s b/libc-top-half/musl/src/internal/aarch64/syscall.s
deleted file mode 100644 (file)
index 845986b..0000000
+++ /dev/null
@@ -1,14 +0,0 @@
-.global __syscall
-.hidden __syscall
-.type __syscall,%function
-__syscall:
-       uxtw x8,w0
-       mov x0,x1
-       mov x1,x2
-       mov x2,x3
-       mov x3,x4
-       mov x4,x5
-       mov x5,x6
-       mov x6,x7
-       svc 0
-       ret
diff --git a/libc-top-half/musl/src/internal/arm/syscall.s b/libc-top-half/musl/src/internal/arm/syscall.s
deleted file mode 100644 (file)
index 64dba2f..0000000
+++ /dev/null
@@ -1,15 +0,0 @@
-.syntax unified
-.global __syscall
-.hidden __syscall
-.type __syscall,%function
-__syscall:
-       mov ip,sp
-       stmfd sp!,{r4,r5,r6,r7}
-       mov r7,r0
-       mov r0,r1
-       mov r1,r2
-       mov r2,r3
-       ldmfd ip,{r3,r4,r5,r6}
-       svc 0
-       ldmfd sp!,{r4,r5,r6,r7}
-       bx lr
diff --git a/libc-top-half/musl/src/internal/complex_impl.h b/libc-top-half/musl/src/internal/complex_impl.h
new file mode 100644 (file)
index 0000000..51fb298
--- /dev/null
@@ -0,0 +1,22 @@
+#ifndef _COMPLEX_IMPL_H
+#define _COMPLEX_IMPL_H
+
+#include <complex.h>
+#include "libm.h"
+
+#undef __CMPLX
+#undef CMPLX
+#undef CMPLXF
+#undef CMPLXL
+
+#define __CMPLX(x, y, t) \
+       ((union { _Complex t __z; t __xy[2]; }){.__xy = {(x),(y)}}.__z)
+
+#define CMPLX(x, y) __CMPLX(x, y, double)
+#define CMPLXF(x, y) __CMPLX(x, y, float)
+#define CMPLXL(x, y) __CMPLX(x, y, long double)
+
+hidden double complex __ldexp_cexp(double complex,int);
+hidden float complex __ldexp_cexpf(float complex,int);
+
+#endif
diff --git a/libc-top-half/musl/src/internal/defsysinfo.c b/libc-top-half/musl/src/internal/defsysinfo.c
new file mode 100644 (file)
index 0000000..6d4117d
--- /dev/null
@@ -0,0 +1,3 @@
+#include "libc.h"
+
+size_t __sysinfo;
index cbe0a6fea2da92156654c976defcc4564b8a4872..165bbedbb8d0d5c8245f56d7b42fa426c7a512d1 100644 (file)
@@ -95,7 +95,7 @@ struct fdpic_dummy_loadmap {
 #define DYN_CNT 32
 
 typedef void (*stage2_func)(unsigned char *, size_t *);
-typedef _Noreturn void (*stage3_func)(size_t *);
+typedef void (*stage3_func)(size_t *);
 
 hidden void *__dlsym(void *restrict, const char *restrict, void *restrict);
 
diff --git a/libc-top-half/musl/src/internal/i386/defsysinfo.s b/libc-top-half/musl/src/internal/i386/defsysinfo.s
new file mode 100644 (file)
index 0000000..f1b5b0f
--- /dev/null
@@ -0,0 +1,9 @@
+1:     int $128
+       ret
+
+.data
+.align 4
+.hidden __sysinfo
+.global __sysinfo
+__sysinfo:
+       .long 1b
diff --git a/libc-top-half/musl/src/internal/i386/syscall.s b/libc-top-half/musl/src/internal/i386/syscall.s
deleted file mode 100644 (file)
index 0ebf221..0000000
+++ /dev/null
@@ -1,78 +0,0 @@
-.hidden __sysinfo
-
-# The calling convention for __vsyscall has the syscall number
-# and 5 args arriving as:  eax, edx, ecx, edi, esi, 4(%esp).
-# This ensures that the inline asm in the C code never has to touch
-# ebx or ebp (which are unavailable in PIC and frame-pointer-using
-# code, respectively), and optimizes for size/simplicity in the caller.
-
-.global __vsyscall
-.hidden __vsyscall
-.type __vsyscall,@function
-__vsyscall:
-       push %edi
-       push %ebx
-       mov %edx,%ebx
-       mov %edi,%edx
-       mov 12(%esp),%edi
-       push %eax
-       call 1f
-2:     mov %ebx,%edx
-       pop %ebx
-       pop %ebx
-       pop %edi
-       ret
-
-1:     mov (%esp),%eax
-       add $[__sysinfo-2b],%eax
-       mov (%eax),%eax
-       test %eax,%eax
-       jz 1f
-       push %eax
-       mov 8(%esp),%eax
-       ret                     # tail call to kernel vsyscall entry
-1:     mov 4(%esp),%eax
-       int $128
-       ret
-
-# The __vsyscall6 entry point is used only for 6-argument syscalls.
-# Instead of passing the 5th argument on the stack, a pointer to the
-# 5th and 6th arguments is passed. This is ugly, but there are no
-# register constraints the inline asm could use that would make it
-# possible to pass two arguments on the stack.
-
-.global __vsyscall6
-.hidden __vsyscall6
-.type __vsyscall6,@function
-__vsyscall6:
-       push %ebp
-       push %eax
-       mov 12(%esp), %ebp
-       mov (%ebp), %eax
-       mov 4(%ebp), %ebp
-       push %eax
-       mov 4(%esp),%eax
-       call __vsyscall
-       pop %ebp
-       pop %ebp
-       pop %ebp
-       ret
-
-.global __syscall
-.hidden __syscall
-.type __syscall,@function
-__syscall:
-       lea 24(%esp),%eax
-       push %esi
-       push %edi
-       push %eax
-       mov 16(%esp),%eax
-       mov 20(%esp),%edx
-       mov 24(%esp),%ecx
-       mov 28(%esp),%edi
-       mov 32(%esp),%esi
-       call __vsyscall6
-       pop %edi
-       pop %edi
-       pop %esi
-       ret
index 2e10942df1b7fc3fa5745451fcf5732a45eadd89..cb05181084a57ab5cc8772b31edb75ffd0279d1c 100644 (file)
@@ -3,7 +3,6 @@
 struct __libc __libc;
 
 size_t __hwcap;
-size_t __sysinfo;
 char *__progname=0, *__progname_full=0;
 
 weak_alias(__progname, program_invocation_short_name);
index 22e4d9210bf4aff5175a3e6bd100be8e1cde0647..8983c3e76f1e99641dde5a77a6e65a90f67aaaac 100644 (file)
@@ -1,23 +1,11 @@
-/* origin: FreeBSD /usr/src/lib/msun/src/math_private.h */
-/*
- * ====================================================
- * Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
- *
- * Developed at SunPro, a Sun Microsystems, Inc. business.
- * Permission to use, copy, modify, and distribute this
- * software is freely granted, provided that this notice
- * is preserved.
- * ====================================================
- */
-
 #ifndef _LIBM_H
 #define _LIBM_H
 
 #include <stdint.h>
 #include <float.h>
 #include <math.h>
-#include <complex.h>
 #include <endian.h>
+#include "fp_arch.h"
 
 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
 #elif LDBL_MANT_DIG == 64 && LDBL_MAX_EXP == 16384 && __BYTE_ORDER == __LITTLE_ENDIAN
@@ -71,17 +59,136 @@ union ldshape {
 #error Unsupported long double representation
 #endif
 
+/* Support non-nearest rounding mode.  */
+#ifdef __wasilibc_unmodified_upstream // Wasm doesn't have alternate rounding modes
+#define WANT_ROUNDING 1
+#else
+#define WANT_ROUNDING 0
+#endif
+/* Support signaling NaNs.  */
+#define WANT_SNAN 0
+
+#if WANT_SNAN
+#error SNaN is unsupported
+#else
+#define issignalingf_inline(x) 0
+#define issignaling_inline(x) 0
+#endif
+
+#ifndef TOINT_INTRINSICS
+#define TOINT_INTRINSICS 0
+#endif
+
+#if TOINT_INTRINSICS
+/* Round x to nearest int in all rounding modes, ties have to be rounded
+   consistently with converttoint so the results match.  If the result
+   would be outside of [-2^31, 2^31-1] then the semantics is unspecified.  */
+static double_t roundtoint(double_t);
+
+/* Convert x to nearest int in all rounding modes, ties have to be rounded
+   consistently with roundtoint.  If the result is not representible in an
+   int32_t then the semantics is unspecified.  */
+static int32_t converttoint(double_t);
+#endif
+
+/* Helps static branch prediction so hot path can be better optimized.  */
+#ifdef __GNUC__
+#define predict_true(x) __builtin_expect(!!(x), 1)
+#define predict_false(x) __builtin_expect(x, 0)
+#else
+#define predict_true(x) (x)
+#define predict_false(x) (x)
+#endif
+
+/* Evaluate an expression as the specified type. With standard excess
+   precision handling a type cast or assignment is enough (with
+   -ffloat-store an assignment is required, in old compilers argument
+   passing and return statement may not drop excess precision).  */
+
+static inline float eval_as_float(float x)
+{
+       float y = x;
+       return y;
+}
+
+static inline double eval_as_double(double x)
+{
+       double y = x;
+       return y;
+}
+
+/* fp_barrier returns its input, but limits code transformations
+   as if it had a side-effect (e.g. observable io) and returned
+   an arbitrary value.  */
+
+#ifndef fp_barrierf
+#define fp_barrierf fp_barrierf
+static inline float fp_barrierf(float x)
+{
+       volatile float y = x;
+       return y;
+}
+#endif
+
+#ifndef fp_barrier
+#define fp_barrier fp_barrier
+static inline double fp_barrier(double x)
+{
+       volatile double y = x;
+       return y;
+}
+#endif
+
+#ifndef fp_barrierl
+#define fp_barrierl fp_barrierl
+static inline long double fp_barrierl(long double x)
+{
+       volatile long double y = x;
+       return y;
+}
+#endif
+
+/* fp_force_eval ensures that the input value is computed when that's
+   otherwise unused.  To prevent the constant folding of the input
+   expression, an additional fp_barrier may be needed or a compilation
+   mode that does so (e.g. -frounding-math in gcc). Then it can be
+   used to evaluate an expression for its fenv side-effects only.   */
+
+#ifndef fp_force_evalf
+#define fp_force_evalf fp_force_evalf
+static inline void fp_force_evalf(float x)
+{
+       volatile float y;
+       y = x;
+}
+#endif
+
+#ifndef fp_force_eval
+#define fp_force_eval fp_force_eval
+static inline void fp_force_eval(double x)
+{
+       volatile double y;
+       y = x;
+}
+#endif
+
+#ifndef fp_force_evall
+#define fp_force_evall fp_force_evall
+static inline void fp_force_evall(long double x)
+{
+       volatile long double y;
+       y = x;
+}
+#endif
+
 #ifdef __wasilibc_unmodified_upstream // WASI has no floating-point status flags
 #define FORCE_EVAL(x) do {                        \
        if (sizeof(x) == sizeof(float)) {         \
-               volatile float __x;               \
-               __x = (x);                        \
+               fp_force_evalf(x);                \
        } else if (sizeof(x) == sizeof(double)) { \
-               volatile double __x;              \
-               __x = (x);                        \
+               fp_force_eval(x);                 \
        } else {                                  \
-               volatile long double __x;         \
-               __x = (x);                        \
+               fp_force_evall(x);                \
        }                                         \
 } while(0)
 #else
@@ -90,89 +197,49 @@ union ldshape {
 #define FORCE_EVAL(x) ((void)(x))
 #endif
 
-/* Get two 32 bit ints from a double.  */
+#define asuint(f) ((union{float _f; uint32_t _i;}){f})._i
+#define asfloat(i) ((union{uint32_t _i; float _f;}){i})._f
+#define asuint64(f) ((union{double _f; uint64_t _i;}){f})._i
+#define asdouble(i) ((union{uint64_t _i; double _f;}){i})._f
+
 #define EXTRACT_WORDS(hi,lo,d)                    \
 do {                                              \
-  union {double f; uint64_t i;} __u;              \
-  __u.f = (d);                                    \
-  (hi) = __u.i >> 32;                             \
-  (lo) = (uint32_t)__u.i;                         \
+  uint64_t __u = asuint64(d);                     \
+  (hi) = __u >> 32;                               \
+  (lo) = (uint32_t)__u;                           \
 } while (0)
 
-/* Get the more significant 32 bit int from a double.  */
 #define GET_HIGH_WORD(hi,d)                       \
 do {                                              \
-  union {double f; uint64_t i;} __u;              \
-  __u.f = (d);                                    \
-  (hi) = __u.i >> 32;                             \
+  (hi) = asuint64(d) >> 32;                       \
 } while (0)
 
-/* Get the less significant 32 bit int from a double.  */
 #define GET_LOW_WORD(lo,d)                        \
 do {                                              \
-  union {double f; uint64_t i;} __u;              \
-  __u.f = (d);                                    \
-  (lo) = (uint32_t)__u.i;                         \
+  (lo) = (uint32_t)asuint64(d);                   \
 } while (0)
 
-/* Set a double from two 32 bit ints.  */
 #define INSERT_WORDS(d,hi,lo)                     \
 do {                                              \
-  union {double f; uint64_t i;} __u;              \
-  __u.i = ((uint64_t)(hi)<<32) | (uint32_t)(lo);  \
-  (d) = __u.f;                                    \
+  (d) = asdouble(((uint64_t)(hi)<<32) | (uint32_t)(lo)); \
 } while (0)
 
-/* Set the more significant 32 bits of a double from an int.  */
 #define SET_HIGH_WORD(d,hi)                       \
-do {                                              \
-  union {double f; uint64_t i;} __u;              \
-  __u.f = (d);                                    \
-  __u.i &= 0xffffffff;                            \
-  __u.i |= (uint64_t)(hi) << 32;                  \
-  (d) = __u.f;                                    \
-} while (0)
+  INSERT_WORDS(d, hi, (uint32_t)asuint64(d))
 
-/* Set the less significant 32 bits of a double from an int.  */
 #define SET_LOW_WORD(d,lo)                        \
-do {                                              \
-  union {double f; uint64_t i;} __u;              \
-  __u.f = (d);                                    \
-  __u.i &= 0xffffffff00000000ull;                 \
-  __u.i |= (uint32_t)(lo);                        \
-  (d) = __u.f;                                    \
-} while (0)
+  INSERT_WORDS(d, asuint64(d)>>32, lo)
 
-/* Get a 32 bit int from a float.  */
 #define GET_FLOAT_WORD(w,d)                       \
 do {                                              \
-  union {float f; uint32_t i;} __u;               \
-  __u.f = (d);                                    \
-  (w) = __u.i;                                    \
+  (w) = asuint(d);                                \
 } while (0)
 
-/* Set a float from a 32 bit int.  */
 #define SET_FLOAT_WORD(d,w)                       \
 do {                                              \
-  union {float f; uint32_t i;} __u;               \
-  __u.i = (w);                                    \
-  (d) = __u.f;                                    \
+  (d) = asfloat(w);                               \
 } while (0)
 
-#undef __CMPLX
-#undef CMPLX
-#undef CMPLXF
-#undef CMPLXL
-
-#define __CMPLX(x, y, t) \
-       ((union { _Complex t __z; t __xy[2]; }){.__xy = {(x),(y)}}.__z)
-
-#define CMPLX(x, y) __CMPLX(x, y, double)
-#define CMPLXF(x, y) __CMPLX(x, y, float)
-#define CMPLXL(x, y) __CMPLX(x, y, long double)
-
-/* fdlibm kernel functions */
-
 hidden int    __rem_pio2_large(double*,double*,int,int,int);
 
 hidden int    __rem_pio2(double,double*);
@@ -180,21 +247,18 @@ hidden double __sin(double,double,int);
 hidden double __cos(double,double);
 hidden double __tan(double,double,int);
 hidden double __expo2(double);
-hidden double complex __ldexp_cexp(double complex,int);
 
 hidden int    __rem_pio2f(float,double*);
 hidden float  __sindf(double);
 hidden float  __cosdf(double);
 hidden float  __tandf(double,int);
 hidden float  __expo2f(float);
-hidden float complex __ldexp_cexpf(float complex,int);
 
 hidden int __rem_pio2l(long double, long double *);
 hidden long double __sinl(long double, long double, int);
 hidden long double __cosl(long double, long double);
 hidden long double __tanl(long double, long double, int);
 
-/* polynomial evaluation */
 hidden long double __polevll(long double, const long double *, int);
 hidden long double __p1evll(long double, const long double *, int);
 
@@ -202,4 +266,16 @@ extern int __signgam;
 hidden double __lgamma_r(double, int *);
 hidden float __lgammaf_r(float, int *);
 
+/* error handling functions */
+hidden float __math_xflowf(uint32_t, float);
+hidden float __math_uflowf(uint32_t);
+hidden float __math_oflowf(uint32_t);
+hidden float __math_divzerof(uint32_t);
+hidden float __math_invalidf(float);
+hidden double __math_xflow(uint32_t, double);
+hidden double __math_uflow(uint32_t);
+hidden double __math_oflow(uint32_t);
+hidden double __math_divzero(uint32_t);
+hidden double __math_invalid(double);
+
 #endif
diff --git a/libc-top-half/musl/src/internal/m68k/syscall.s b/libc-top-half/musl/src/internal/m68k/syscall.s
deleted file mode 100644 (file)
index 9972a34..0000000
+++ /dev/null
@@ -1,9 +0,0 @@
-.global __syscall
-.hidden __syscall
-.type __syscall,%function
-__syscall:
-       movem.l %d2-%d5,-(%sp)
-       movem.l 20(%sp),%d0-%d5/%a0
-       trap #0
-       movem.l (%sp)+,%d2-%d5
-       rts
diff --git a/libc-top-half/musl/src/internal/microblaze/syscall.s b/libc-top-half/musl/src/internal/microblaze/syscall.s
deleted file mode 100644 (file)
index e0312e7..0000000
+++ /dev/null
@@ -1,14 +0,0 @@
-.global __syscall
-.hidden __syscall
-.type   __syscall,@function
-__syscall:
-       addi    r12, r5, 0              # Save the system call number
-       add     r5, r6, r0              # Shift the arguments, arg1
-       add     r6, r7, r0              # arg2
-       add     r7, r8, r0              # arg3
-       add     r8, r9, r0              # arg4
-       add     r9, r10, r0             # arg5
-       lwi     r10, r1, 28             # Get arg6.
-       brki    r14, 0x8                # syscall
-       rtsd    r15, 8
-       nop
diff --git a/libc-top-half/musl/src/internal/mips/syscall.s b/libc-top-half/musl/src/internal/mips/syscall.s
deleted file mode 100644 (file)
index 5d0def5..0000000
+++ /dev/null
@@ -1,26 +0,0 @@
-.set    noreorder
-
-.global __syscall
-.hidden __syscall
-.type   __syscall,@function
-__syscall:
-       move    $2, $4
-       move    $4, $5
-       move    $5, $6
-       move    $6, $7
-       lw      $7, 16($sp)
-       lw      $8, 20($sp)
-       lw      $9, 24($sp)
-       lw      $10,28($sp)
-       subu    $sp, $sp, 32
-       sw      $8, 16($sp)
-       sw      $9, 20($sp)
-       sw      $10,24($sp)
-       sw      $2 ,28($sp)
-       lw      $2, 28($sp)
-       syscall
-       beq     $7, $0, 1f
-       addu    $sp, $sp, 32
-       subu    $2, $0, $2
-1:     jr      $ra
-       nop
diff --git a/libc-top-half/musl/src/internal/mips64/syscall.s b/libc-top-half/musl/src/internal/mips64/syscall.s
deleted file mode 100644 (file)
index 9844866..0000000
+++ /dev/null
@@ -1,19 +0,0 @@
-.set   noreorder
-.global        __syscall
-.hidden        __syscall
-.type  __syscall,@function
-__syscall:
-       move    $2, $4
-       move    $4, $5
-       move    $5, $6
-       move    $6, $7
-       move    $7, $8
-       move    $8, $9
-       move    $9, $10
-       move    $10, $11
-       syscall
-       beq     $7, $0, 1f
-       nop
-       dsubu   $2, $0, $2
-1:     jr      $ra
-       nop
diff --git a/libc-top-half/musl/src/internal/mipsn32/syscall.s b/libc-top-half/musl/src/internal/mipsn32/syscall.s
deleted file mode 100644 (file)
index 510a6fa..0000000
+++ /dev/null
@@ -1,19 +0,0 @@
-.set   noreorder
-.global        __syscall
-.hidden        __syscall
-.type  __syscall,@function
-__syscall:
-       move    $2, $4
-       move    $4, $5
-       move    $5, $6
-       move    $6, $7
-       move    $7, $8
-       move    $8, $9
-       move    $9, $10
-       move    $10, $11
-       syscall
-       beq     $7, $0, 1f
-       nop
-       subu    $2, $0, $2
-1:     jr      $ra
-       nop
diff --git a/libc-top-half/musl/src/internal/or1k/syscall.s b/libc-top-half/musl/src/internal/or1k/syscall.s
deleted file mode 100644 (file)
index 177964e..0000000
+++ /dev/null
@@ -1,14 +0,0 @@
-.global __syscall
-.hidden __syscall
-.type   __syscall,@function
-__syscall:
-       l.ori   r11, r3, 0
-       l.lwz   r3, 0(r1)
-       l.lwz   r4, 4(r1)
-       l.lwz   r5, 8(r1)
-       l.lwz   r6, 12(r1)
-       l.lwz   r7, 16(r1)
-       l.lwz   r8, 20(r1)
-       l.sys   1
-       l.jr    r9
-        l.nop
diff --git a/libc-top-half/musl/src/internal/powerpc/syscall.s b/libc-top-half/musl/src/internal/powerpc/syscall.s
deleted file mode 100644 (file)
index 5b16b8f..0000000
+++ /dev/null
@@ -1,19 +0,0 @@
-       .global __syscall
-       .hidden __syscall
-       .type   __syscall,@function
-__syscall:
-       mr      0, 3                  # Save the system call number
-       mr      3, 4                  # Shift the arguments: arg1
-       mr      4, 5                  # arg2
-       mr      5, 6                  # arg3
-       mr      6, 7                  # arg4
-       mr      7, 8                  # arg5
-       mr      8, 9                  # arg6
-       sc
-       bnslr+ # return if not summary overflow
-       #else error:
-       # return negated value.
-       neg 3, 3
-       blr
-       .end    __syscall
-       .size   __syscall, .-__syscall
diff --git a/libc-top-half/musl/src/internal/powerpc64/syscall.s b/libc-top-half/musl/src/internal/powerpc64/syscall.s
deleted file mode 100644 (file)
index fe21f9e..0000000
+++ /dev/null
@@ -1,17 +0,0 @@
-       .global __syscall
-       .hidden __syscall
-       .type   __syscall,@function
-__syscall:
-       mr      0, 3                  # Save the system call number
-       mr      3, 4                  # Shift the arguments: arg1
-       mr      4, 5                  # arg2
-       mr      5, 6                  # arg3
-       mr      6, 7                  # arg4
-       mr      7, 8                  # arg5
-       mr      8, 9                  # arg6
-       sc
-       bnslr+       # return if not summary overflow
-       neg     3, 3 # otherwise error: return negated value.
-       blr
-       .end    __syscall
-       .size   __syscall, .-__syscall
diff --git a/libc-top-half/musl/src/internal/s390x/syscall.s b/libc-top-half/musl/src/internal/s390x/syscall.s
deleted file mode 100644 (file)
index 2322bc3..0000000
+++ /dev/null
@@ -1,15 +0,0 @@
-.global __syscall
-.hidden __syscall
-.type   __syscall, %function
-__syscall:
-       stg %r7, 56(%r15)
-       lgr %r1, %r2
-       lgr %r2, %r3
-       lgr %r3, %r4
-       lgr %r4, %r5
-       lgr %r5, %r6
-       lg  %r6, 160(%r15)
-       lg  %r7, 168(%r15)
-       svc 0
-       lg  %r7, 56(%r15)
-       br  %r14
diff --git a/libc-top-half/musl/src/internal/sh/syscall.s b/libc-top-half/musl/src/internal/sh/syscall.s
deleted file mode 100644 (file)
index 331918a..0000000
+++ /dev/null
@@ -1,23 +0,0 @@
-.global __syscall
-.hidden __syscall
-.type   __syscall, @function
-__syscall:
-       ! The kernel syscall entry point documents that the trap number indicates
-       ! the number of arguments being passed, but it then ignores that information.
-       ! Since we do not actually know how many arguments are being passed, we will
-       ! say there are six, since that is the maximum we support here.
-       mov r4, r3
-       mov r5, r4
-       mov r6, r5
-       mov r7, r6
-       mov.l @r15, r7
-       mov.l @(4,r15), r0
-       mov.l @(8,r15), r1
-       trapa #31
-       or r0, r0
-       or r0, r0
-       or r0, r0
-       or r0, r0
-       or r0, r0
-       rts
-        nop
diff --git a/libc-top-half/musl/src/internal/syscall.c b/libc-top-half/musl/src/internal/syscall.c
deleted file mode 100644 (file)
index e69de29..0000000
index 06c5527f7d934854735869cace2f71ddfe8074b4..69f019cd8d04407cfb9d831f065f0188117245fa 100644 (file)
 typedef long syscall_arg_t;
 #endif
 
-hidden long __syscall_ret(unsigned long), __syscall(syscall_arg_t, ...),
+hidden long __syscall_ret(unsigned long),
        __syscall_cp(syscall_arg_t, syscall_arg_t, syscall_arg_t, syscall_arg_t,
                     syscall_arg_t, syscall_arg_t, syscall_arg_t);
 
-#ifdef SYSCALL_NO_INLINE
-#define __syscall0(n) (__syscall)(n)
-#define __syscall1(n,a) (__syscall)(n,__scc(a))
-#define __syscall2(n,a,b) (__syscall)(n,__scc(a),__scc(b))
-#define __syscall3(n,a,b,c) (__syscall)(n,__scc(a),__scc(b),__scc(c))
-#define __syscall4(n,a,b,c,d) (__syscall)(n,__scc(a),__scc(b),__scc(c),__scc(d))
-#define __syscall5(n,a,b,c,d,e) (__syscall)(n,__scc(a),__scc(b),__scc(c),__scc(d),__scc(e))
-#define __syscall6(n,a,b,c,d,e,f) (__syscall)(n,__scc(a),__scc(b),__scc(c),__scc(d),__scc(e),__scc(f))
-#else
 #define __syscall1(n,a) __syscall1(n,__scc(a))
 #define __syscall2(n,a,b) __syscall2(n,__scc(a),__scc(b))
 #define __syscall3(n,a,b,c) __syscall3(n,__scc(a),__scc(b),__scc(c))
 #define __syscall4(n,a,b,c,d) __syscall4(n,__scc(a),__scc(b),__scc(c),__scc(d))
 #define __syscall5(n,a,b,c,d,e) __syscall5(n,__scc(a),__scc(b),__scc(c),__scc(d),__scc(e))
 #define __syscall6(n,a,b,c,d,e,f) __syscall6(n,__scc(a),__scc(b),__scc(c),__scc(d),__scc(e),__scc(f))
-#endif
-#define __syscall7(n,a,b,c,d,e,f,g) (__syscall)(n,__scc(a),__scc(b),__scc(c),__scc(d),__scc(e),__scc(f),__scc(g))
+#define __syscall7(n,a,b,c,d,e,f,g) __syscall7(n,__scc(a),__scc(b),__scc(c),__scc(d),__scc(e),__scc(f),__scc(g))
 
 #define __SYSCALL_NARGS_X(a,b,c,d,e,f,g,h,n,...) n
 #define __SYSCALL_NARGS(...) __SYSCALL_NARGS_X(__VA_ARGS__,7,6,5,4,3,2,1,0,)
diff --git a/libc-top-half/musl/src/internal/x32/syscall.s b/libc-top-half/musl/src/internal/x32/syscall.s
deleted file mode 100644 (file)
index c4bee80..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-.global __syscall
-.hidden __syscall
-.type __syscall,@function
-__syscall:
-       movq %rdi,%rax
-       movq %rsi,%rdi
-       movq %rdx,%rsi
-       movq %rcx,%rdx
-       movq %r8,%r10
-       movq %r9,%r8
-       movq 8(%rsp),%r9
-       syscall
-       ret
diff --git a/libc-top-half/musl/src/internal/x86_64/syscall.s b/libc-top-half/musl/src/internal/x86_64/syscall.s
deleted file mode 100644 (file)
index c4bee80..0000000
+++ /dev/null
@@ -1,13 +0,0 @@
-.global __syscall
-.hidden __syscall
-.type __syscall,@function
-__syscall:
-       movq %rdi,%rax
-       movq %rsi,%rdi
-       movq %rdx,%rsi
-       movq %rcx,%rdx
-       movq %r8,%r10
-       movq %r9,%r8
-       movq 8(%rsp),%r9
-       syscall
-       ret
index ea9b23377e47dad684ae1e7cc72df2cab81faf4c..868197f61738ed9ead09929be86197926ae492ad 100644 (file)
@@ -17,7 +17,7 @@ int msgctl(int q, int cmd, struct msqid_ds *buf)
                buf = &tmp;
        }
 #endif
-#ifdef SYS_msgctl
+#ifndef SYS_ipc
        int r = __syscall(SYS_msgctl, q, cmd | IPC_64, buf);
 #else
        int r = __syscall(SYS_ipc, IPCOP_msgctl, q, cmd | IPC_64, 0, buf, 0);
index 9dfbc4eabc4b9d6017f6f48585143ae9433a6280..30a4b42b854c2f257de28587db2e7b9efd805131 100644 (file)
@@ -4,7 +4,7 @@
 
 int msgget(key_t k, int flag)
 {
-#ifdef SYS_msgget
+#ifndef SYS_ipc
        return syscall(SYS_msgget, k, flag);
 #else
        return syscall(SYS_ipc, IPCOP_msgget, k, flag);
index 0a344e5677a251ca464911c1393ad4de9b9c0425..9d1034b145012cd76e2613d5d7e7f55ab0c3787a 100644 (file)
@@ -4,7 +4,7 @@
 
 ssize_t msgrcv(int q, void *m, size_t len, long type, int flag)
 {
-#ifdef SYS_msgrcv
+#ifndef SYS_ipc
        return syscall_cp(SYS_msgrcv, q, m, len, type, flag);
 #else
        return syscall_cp(SYS_ipc, IPCOP_msgrcv, q, len, flag, ((long[]){ (long)m, type }));
index e1abde3abc3211e8f239d4696bc4ebf37f57019a..99bb17e94acab0e1c9afd07f452d1ca88b4dff16 100644 (file)
@@ -4,7 +4,7 @@
 
 int msgsnd(int q, const void *m, size_t len, int flag)
 {
-#ifdef SYS_msgsnd
+#ifndef SYS_ipc
        return syscall_cp(SYS_msgsnd, q, m, len, flag);
 #else
        return syscall_cp(SYS_ipc, IPCOP_msgsnd, q, len, flag, m);
index 941e28136adb5f25b3ad289e3fd541b057e0a3ad..ce1fb164fa8114bee5511c554b12ab0edd557aa3 100644 (file)
@@ -33,7 +33,7 @@ int semctl(int id, int num, int cmd, ...)
                arg.buf = &tmp;
        }
 #endif
-#ifdef SYS_semctl
+#ifndef SYS_ipc
        int r = __syscall(SYS_semctl, id, num, cmd | IPC_64, arg.buf);
 #else
        int r = __syscall(SYS_ipc, IPCOP_semctl, id, num, cmd | IPC_64, &arg.buf);
index c4a559db1b0ec1316dc2fa9bc47a538ea552d94a..2cdf626b500239d8a7427b23f284698aeea6cbea 100644 (file)
@@ -11,7 +11,7 @@ int semget(key_t key, int n, int fl)
         * n fits in the correct (per POSIX) userspace type, so
         * we have to check here. */
        if (n > USHRT_MAX) return __syscall_ret(-EINVAL);
-#ifdef SYS_semget
+#ifndef SYS_ipc
        return syscall(SYS_semget, key, n, fl);
 #else
        return syscall(SYS_ipc, IPCOP_semget, key, n, fl);
index 8046e43714d08698af71fb698d7796b90d6020fa..5f0c7deaf308a38723726139bebc4ad03f3576dd 100644 (file)
@@ -4,7 +4,7 @@
 
 int semop(int id, struct sembuf *buf, size_t n)
 {
-#ifdef SYS_semop
+#ifndef SYS_ipc
        return syscall(SYS_semop, id, buf, n);
 #else
        return syscall(SYS_ipc, IPCOP_semop, id, n, 0, buf);
index b0c4cf9f82a79cd8b532c19246d7b315fac91b3e..51e70805314f196238ce29e979f0061df2287d04 100644 (file)
@@ -5,7 +5,7 @@
 
 int semtimedop(int id, struct sembuf *buf, size_t n, const struct timespec *ts)
 {
-#ifdef SYS_semtimedop
+#ifndef SYS_ipc
        return syscall(SYS_semtimedop, id, buf, n, ts);
 #else
        return syscall(SYS_ipc, IPCOP_semtimedop, id, n, 0, buf, ts);
index 38db92f9511486fa5ff69001040678e45579e2d3..8c7407d13f6d8f0a0cb906bc27140c0dabbb2fbd 100644 (file)
@@ -2,7 +2,7 @@
 #include "syscall.h"
 #include "ipc.h"
 
-#ifdef SYS_shmat
+#ifndef SYS_ipc
 void *shmat(int id, const void *addr, int flag)
 {
        return (void *)syscall(SYS_shmat, id, addr, flag);
index c951a58156c92446510e2a98e64ea7a558e2eb83..c2b2bb0d4c44fe68e9b2b4f5797e06573f0f2cd3 100644 (file)
@@ -17,7 +17,7 @@ int shmctl(int id, int cmd, struct shmid_ds *buf)
                buf = &tmp;
        }
 #endif
-#ifdef SYS_shmctl
+#ifndef SYS_ipc
        int r = __syscall(SYS_shmctl, id, cmd | IPC_64, buf);
 #else
        int r = __syscall(SYS_ipc, IPCOP_shmctl, id, cmd | IPC_64, 0, buf, 0);
index d4fac8f183a12281c76280377132de08a965059c..572381378e1d4365255b9015749400645adfa3d8 100644 (file)
@@ -4,7 +4,7 @@
 
 int shmdt(const void *addr)
 {
-#ifdef SYS_shmdt
+#ifndef SYS_ipc
        return syscall(SYS_shmdt, addr);
 #else
        return syscall(SYS_ipc, IPCOP_shmdt, 0, 0, 0, addr);
index b44f9d680a75ad430e12d857d7b9314bc3089fd9..7521b5fa3fcab7ed55260bcca5b7cbe9d6b77482 100644 (file)
@@ -6,7 +6,7 @@
 int shmget(key_t key, size_t size, int flag)
 {
        if (size > PTRDIFF_MAX) size = SIZE_MAX;
-#ifdef SYS_shmget
+#ifndef SYS_ipc
        return syscall(SYS_shmget, key, size, flag);
 #else
        return syscall(SYS_ipc, IPCOP_shmget, key, size, flag);
index c91baa453331cf91ba6d90b0f78f0a0f9847af12..04d97e730431a957dab6c2bbc7dfa0242265c20e 100644 (file)
@@ -23,16 +23,13 @@ __tlsdesc_static:
 .hidden __tlsdesc_dynamic
 .type __tlsdesc_dynamic,@function
 __tlsdesc_dynamic:
-       stp x1,x2,[sp,#-32]!
-       stp x3,x4,[sp,#16]
+       stp x1,x2,[sp,#-16]!
        mrs x1,tpidr_el0      // tp
        ldr x0,[x0,#8]        // p
-       ldr x2,[x0]           // p->modidx
-       ldr x3,[x1,#-8]       // dtv
-       ldr x2,[x3,x2,lsl #3] // dtv[p->modidx]
-       ldr x0,[x0,#8]        // p->off
-       add x0,x0,x2
-       sub x0,x0,x1
-       ldp x3,x4,[sp,#16]
-       ldp x1,x2,[sp],#32
+       ldp x0,x2,[x0]        // p->modidx, p->off
+       sub x2,x2,x1          // p->off - tp
+       ldr x1,[x1,#-8]       // dtv
+       ldr x1,[x1,x0,lsl #3] // dtv[p->modidx]
+       add x0,x1,x2          // dtv[p->modidx] + p->off - tp
+       ldp x1,x2,[sp],#16
        ret
index 357d577131a67a8bb0b7d40415937d399c205626..cfe308ef57d2ad90f07f85eb97ffa22642f6d510 100644 (file)
@@ -5,5 +5,4 @@
 dlsym:
        mflr    5                      # The return address is arg3.
        b       __dlsym
-       .end    dlsym
        .size   dlsym, .-dlsym
index 7eb691d92b6aeaf1b96acc0f66db04510faa0adb..a14715fd4dc7684618fd3ab8286bbbe21edb4e00 100644 (file)
@@ -8,5 +8,4 @@ dlsym:
        .localentry dlsym,.-dlsym
        mflr    5                      # The return address is arg3.
        b       __dlsym
-       .end    dlsym
        .size   dlsym, .-dlsym
diff --git a/libc-top-half/musl/src/ldso/riscv64/dlsym.s b/libc-top-half/musl/src/ldso/riscv64/dlsym.s
new file mode 100644 (file)
index 0000000..2bafd72
--- /dev/null
@@ -0,0 +1,6 @@
+.global dlsym
+.hidden __dlsym
+.type dlsym, %function
+dlsym:
+       mv a2, ra
+       tail __dlsym
index 84a138a4158692d037b1c8aa56ea5d04b0d07ca6..0eb051c2d4acecbce4ca780413f125369ffecf14 100644 (file)
@@ -1,4 +1,6 @@
+#include <errno.h>
 #include "syscall.h"
+#include "atomic.h"
 
 #ifdef SYS_cacheflush
 int _flush_cache(void *addr, int len, int op)
@@ -15,3 +17,34 @@ int __cachectl(void *addr, int len, int op)
 }
 weak_alias(__cachectl, cachectl);
 #endif
+
+#ifdef SYS_riscv_flush_icache
+
+#define VDSO_FLUSH_ICACHE_SYM "__vdso_flush_icache"
+#define VDSO_FLUSH_ICACHE_VER "LINUX_4.5"
+
+static void *volatile vdso_func;
+
+static int flush_icache_init(void *start, void *end, unsigned long int flags)
+{
+       void *p = __vdsosym(VDSO_FLUSH_ICACHE_VER, VDSO_FLUSH_ICACHE_SYM);
+       int (*f)(void *, void *, unsigned long int) =
+               (int (*)(void *, void *, unsigned long int))p;
+       a_cas_p(&vdso_func, (void *)flush_icache_init, p);
+       return f ? f(start, end, flags) : -ENOSYS;
+}
+
+static void *volatile vdso_func = (void *)flush_icache_init;
+
+int __riscv_flush_icache(void *start, void *end, unsigned long int flags) 
+{
+       int (*f)(void *, void *, unsigned long int) =
+               (int (*)(void *, void *, unsigned long int))vdso_func;
+       if (f) {
+               int r = f(start, end, flags);
+               if (!r) return r;
+               if (r != -ENOSYS) return __syscall_ret(r);
+       }
+}
+weak_alias(__riscv_flush_icache, riscv_flush_icache);
+#endif
index de6de3b425bcc23063d2198762ff42e80edeec4e..796c1e5c92499a1b0b914e3e6d5d865272026e7c 100644 (file)
@@ -1,9 +1,11 @@
 #define _BSD_SOURCE
 #include <dirent.h>
+#include <limits.h>
 #include "syscall.h"
 
 int getdents(int fd, struct dirent *buf, size_t len)
 {
+       if (len>INT_MAX) len = INT_MAX;
        return syscall(SYS_getdents, fd, buf, len);
 }
 
diff --git a/libc-top-half/musl/src/math/__math_divzero.c b/libc-top-half/musl/src/math/__math_divzero.c
new file mode 100644 (file)
index 0000000..59d2135
--- /dev/null
@@ -0,0 +1,6 @@
+#include "libm.h"
+
+double __math_divzero(uint32_t sign)
+{
+       return fp_barrier(sign ? -1.0 : 1.0) / 0.0;
+}
diff --git a/libc-top-half/musl/src/math/__math_divzerof.c b/libc-top-half/musl/src/math/__math_divzerof.c
new file mode 100644 (file)
index 0000000..ce046f3
--- /dev/null
@@ -0,0 +1,6 @@
+#include "libm.h"
+
+float __math_divzerof(uint32_t sign)
+{
+       return fp_barrierf(sign ? -1.0f : 1.0f) / 0.0f;
+}
diff --git a/libc-top-half/musl/src/math/__math_invalid.c b/libc-top-half/musl/src/math/__math_invalid.c
new file mode 100644 (file)
index 0000000..1774049
--- /dev/null
@@ -0,0 +1,6 @@
+#include "libm.h"
+
+double __math_invalid(double x)
+{
+       return (x - x) / (x - x);
+}
diff --git a/libc-top-half/musl/src/math/__math_invalidf.c b/libc-top-half/musl/src/math/__math_invalidf.c
new file mode 100644 (file)
index 0000000..357d4b1
--- /dev/null
@@ -0,0 +1,6 @@
+#include "libm.h"
+
+float __math_invalidf(float x)
+{
+       return (x - x) / (x - x);
+}
diff --git a/libc-top-half/musl/src/math/__math_oflow.c b/libc-top-half/musl/src/math/__math_oflow.c
new file mode 100644 (file)
index 0000000..c85dbf9
--- /dev/null
@@ -0,0 +1,6 @@
+#include "libm.h"
+
+double __math_oflow(uint32_t sign)
+{
+       return __math_xflow(sign, 0x1p769);
+}
diff --git a/libc-top-half/musl/src/math/__math_oflowf.c b/libc-top-half/musl/src/math/__math_oflowf.c
new file mode 100644 (file)
index 0000000..fa7d062
--- /dev/null
@@ -0,0 +1,6 @@
+#include "libm.h"
+
+float __math_oflowf(uint32_t sign)
+{
+       return __math_xflowf(sign, 0x1p97f);
+}
diff --git a/libc-top-half/musl/src/math/__math_uflow.c b/libc-top-half/musl/src/math/__math_uflow.c
new file mode 100644 (file)
index 0000000..b90594a
--- /dev/null
@@ -0,0 +1,6 @@
+#include "libm.h"
+
+double __math_uflow(uint32_t sign)
+{
+       return __math_xflow(sign, 0x1p-767);
+}
diff --git a/libc-top-half/musl/src/math/__math_uflowf.c b/libc-top-half/musl/src/math/__math_uflowf.c
new file mode 100644 (file)
index 0000000..94d50f2
--- /dev/null
@@ -0,0 +1,6 @@
+#include "libm.h"
+
+float __math_uflowf(uint32_t sign)
+{
+       return __math_xflowf(sign, 0x1p-95f);
+}
diff --git a/libc-top-half/musl/src/math/__math_xflow.c b/libc-top-half/musl/src/math/__math_xflow.c
new file mode 100644 (file)
index 0000000..744203c
--- /dev/null
@@ -0,0 +1,6 @@
+#include "libm.h"
+
+double __math_xflow(uint32_t sign, double y)
+{
+       return eval_as_double(fp_barrier(sign ? -y : y) * y);
+}
diff --git a/libc-top-half/musl/src/math/__math_xflowf.c b/libc-top-half/musl/src/math/__math_xflowf.c
new file mode 100644 (file)
index 0000000..f2c8478
--- /dev/null
@@ -0,0 +1,6 @@
+#include "libm.h"
+
+float __math_xflowf(uint32_t sign, float y)
+{
+       return eval_as_float(fp_barrierf(sign ? -y : y) * y);
+}
index 9ea672fac6168b16c33cffa2b9f48960cf3c2f81..b764d73cfe339c22579d28388b387ba22ba7eda0 100644 (file)
-/* origin: FreeBSD /usr/src/lib/msun/src/e_exp.c */
 /*
- * ====================================================
- * Copyright (C) 2004 by Sun Microsystems, Inc. All rights reserved.
+ * Double-precision e^x function.
  *
- * Permission to use, copy, modify, and distribute this
- * software is freely granted, provided that this notice
- * is preserved.
- * ====================================================
- */
-/* exp(x)
- * Returns the exponential of x.
- *
- * Method
- *   1. Argument reduction:
- *      Reduce x to an r so that |r| <= 0.5*ln2 ~ 0.34658.
- *      Given x, find r and integer k such that
- *
- *               x = k*ln2 + r,  |r| <= 0.5*ln2.
- *
- *      Here r will be represented as r = hi-lo for better
- *      accuracy.
- *
- *   2. Approximation of exp(r) by a special rational function on
- *      the interval [0,0.34658]:
- *      Write
- *          R(r**2) = r*(exp(r)+1)/(exp(r)-1) = 2 + r*r/6 - r**4/360 + ...
- *      We use a special Remez algorithm on [0,0.34658] to generate
- *      a polynomial of degree 5 to approximate R. The maximum error
- *      of this polynomial approximation is bounded by 2**-59. In
- *      other words,
- *          R(z) ~ 2.0 + P1*z + P2*z**2 + P3*z**3 + P4*z**4 + P5*z**5
- *      (where z=r*r, and the values of P1 to P5 are listed below)
- *      and
- *          |                  5          |     -59
- *          | 2.0+P1*z+...+P5*z   -  R(z) | <= 2
- *          |                             |
- *      The computation of exp(r) thus becomes
- *                              2*r
- *              exp(r) = 1 + ----------
- *                            R(r) - r
- *                                 r*c(r)
- *                     = 1 + r + ----------- (for better accuracy)
- *                                2 - c(r)
- *      where
- *                              2       4             10
- *              c(r) = r - (P1*r  + P2*r  + ... + P5*r   ).
- *
- *   3. Scale back to obtain exp(x):
- *      From step 1, we have
- *         exp(x) = 2^k * exp(r)
- *
- * Special cases:
- *      exp(INF) is INF, exp(NaN) is NaN;
- *      exp(-INF) is 0, and
- *      for finite argument, only exp(0)=1 is exact.
- *
- * Accuracy:
- *      according to an error analysis, the error is always less than
- *      1 ulp (unit in the last place).
- *
- * Misc. info.
- *      For IEEE double
- *          if x >  709.782712893383973096 then exp(x) overflows
- *          if x < -745.133219101941108420 then exp(x) underflows
+ * Copyright (c) 2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
  */
 
+#include <math.h>
+#include <stdint.h>
 #include "libm.h"
+#include "exp_data.h"
 
-static const double
-half[2] = {0.5,-0.5},
-ln2hi = 6.93147180369123816490e-01, /* 0x3fe62e42, 0xfee00000 */
-ln2lo = 1.90821492927058770002e-10, /* 0x3dea39ef, 0x35793c76 */
-invln2 = 1.44269504088896338700e+00, /* 0x3ff71547, 0x652b82fe */
-P1   =  1.66666666666666019037e-01, /* 0x3FC55555, 0x5555553E */
-P2   = -2.77777777770155933842e-03, /* 0xBF66C16C, 0x16BEBD93 */
-P3   =  6.61375632143793436117e-05, /* 0x3F11566A, 0xAF25DE2C */
-P4   = -1.65339022054652515390e-06, /* 0xBEBBBD41, 0xC5D26BF1 */
-P5   =  4.13813679705723846039e-08; /* 0x3E663769, 0x72BEA4D0 */
+#define N (1 << EXP_TABLE_BITS)
+#define InvLn2N __exp_data.invln2N
+#define NegLn2hiN __exp_data.negln2hiN
+#define NegLn2loN __exp_data.negln2loN
+#define Shift __exp_data.shift
+#define T __exp_data.tab
+#define C2 __exp_data.poly[5 - EXP_POLY_ORDER]
+#define C3 __exp_data.poly[6 - EXP_POLY_ORDER]
+#define C4 __exp_data.poly[7 - EXP_POLY_ORDER]
+#define C5 __exp_data.poly[8 - EXP_POLY_ORDER]
 
-double exp(double x)
+/* Handle cases that may overflow or underflow when computing the result that
+   is scale*(1+TMP) without intermediate rounding.  The bit representation of
+   scale is in SBITS, however it has a computed exponent that may have
+   overflown into the sign bit so that needs to be adjusted before using it as
+   a double.  (int32_t)KI is the k used in the argument reduction and exponent
+   adjustment of scale, positive k here means the result may overflow and
+   negative k means the result may underflow.  */
+static inline double specialcase(double_t tmp, uint64_t sbits, uint64_t ki)
 {
-       double_t hi, lo, c, xx, y;
-       int k, sign;
-       uint32_t hx;
-
-       GET_HIGH_WORD(hx, x);
-       sign = hx>>31;
-       hx &= 0x7fffffff;  /* high word of |x| */
+       double_t scale, y;
 
-       /* special cases */
-       if (hx >= 0x4086232b) {  /* if |x| >= 708.39... */
-               if (isnan(x))
-                       return x;
-               if (x > 709.782712893383973096) {
-                       /* overflow if x!=inf */
-                       x *= 0x1p1023;
-                       return x;
-               }
-               if (x < -708.39641853226410622) {
-                       /* underflow if x!=-inf */
-                       FORCE_EVAL((float)(-0x1p-149/x));
-                       if (x < -745.13321910194110842)
-                               return 0;
-               }
+       if ((ki & 0x80000000) == 0) {
+               /* k > 0, the exponent of scale might have overflowed by <= 460.  */
+               sbits -= 1009ull << 52;
+               scale = asdouble(sbits);
+               y = 0x1p1009 * (scale + scale * tmp);
+               return eval_as_double(y);
+       }
+       /* k < 0, need special care in the subnormal range.  */
+       sbits += 1022ull << 52;
+       scale = asdouble(sbits);
+       y = scale + scale * tmp;
+       if (y < 1.0) {
+               /* Round y to the right precision before scaling it into the subnormal
+                range to avoid double rounding that can cause 0.5+E/2 ulp error where
+                E is the worst-case ulp error outside the subnormal range.  So this
+                is only useful if the goal is better than 1 ulp worst-case error.  */
+               double_t hi, lo;
+               lo = scale - y + scale * tmp;
+               hi = 1.0 + y;
+               lo = 1.0 - hi + y + lo;
+               y = eval_as_double(hi + lo) - 1.0;
+               /* Avoid -0.0 with downward rounding.  */
+               if (WANT_ROUNDING && y == 0.0)
+                       y = 0.0;
+               /* The underflow exception needs to be signaled explicitly.  */
+               fp_force_eval(fp_barrier(0x1p-1022) * 0x1p-1022);
        }
+       y = 0x1p-1022 * y;
+       return eval_as_double(y);
+}
 
-       /* argument reduction */
-       if (hx > 0x3fd62e42) {  /* if |x| > 0.5 ln2 */
-               if (hx >= 0x3ff0a2b2)  /* if |x| >= 1.5 ln2 */
-                       k = (int)(invln2*x + half[sign]);
-               else
-                       k = 1 - sign - sign;
-               hi = x - k*ln2hi;  /* k*ln2hi is exact here */
-               lo = k*ln2lo;
-               x = hi - lo;
-       } else if (hx > 0x3e300000)  {  /* if |x| > 2**-28 */
-               k = 0;
-               hi = x;
-               lo = 0;
-       } else {
-               /* inexact if x!=0 */
-               FORCE_EVAL(0x1p1023 + x);
-               return 1 + x;
+/* Top 12 bits of a double (sign and exponent bits).  */
+static inline uint32_t top12(double x)
+{
+       return asuint64(x) >> 52;
+}
+
+double exp(double x)
+{
+       uint32_t abstop;
+       uint64_t ki, idx, top, sbits;
+       double_t kd, z, r, r2, scale, tail, tmp;
+
+       abstop = top12(x) & 0x7ff;
+       if (predict_false(abstop - top12(0x1p-54) >= top12(512.0) - top12(0x1p-54))) {
+               if (abstop - top12(0x1p-54) >= 0x80000000)
+                       /* Avoid spurious underflow for tiny x.  */
+                       /* Note: 0 is common input.  */
+                       return WANT_ROUNDING ? 1.0 + x : 1.0;
+               if (abstop >= top12(1024.0)) {
+                       if (asuint64(x) == asuint64(-INFINITY))
+                               return 0.0;
+                       if (abstop >= top12(INFINITY))
+                               return 1.0 + x;
+                       if (asuint64(x) >> 63)
+                               return __math_uflow(0);
+                       else
+                               return __math_oflow(0);
+               }
+               /* Large x is special cased below.  */
+               abstop = 0;
        }
 
-       /* x is now in primary range */
-       xx = x*x;
-       c = x - xx*(P1+xx*(P2+xx*(P3+xx*(P4+xx*P5))));
-       y = 1 + (x*c/(2-c) - lo + hi);
-       if (k == 0)
-               return y;
-       return scalbn(y, k);
+       /* exp(x) = 2^(k/N) * exp(r), with exp(r) in [2^(-1/2N),2^(1/2N)].  */
+       /* x = ln2/N*k + r, with int k and r in [-ln2/2N, ln2/2N].  */
+       z = InvLn2N * x;
+#if TOINT_INTRINSICS
+       kd = roundtoint(z);
+       ki = converttoint(z);
+#elif EXP_USE_TOINT_NARROW
+       /* z - kd is in [-0.5-2^-16, 0.5] in all rounding modes.  */
+       kd = eval_as_double(z + Shift);
+       ki = asuint64(kd) >> 16;
+       kd = (double_t)(int32_t)ki;
+#else
+       /* z - kd is in [-1, 1] in non-nearest rounding modes.  */
+       kd = eval_as_double(z + Shift);
+       ki = asuint64(kd);
+       kd -= Shift;
+#endif
+       r = x + kd * NegLn2hiN + kd * NegLn2loN;
+       /* 2^(k/N) ~= scale * (1 + tail).  */
+       idx = 2 * (ki % N);
+       top = ki << (52 - EXP_TABLE_BITS);
+       tail = asdouble(T[idx]);
+       /* This is only a valid scale when -1023*N < k < 1024*N.  */
+       sbits = T[idx + 1] + top;
+       /* exp(x) = 2^(k/N) * exp(r) ~= scale + scale * (tail + exp(r) - 1).  */
+       /* Evaluation is optimized assuming superscalar pipelined execution.  */
+       r2 = r * r;
+       /* Without fma the worst case error is 0.25/N ulp larger.  */
+       /* Worst case error is less than 0.5+1.11/N+(abs poly error * 2^53) ulp.  */
+       tmp = tail + r + r2 * (C2 + r * C3) + r2 * r2 * (C4 + r * C5);
+       if (predict_false(abstop == 0))
+               return specialcase(tmp, sbits, ki);
+       scale = asdouble(sbits);
+       /* Note: tmp == 0 or |tmp| > 2^-200 and scale > 2^-739, so there
+          is no spurious underflow here even without fma.  */
+       return eval_as_double(scale + scale * tmp);
 }
index e14adba530e49d25849107a75952d7776402319b..e0ff54bd85bb4a8372a13d26516aa859e6adaf42 100644 (file)
-/* origin: FreeBSD /usr/src/lib/msun/src/s_exp2.c */
-/*-
- * Copyright (c) 2005 David Schultz <das@FreeBSD.ORG>
- * All rights reserved.
- *
- * Redistribution and use in source and binary forms, with or without
- * modification, are permitted provided that the following conditions
- * are met:
- * 1. Redistributions of source code must retain the above copyright
- *    notice, this list of conditions and the following disclaimer.
- * 2. Redistributions in binary form must reproduce the above copyright
- *    notice, this list of conditions and the following disclaimer in the
- *    documentation and/or other materials provided with the distribution.
+/*
+ * Double-precision 2^x function.
  *
- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
- * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
- * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
- * SUCH DAMAGE.
+ * Copyright (c) 2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
  */
 
+#include <math.h>
+#include <stdint.h>
 #include "libm.h"
+#include "exp_data.h"
 
-#define TBLSIZE 256
+#define N (1 << EXP_TABLE_BITS)
+#define Shift __exp_data.exp2_shift
+#define T __exp_data.tab
+#define C1 __exp_data.exp2_poly[0]
+#define C2 __exp_data.exp2_poly[1]
+#define C3 __exp_data.exp2_poly[2]
+#define C4 __exp_data.exp2_poly[3]
+#define C5 __exp_data.exp2_poly[4]
 
-static const double
-redux = 0x1.8p52 / TBLSIZE,
-P1    = 0x1.62e42fefa39efp-1,
-P2    = 0x1.ebfbdff82c575p-3,
-P3    = 0x1.c6b08d704a0a6p-5,
-P4    = 0x1.3b2ab88f70400p-7,
-P5    = 0x1.5d88003875c74p-10;
+/* Handle cases that may overflow or underflow when computing the result that
+   is scale*(1+TMP) without intermediate rounding.  The bit representation of
+   scale is in SBITS, however it has a computed exponent that may have
+   overflown into the sign bit so that needs to be adjusted before using it as
+   a double.  (int32_t)KI is the k used in the argument reduction and exponent
+   adjustment of scale, positive k here means the result may overflow and
+   negative k means the result may underflow.  */
+static inline double specialcase(double_t tmp, uint64_t sbits, uint64_t ki)
+{
+       double_t scale, y;
 
-static const double tbl[TBLSIZE * 2] = {
-/*  exp2(z + eps)          eps     */
-  0x1.6a09e667f3d5dp-1,  0x1.9880p-44,
-  0x1.6b052fa751744p-1,  0x1.8000p-50,
-  0x1.6c012750bd9fep-1, -0x1.8780p-45,
-  0x1.6cfdcddd476bfp-1,  0x1.ec00p-46,
-  0x1.6dfb23c651a29p-1, -0x1.8000p-50,
-  0x1.6ef9298593ae3p-1, -0x1.c000p-52,
-  0x1.6ff7df9519386p-1, -0x1.fd80p-45,
-  0x1.70f7466f42da3p-1, -0x1.c880p-45,
-  0x1.71f75e8ec5fc3p-1,  0x1.3c00p-46,
-  0x1.72f8286eacf05p-1, -0x1.8300p-44,
-  0x1.73f9a48a58152p-1, -0x1.0c00p-47,
-  0x1.74fbd35d7ccfcp-1,  0x1.f880p-45,
-  0x1.75feb564267f1p-1,  0x1.3e00p-47,
-  0x1.77024b1ab6d48p-1, -0x1.7d00p-45,
-  0x1.780694fde5d38p-1, -0x1.d000p-50,
-  0x1.790b938ac1d00p-1,  0x1.3000p-49,
-  0x1.7a11473eb0178p-1, -0x1.d000p-49,
-  0x1.7b17b0976d060p-1,  0x1.0400p-45,
-  0x1.7c1ed0130c133p-1,  0x1.0000p-53,
-  0x1.7d26a62ff8636p-1, -0x1.6900p-45,
-  0x1.7e2f336cf4e3bp-1, -0x1.2e00p-47,
-  0x1.7f3878491c3e8p-1, -0x1.4580p-45,
-  0x1.80427543e1b4ep-1,  0x1.3000p-44,
-  0x1.814d2add1071ap-1,  0x1.f000p-47,
-  0x1.82589994ccd7ep-1, -0x1.1c00p-45,
-  0x1.8364c1eb942d0p-1,  0x1.9d00p-45,
-  0x1.8471a4623cab5p-1,  0x1.7100p-43,
-  0x1.857f4179f5bbcp-1,  0x1.2600p-45,
-  0x1.868d99b4491afp-1, -0x1.2c40p-44,
-  0x1.879cad931a395p-1, -0x1.3000p-45,
-  0x1.88ac7d98a65b8p-1, -0x1.a800p-45,
-  0x1.89bd0a4785800p-1, -0x1.d000p-49,
-  0x1.8ace5422aa223p-1,  0x1.3280p-44,
-  0x1.8be05bad619fap-1,  0x1.2b40p-43,
-  0x1.8cf3216b54383p-1, -0x1.ed00p-45,
-  0x1.8e06a5e08664cp-1, -0x1.0500p-45,
-  0x1.8f1ae99157807p-1,  0x1.8280p-45,
-  0x1.902fed0282c0ep-1, -0x1.cb00p-46,
-  0x1.9145b0b91ff96p-1, -0x1.5e00p-47,
-  0x1.925c353aa2ff9p-1,  0x1.5400p-48,
-  0x1.93737b0cdc64ap-1,  0x1.7200p-46,
-  0x1.948b82b5f98aep-1, -0x1.9000p-47,
-  0x1.95a44cbc852cbp-1,  0x1.5680p-45,
-  0x1.96bdd9a766f21p-1, -0x1.6d00p-44,
-  0x1.97d829fde4e2ap-1, -0x1.1000p-47,
-  0x1.98f33e47a23a3p-1,  0x1.d000p-45,
-  0x1.9a0f170ca0604p-1, -0x1.8a40p-44,
-  0x1.9b2bb4d53ff89p-1,  0x1.55c0p-44,
-  0x1.9c49182a3f15bp-1,  0x1.6b80p-45,
-  0x1.9d674194bb8c5p-1, -0x1.c000p-49,
-  0x1.9e86319e3238ep-1,  0x1.7d00p-46,
-  0x1.9fa5e8d07f302p-1,  0x1.6400p-46,
-  0x1.a0c667b5de54dp-1, -0x1.5000p-48,
-  0x1.a1e7aed8eb8f6p-1,  0x1.9e00p-47,
-  0x1.a309bec4a2e27p-1,  0x1.ad80p-45,
-  0x1.a42c980460a5dp-1, -0x1.af00p-46,
-  0x1.a5503b23e259bp-1,  0x1.b600p-47,
-  0x1.a674a8af46213p-1,  0x1.8880p-44,
-  0x1.a799e1330b3a7p-1,  0x1.1200p-46,
-  0x1.a8bfe53c12e8dp-1,  0x1.6c00p-47,
-  0x1.a9e6b5579fcd2p-1, -0x1.9b80p-45,
-  0x1.ab0e521356fb8p-1,  0x1.b700p-45,
-  0x1.ac36bbfd3f381p-1,  0x1.9000p-50,
-  0x1.ad5ff3a3c2780p-1,  0x1.4000p-49,
-  0x1.ae89f995ad2a3p-1, -0x1.c900p-45,
-  0x1.afb4ce622f367p-1,  0x1.6500p-46,
-  0x1.b0e07298db790p-1,  0x1.fd40p-45,
-  0x1.b20ce6c9a89a9p-1,  0x1.2700p-46,
-  0x1.b33a2b84f1a4bp-1,  0x1.d470p-43,
-  0x1.b468415b747e7p-1, -0x1.8380p-44,
-  0x1.b59728de5593ap-1,  0x1.8000p-54,
-  0x1.b6c6e29f1c56ap-1,  0x1.ad00p-47,
-  0x1.b7f76f2fb5e50p-1,  0x1.e800p-50,
-  0x1.b928cf22749b2p-1, -0x1.4c00p-47,
-  0x1.ba5b030a10603p-1, -0x1.d700p-47,
-  0x1.bb8e0b79a6f66p-1,  0x1.d900p-47,
-  0x1.bcc1e904bc1ffp-1,  0x1.2a00p-47,
-  0x1.bdf69c3f3a16fp-1, -0x1.f780p-46,
-  0x1.bf2c25bd71db8p-1, -0x1.0a00p-46,
-  0x1.c06286141b2e9p-1, -0x1.1400p-46,
-  0x1.c199bdd8552e0p-1,  0x1.be00p-47,
-  0x1.c2d1cd9fa64eep-1, -0x1.9400p-47,
-  0x1.c40ab5fffd02fp-1, -0x1.ed00p-47,
-  0x1.c544778fafd15p-1,  0x1.9660p-44,
-  0x1.c67f12e57d0cbp-1, -0x1.a100p-46,
-  0x1.c7ba88988c1b6p-1, -0x1.8458p-42,
-  0x1.c8f6d9406e733p-1, -0x1.a480p-46,
-  0x1.ca3405751c4dfp-1,  0x1.b000p-51,
-  0x1.cb720dcef9094p-1,  0x1.1400p-47,
-  0x1.ccb0f2e6d1689p-1,  0x1.0200p-48,
-  0x1.cdf0b555dc412p-1,  0x1.3600p-48,
-  0x1.cf3155b5bab3bp-1, -0x1.6900p-47,
-  0x1.d072d4a0789bcp-1,  0x1.9a00p-47,
-  0x1.d1b532b08c8fap-1, -0x1.5e00p-46,
-  0x1.d2f87080d8a85p-1,  0x1.d280p-46,
-  0x1.d43c8eacaa203p-1,  0x1.1a00p-47,
-  0x1.d5818dcfba491p-1,  0x1.f000p-50,
-  0x1.d6c76e862e6a1p-1, -0x1.3a00p-47,
-  0x1.d80e316c9834ep-1, -0x1.cd80p-47,
-  0x1.d955d71ff6090p-1,  0x1.4c00p-48,
-  0x1.da9e603db32aep-1,  0x1.f900p-48,
-  0x1.dbe7cd63a8325p-1,  0x1.9800p-49,
-  0x1.dd321f301b445p-1, -0x1.5200p-48,
-  0x1.de7d5641c05bfp-1, -0x1.d700p-46,
-  0x1.dfc97337b9aecp-1, -0x1.6140p-46,
-  0x1.e11676b197d5ep-1,  0x1.b480p-47,
-  0x1.e264614f5a3e7p-1,  0x1.0ce0p-43,
-  0x1.e3b333b16ee5cp-1,  0x1.c680p-47,
-  0x1.e502ee78b3fb4p-1, -0x1.9300p-47,
-  0x1.e653924676d68p-1, -0x1.5000p-49,
-  0x1.e7a51fbc74c44p-1, -0x1.7f80p-47,
-  0x1.e8f7977cdb726p-1, -0x1.3700p-48,
-  0x1.ea4afa2a490e8p-1,  0x1.5d00p-49,
-  0x1.eb9f4867ccae4p-1,  0x1.61a0p-46,
-  0x1.ecf482d8e680dp-1,  0x1.5500p-48,
-  0x1.ee4aaa2188514p-1,  0x1.6400p-51,
-  0x1.efa1bee615a13p-1, -0x1.e800p-49,
-  0x1.f0f9c1cb64106p-1, -0x1.a880p-48,
-  0x1.f252b376bb963p-1, -0x1.c900p-45,
-  0x1.f3ac948dd7275p-1,  0x1.a000p-53,
-  0x1.f50765b6e4524p-1, -0x1.4f00p-48,
-  0x1.f6632798844fdp-1,  0x1.a800p-51,
-  0x1.f7bfdad9cbe38p-1,  0x1.abc0p-48,
-  0x1.f91d802243c82p-1, -0x1.4600p-50,
-  0x1.fa7c1819e908ep-1, -0x1.b0c0p-47,
-  0x1.fbdba3692d511p-1, -0x1.0e00p-51,
-  0x1.fd3c22b8f7194p-1, -0x1.0de8p-46,
-  0x1.fe9d96b2a23eep-1,  0x1.e430p-49,
-  0x1.0000000000000p+0,  0x0.0000p+0,
-  0x1.00b1afa5abcbep+0, -0x1.3400p-52,
-  0x1.0163da9fb3303p+0, -0x1.2170p-46,
-  0x1.02168143b0282p+0,  0x1.a400p-52,
-  0x1.02c9a3e77806cp+0,  0x1.f980p-49,
-  0x1.037d42e11bbcap+0, -0x1.7400p-51,
-  0x1.04315e86e7f89p+0,  0x1.8300p-50,
-  0x1.04e5f72f65467p+0, -0x1.a3f0p-46,
-  0x1.059b0d315855ap+0, -0x1.2840p-47,
-  0x1.0650a0e3c1f95p+0,  0x1.1600p-48,
-  0x1.0706b29ddf71ap+0,  0x1.5240p-46,
-  0x1.07bd42b72a82dp+0, -0x1.9a00p-49,
-  0x1.0874518759bd0p+0,  0x1.6400p-49,
-  0x1.092bdf66607c8p+0, -0x1.0780p-47,
-  0x1.09e3ecac6f383p+0, -0x1.8000p-54,
-  0x1.0a9c79b1f3930p+0,  0x1.fa00p-48,
-  0x1.0b5586cf988fcp+0, -0x1.ac80p-48,
-  0x1.0c0f145e46c8ap+0,  0x1.9c00p-50,
-  0x1.0cc922b724816p+0,  0x1.5200p-47,
-  0x1.0d83b23395dd8p+0, -0x1.ad00p-48,
-  0x1.0e3ec32d3d1f3p+0,  0x1.bac0p-46,
-  0x1.0efa55fdfa9a6p+0, -0x1.4e80p-47,
-  0x1.0fb66affed2f0p+0, -0x1.d300p-47,
-  0x1.1073028d7234bp+0,  0x1.1500p-48,
-  0x1.11301d0125b5bp+0,  0x1.c000p-49,
-  0x1.11edbab5e2af9p+0,  0x1.6bc0p-46,
-  0x1.12abdc06c31d5p+0,  0x1.8400p-49,
-  0x1.136a814f2047dp+0, -0x1.ed00p-47,
-  0x1.1429aaea92de9p+0,  0x1.8e00p-49,
-  0x1.14e95934f3138p+0,  0x1.b400p-49,
-  0x1.15a98c8a58e71p+0,  0x1.5300p-47,
-  0x1.166a45471c3dfp+0,  0x1.3380p-47,
-  0x1.172b83c7d5211p+0,  0x1.8d40p-45,
-  0x1.17ed48695bb9fp+0, -0x1.5d00p-47,
-  0x1.18af9388c8d93p+0, -0x1.c880p-46,
-  0x1.1972658375d66p+0,  0x1.1f00p-46,
-  0x1.1a35beb6fcba7p+0,  0x1.0480p-46,
-  0x1.1af99f81387e3p+0, -0x1.7390p-43,
-  0x1.1bbe084045d54p+0,  0x1.4e40p-45,
-  0x1.1c82f95281c43p+0, -0x1.a200p-47,
-  0x1.1d4873168b9b2p+0,  0x1.3800p-49,
-  0x1.1e0e75eb44031p+0,  0x1.ac00p-49,
-  0x1.1ed5022fcd938p+0,  0x1.1900p-47,
-  0x1.1f9c18438cdf7p+0, -0x1.b780p-46,
-  0x1.2063b88628d8fp+0,  0x1.d940p-45,
-  0x1.212be3578a81ep+0,  0x1.8000p-50,
-  0x1.21f49917ddd41p+0,  0x1.b340p-45,
-  0x1.22bdda2791323p+0,  0x1.9f80p-46,
-  0x1.2387a6e7561e7p+0, -0x1.9c80p-46,
-  0x1.2451ffb821427p+0,  0x1.2300p-47,
-  0x1.251ce4fb2a602p+0, -0x1.3480p-46,
-  0x1.25e85711eceb0p+0,  0x1.2700p-46,
-  0x1.26b4565e27d16p+0,  0x1.1d00p-46,
-  0x1.2780e341de00fp+0,  0x1.1ee0p-44,
-  0x1.284dfe1f5633ep+0, -0x1.4c00p-46,
-  0x1.291ba7591bb30p+0, -0x1.3d80p-46,
-  0x1.29e9df51fdf09p+0,  0x1.8b00p-47,
-  0x1.2ab8a66d10e9bp+0, -0x1.27c0p-45,
-  0x1.2b87fd0dada3ap+0,  0x1.a340p-45,
-  0x1.2c57e39771af9p+0, -0x1.0800p-46,
-  0x1.2d285a6e402d9p+0, -0x1.ed00p-47,
-  0x1.2df961f641579p+0, -0x1.4200p-48,
-  0x1.2ecafa93e2ecfp+0, -0x1.4980p-45,
-  0x1.2f9d24abd8822p+0, -0x1.6300p-46,
-  0x1.306fe0a31b625p+0, -0x1.2360p-44,
-  0x1.31432edeea50bp+0, -0x1.0df8p-40,
-  0x1.32170fc4cd7b8p+0, -0x1.2480p-45,
-  0x1.32eb83ba8e9a2p+0, -0x1.5980p-45,
-  0x1.33c08b2641766p+0,  0x1.ed00p-46,
-  0x1.3496266e3fa27p+0, -0x1.c000p-50,
-  0x1.356c55f929f0fp+0, -0x1.0d80p-44,
-  0x1.36431a2de88b9p+0,  0x1.2c80p-45,
-  0x1.371a7373aaa39p+0,  0x1.0600p-45,
-  0x1.37f26231e74fep+0, -0x1.6600p-46,
-  0x1.38cae6d05d838p+0, -0x1.ae00p-47,
-  0x1.39a401b713ec3p+0, -0x1.4720p-43,
-  0x1.3a7db34e5a020p+0,  0x1.8200p-47,
-  0x1.3b57fbfec6e95p+0,  0x1.e800p-44,
-  0x1.3c32dc313a8f2p+0,  0x1.f800p-49,
-  0x1.3d0e544ede122p+0, -0x1.7a00p-46,
-  0x1.3dea64c1234bbp+0,  0x1.6300p-45,
-  0x1.3ec70df1c4eccp+0, -0x1.8a60p-43,
-  0x1.3fa4504ac7e8cp+0, -0x1.cdc0p-44,
-  0x1.40822c367a0bbp+0,  0x1.5b80p-45,
-  0x1.4160a21f72e95p+0,  0x1.ec00p-46,
-  0x1.423fb27094646p+0, -0x1.3600p-46,
-  0x1.431f5d950a920p+0,  0x1.3980p-45,
-  0x1.43ffa3f84b9ebp+0,  0x1.a000p-48,
-  0x1.44e0860618919p+0, -0x1.6c00p-48,
-  0x1.45c2042a7d201p+0, -0x1.bc00p-47,
-  0x1.46a41ed1d0016p+0, -0x1.2800p-46,
-  0x1.4786d668b3326p+0,  0x1.0e00p-44,
-  0x1.486a2b5c13c00p+0, -0x1.d400p-45,
-  0x1.494e1e192af04p+0,  0x1.c200p-47,
-  0x1.4a32af0d7d372p+0, -0x1.e500p-46,
-  0x1.4b17dea6db801p+0,  0x1.7800p-47,
-  0x1.4bfdad53629e1p+0, -0x1.3800p-46,
-  0x1.4ce41b817c132p+0,  0x1.0800p-47,
-  0x1.4dcb299fddddbp+0,  0x1.c700p-45,
-  0x1.4eb2d81d8ab96p+0, -0x1.ce00p-46,
-  0x1.4f9b2769d2d02p+0,  0x1.9200p-46,
-  0x1.508417f4531c1p+0, -0x1.8c00p-47,
-  0x1.516daa2cf662ap+0, -0x1.a000p-48,
-  0x1.5257de83f51eap+0,  0x1.a080p-43,
-  0x1.5342b569d4edap+0, -0x1.6d80p-45,
-  0x1.542e2f4f6ac1ap+0, -0x1.2440p-44,
-  0x1.551a4ca5d94dbp+0,  0x1.83c0p-43,
-  0x1.56070dde9116bp+0,  0x1.4b00p-45,
-  0x1.56f4736b529dep+0,  0x1.15a0p-43,
-  0x1.57e27dbe2c40ep+0, -0x1.9e00p-45,
-  0x1.58d12d497c76fp+0, -0x1.3080p-45,
-  0x1.59c0827ff0b4cp+0,  0x1.dec0p-43,
-  0x1.5ab07dd485427p+0, -0x1.4000p-51,
-  0x1.5ba11fba87af4p+0,  0x1.0080p-44,
-  0x1.5c9268a59460bp+0, -0x1.6c80p-45,
-  0x1.5d84590998e3fp+0,  0x1.69a0p-43,
-  0x1.5e76f15ad20e1p+0, -0x1.b400p-46,
-  0x1.5f6a320dcebcap+0,  0x1.7700p-46,
-  0x1.605e1b976dcb8p+0,  0x1.6f80p-45,
-  0x1.6152ae6cdf715p+0,  0x1.1000p-47,
-  0x1.6247eb03a5531p+0, -0x1.5d00p-46,
-  0x1.633dd1d1929b5p+0, -0x1.2d00p-46,
-  0x1.6434634ccc313p+0, -0x1.a800p-49,
-  0x1.652b9febc8efap+0, -0x1.8600p-45,
-  0x1.6623882553397p+0,  0x1.1fe0p-40,
-  0x1.671c1c708328ep+0, -0x1.7200p-44,
-  0x1.68155d44ca97ep+0,  0x1.6800p-49,
-  0x1.690f4b19e9471p+0, -0x1.9780p-45,
-};
+       if ((ki & 0x80000000) == 0) {
+               /* k > 0, the exponent of scale might have overflowed by 1.  */
+               sbits -= 1ull << 52;
+               scale = asdouble(sbits);
+               y = 2 * (scale + scale * tmp);
+               return eval_as_double(y);
+       }
+       /* k < 0, need special care in the subnormal range.  */
+       sbits += 1022ull << 52;
+       scale = asdouble(sbits);
+       y = scale + scale * tmp;
+       if (y < 1.0) {
+               /* Round y to the right precision before scaling it into the subnormal
+                  range to avoid double rounding that can cause 0.5+E/2 ulp error where
+                  E is the worst-case ulp error outside the subnormal range.  So this
+                  is only useful if the goal is better than 1 ulp worst-case error.  */
+               double_t hi, lo;
+               lo = scale - y + scale * tmp;
+               hi = 1.0 + y;
+               lo = 1.0 - hi + y + lo;
+               y = eval_as_double(hi + lo) - 1.0;
+               /* Avoid -0.0 with downward rounding.  */
+               if (WANT_ROUNDING && y == 0.0)
+                       y = 0.0;
+               /* The underflow exception needs to be signaled explicitly.  */
+               fp_force_eval(fp_barrier(0x1p-1022) * 0x1p-1022);
+       }
+       y = 0x1p-1022 * y;
+       return eval_as_double(y);
+}
+
+/* Top 12 bits of a double (sign and exponent bits).  */
+static inline uint32_t top12(double x)
+{
+       return asuint64(x) >> 52;
+}
 
-/*
- * exp2(x): compute the base 2 exponential of x
- *
- * Accuracy: Peak error < 0.503 ulp for normalized results.
- *
- * Method: (accurate tables)
- *
- *   Reduce x:
- *     x = k + y, for integer k and |y| <= 1/2.
- *     Thus we have exp2(x) = 2**k * exp2(y).
- *
- *   Reduce y:
- *     y = i/TBLSIZE + z - eps[i] for integer i near y * TBLSIZE.
- *     Thus we have exp2(y) = exp2(i/TBLSIZE) * exp2(z - eps[i]),
- *     with |z - eps[i]| <= 2**-9 + 2**-39 for the table used.
- *
- *   We compute exp2(i/TBLSIZE) via table lookup and exp2(z - eps[i]) via
- *   a degree-5 minimax polynomial with maximum error under 1.3 * 2**-61.
- *   The values in exp2t[] and eps[] are chosen such that
- *   exp2t[i] = exp2(i/TBLSIZE + eps[i]), and eps[i] is a small offset such
- *   that exp2t[i] is accurate to 2**-64.
- *
- *   Note that the range of i is +-TBLSIZE/2, so we actually index the tables
- *   by i0 = i + TBLSIZE/2.  For cache efficiency, exp2t[] and eps[] are
- *   virtual tables, interleaved in the real table tbl[].
- *
- *   This method is due to Gal, with many details due to Gal and Bachelis:
- *
- *      Gal, S. and Bachelis, B.  An Accurate Elementary Mathematical Library
- *      for the IEEE Floating Point Standard.  TOMS 17(1), 26-46 (1991).
- */
 double exp2(double x)
 {
-       double_t r, t, z;
-       uint32_t ix, i0;
-       union {double f; uint64_t i;} u = {x};
-       union {uint32_t u; int32_t i;} k;
+       uint32_t abstop;
+       uint64_t ki, idx, top, sbits;
+       double_t kd, r, r2, scale, tail, tmp;
 
-       /* Filter out exceptional cases. */
-       ix = u.i>>32 & 0x7fffffff;
-       if (ix >= 0x408ff000) {  /* |x| >= 1022 or nan */
-               if (ix >= 0x40900000 && u.i>>63 == 0) {  /* x >= 1024 or nan */
-                       /* overflow */
-                       x *= 0x1p1023;
-                       return x;
-               }
-               if (ix >= 0x7ff00000)  /* -inf or -nan */
-                       return -1/x;
-               if (u.i>>63) {  /* x <= -1022 */
-                       /* underflow */
-                       if (x <= -1075 || x - 0x1p52 + 0x1p52 != x)
-                               FORCE_EVAL((float)(-0x1p-149/x));
-                       if (x <= -1075)
-                               return 0;
+       abstop = top12(x) & 0x7ff;
+       if (predict_false(abstop - top12(0x1p-54) >= top12(512.0) - top12(0x1p-54))) {
+               if (abstop - top12(0x1p-54) >= 0x80000000)
+                       /* Avoid spurious underflow for tiny x.  */
+                       /* Note: 0 is common input.  */
+                       return WANT_ROUNDING ? 1.0 + x : 1.0;
+               if (abstop >= top12(1024.0)) {
+                       if (asuint64(x) == asuint64(-INFINITY))
+                               return 0.0;
+                       if (abstop >= top12(INFINITY))
+                               return 1.0 + x;
+                       if (!(asuint64(x) >> 63))
+                               return __math_oflow(0);
+                       else if (asuint64(x) >= asuint64(-1075.0))
+                               return __math_uflow(0);
                }
-       } else if (ix < 0x3c900000) {  /* |x| < 0x1p-54 */
-               return 1.0 + x;
+               if (2 * asuint64(x) > 2 * asuint64(928.0))
+                       /* Large x is special cased below.  */
+                       abstop = 0;
        }
 
-       /* Reduce x, computing z, i0, and k. */
-       u.f = x + redux;
-       i0 = u.i;
-       i0 += TBLSIZE / 2;
-       k.u = i0 / TBLSIZE * TBLSIZE;
-       k.i /= TBLSIZE;
-       i0 %= TBLSIZE;
-       u.f -= redux;
-       z = x - u.f;
-
-       /* Compute r = exp2(y) = exp2t[i0] * p(z - eps[i]). */
-       t = tbl[2*i0];       /* exp2t[i0] */
-       z -= tbl[2*i0 + 1];  /* eps[i0]   */
-       r = t + t * z * (P1 + z * (P2 + z * (P3 + z * (P4 + z * P5))));
-
-       return scalbn(r, k.i);
+       /* exp2(x) = 2^(k/N) * 2^r, with 2^r in [2^(-1/2N),2^(1/2N)].  */
+       /* x = k/N + r, with int k and r in [-1/2N, 1/2N].  */
+       kd = eval_as_double(x + Shift);
+       ki = asuint64(kd); /* k.  */
+       kd -= Shift; /* k/N for int k.  */
+       r = x - kd;
+       /* 2^(k/N) ~= scale * (1 + tail).  */
+       idx = 2 * (ki % N);
+       top = ki << (52 - EXP_TABLE_BITS);
+       tail = asdouble(T[idx]);
+       /* This is only a valid scale when -1023*N < k < 1024*N.  */
+       sbits = T[idx + 1] + top;
+       /* exp2(x) = 2^(k/N) * 2^r ~= scale + scale * (tail + 2^r - 1).  */
+       /* Evaluation is optimized assuming superscalar pipelined execution.  */
+       r2 = r * r;
+       /* Without fma the worst case error is 0.5/N ulp larger.  */
+       /* Worst case error is less than 0.5+0.86/N+(abs poly error * 2^53) ulp.  */
+       tmp = tail + r * C1 + r2 * (C2 + r * C3) + r2 * r2 * (C4 + r * C5);
+       if (predict_false(abstop == 0))
+               return specialcase(tmp, sbits, ki);
+       scale = asdouble(sbits);
+       /* Note: tmp == 0 or |tmp| > 2^-65 and scale > 2^-928, so there
+          is no spurious underflow here even without fma.  */
+       return eval_as_double(scale + scale * tmp);
 }
index 296b63436f6443a5edfe5915d844f332bc899583..0360482cae0a371d43a0b8f9faf5569eea87a18c 100644 (file)
-/* origin: FreeBSD /usr/src/lib/msun/src/s_exp2f.c */
-/*-
- * Copyright (c) 2005 David Schultz <das@FreeBSD.ORG>
- * All rights reserved.
- *
- * Redistribution and use in source and binary forms, with or without
- * modification, are permitted provided that the following conditions
- * are met:
- * 1. Redistributions of source code must retain the above copyright
- *    notice, this list of conditions and the following disclaimer.
- * 2. Redistributions in binary form must reproduce the above copyright
- *    notice, this list of conditions and the following disclaimer in the
- *    documentation and/or other materials provided with the distribution.
+/*
+ * Single-precision 2^x function.
  *
- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
- * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
- * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
- * SUCH DAMAGE.
+ * Copyright (c) 2017-2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
  */
 
+#include <math.h>
+#include <stdint.h>
 #include "libm.h"
+#include "exp2f_data.h"
 
-#define TBLSIZE 16
+/*
+EXP2F_TABLE_BITS = 5
+EXP2F_POLY_ORDER = 3
 
-static const float
-redux = 0x1.8p23f / TBLSIZE,
-P1    = 0x1.62e430p-1f,
-P2    = 0x1.ebfbe0p-3f,
-P3    = 0x1.c6b348p-5f,
-P4    = 0x1.3b2c9cp-7f;
+ULP error: 0.502 (nearest rounding.)
+Relative error: 1.69 * 2^-34 in [-1/64, 1/64] (before rounding.)
+Wrong count: 168353 (all nearest rounding wrong results with fma.)
+Non-nearest ULP error: 1 (rounded ULP error)
+*/
 
-static const double exp2ft[TBLSIZE] = {
-  0x1.6a09e667f3bcdp-1,
-  0x1.7a11473eb0187p-1,
-  0x1.8ace5422aa0dbp-1,
-  0x1.9c49182a3f090p-1,
-  0x1.ae89f995ad3adp-1,
-  0x1.c199bdd85529cp-1,
-  0x1.d5818dcfba487p-1,
-  0x1.ea4afa2a490dap-1,
-  0x1.0000000000000p+0,
-  0x1.0b5586cf9890fp+0,
-  0x1.172b83c7d517bp+0,
-  0x1.2387a6e756238p+0,
-  0x1.306fe0a31b715p+0,
-  0x1.3dea64c123422p+0,
-  0x1.4bfdad5362a27p+0,
-  0x1.5ab07dd485429p+0,
-};
+#define N (1 << EXP2F_TABLE_BITS)
+#define T __exp2f_data.tab
+#define C __exp2f_data.poly
+#define SHIFT __exp2f_data.shift_scaled
+
+static inline uint32_t top12(float x)
+{
+       return asuint(x) >> 20;
+}
 
-/*
- * exp2f(x): compute the base 2 exponential of x
- *
- * Accuracy: Peak error < 0.501 ulp; location of peak: -0.030110927.
- *
- * Method: (equally-spaced tables)
- *
- *   Reduce x:
- *     x = k + y, for integer k and |y| <= 1/2.
- *     Thus we have exp2f(x) = 2**k * exp2(y).
- *
- *   Reduce y:
- *     y = i/TBLSIZE + z for integer i near y * TBLSIZE.
- *     Thus we have exp2(y) = exp2(i/TBLSIZE) * exp2(z),
- *     with |z| <= 2**-(TBLSIZE+1).
- *
- *   We compute exp2(i/TBLSIZE) via table lookup and exp2(z) via a
- *   degree-4 minimax polynomial with maximum error under 1.4 * 2**-33.
- *   Using double precision for everything except the reduction makes
- *   roundoff error insignificant and simplifies the scaling step.
- *
- *   This method is due to Tang, but I do not use his suggested parameters:
- *
- *      Tang, P.  Table-driven Implementation of the Exponential Function
- *      in IEEE Floating-Point Arithmetic.  TOMS 15(2), 144-157 (1989).
- */
 float exp2f(float x)
 {
-       double_t t, r, z;
-       union {float f; uint32_t i;} u = {x};
-       union {double f; uint64_t i;} uk;
-       uint32_t ix, i0, k;
+       uint32_t abstop;
+       uint64_t ki, t;
+       double_t kd, xd, z, r, r2, y, s;
 
-       /* Filter out exceptional cases. */
-       ix = u.i & 0x7fffffff;
-       if (ix > 0x42fc0000) {  /* |x| > 126 */
-               if (ix > 0x7f800000) /* NaN */
-                       return x;
-               if (u.i >= 0x43000000 && u.i < 0x80000000) {  /* x >= 128 */
-                       x *= 0x1p127f;
-                       return x;
-               }
-               if (u.i >= 0x80000000) {  /* x < -126 */
-                       if (u.i >= 0xc3160000 || (u.i & 0x0000ffff))
-                               FORCE_EVAL(-0x1p-149f/x);
-                       if (u.i >= 0xc3160000)  /* x <= -150 */
-                               return 0;
-               }
-       } else if (ix <= 0x33000000) {  /* |x| <= 0x1p-25 */
-               return 1.0f + x;
+       xd = (double_t)x;
+       abstop = top12(x) & 0x7ff;
+       if (predict_false(abstop >= top12(128.0f))) {
+               /* |x| >= 128 or x is nan.  */
+               if (asuint(x) == asuint(-INFINITY))
+                       return 0.0f;
+               if (abstop >= top12(INFINITY))
+                       return x + x;
+               if (x > 0.0f)
+                       return __math_oflowf(0);
+               if (x <= -150.0f)
+                       return __math_uflowf(0);
        }
 
-       /* Reduce x, computing z, i0, and k. */
-       u.f = x + redux;
-       i0 = u.i;
-       i0 += TBLSIZE / 2;
-       k = i0 / TBLSIZE;
-       uk.i = (uint64_t)(0x3ff + k)<<52;
-       i0 &= TBLSIZE - 1;
-       u.f -= redux;
-       z = x - u.f;
-       /* Compute r = exp2(y) = exp2ft[i0] * p(z). */
-       r = exp2ft[i0];
-       t = r * z;
-       r = r + t * (P1 + z * P2) + t * (z * z) * (P3 + z * P4);
+       /* x = k/N + r with r in [-1/(2N), 1/(2N)] and int k.  */
+       kd = eval_as_double(xd + SHIFT);
+       ki = asuint64(kd);
+       kd -= SHIFT; /* k/N for int k.  */
+       r = xd - kd;
 
-       /* Scale by 2**k */
-       return r * uk.f;
+       /* exp2(x) = 2^(k/N) * 2^r ~= s * (C0*r^3 + C1*r^2 + C2*r + 1) */
+       t = T[ki % N];
+       t += ki << (52 - EXP2F_TABLE_BITS);
+       s = asdouble(t);
+       z = C[0] * r + C[1];
+       r2 = r * r;
+       y = C[2] * r + 1;
+       y = z * r2 + y;
+       y = y * s;
+       return eval_as_float(y);
 }
diff --git a/libc-top-half/musl/src/math/exp2f_data.c b/libc-top-half/musl/src/math/exp2f_data.c
new file mode 100644 (file)
index 0000000..be32472
--- /dev/null
@@ -0,0 +1,35 @@
+/*
+ * Shared data between expf, exp2f and powf.
+ *
+ * Copyright (c) 2017-2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+
+#include "exp2f_data.h"
+
+#define N (1 << EXP2F_TABLE_BITS)
+
+const struct exp2f_data __exp2f_data = {
+  /* tab[i] = uint(2^(i/N)) - (i << 52-BITS)
+     used for computing 2^(k/N) for an int |k| < 150 N as
+     double(tab[k%N] + (k << 52-BITS)) */
+  .tab = {
+0x3ff0000000000000, 0x3fefd9b0d3158574, 0x3fefb5586cf9890f, 0x3fef9301d0125b51,
+0x3fef72b83c7d517b, 0x3fef54873168b9aa, 0x3fef387a6e756238, 0x3fef1e9df51fdee1,
+0x3fef06fe0a31b715, 0x3feef1a7373aa9cb, 0x3feedea64c123422, 0x3feece086061892d,
+0x3feebfdad5362a27, 0x3feeb42b569d4f82, 0x3feeab07dd485429, 0x3feea47eb03a5585,
+0x3feea09e667f3bcd, 0x3fee9f75e8ec5f74, 0x3feea11473eb0187, 0x3feea589994cce13,
+0x3feeace5422aa0db, 0x3feeb737b0cdc5e5, 0x3feec49182a3f090, 0x3feed503b23e255d,
+0x3feee89f995ad3ad, 0x3feeff76f2fb5e47, 0x3fef199bdd85529c, 0x3fef3720dcef9069,
+0x3fef5818dcfba487, 0x3fef7c97337b9b5f, 0x3fefa4afa2a490da, 0x3fefd0765b6e4540,
+  },
+  .shift_scaled = 0x1.8p+52 / N,
+  .poly = {
+  0x1.c6af84b912394p-5, 0x1.ebfce50fac4f3p-3, 0x1.62e42ff0c52d6p-1,
+  },
+  .shift = 0x1.8p+52,
+  .invln2_scaled = 0x1.71547652b82fep+0 * N,
+  .poly_scaled = {
+  0x1.c6af84b912394p-5/N/N/N, 0x1.ebfce50fac4f3p-3/N/N, 0x1.62e42ff0c52d6p-1/N,
+  },
+};
diff --git a/libc-top-half/musl/src/math/exp2f_data.h b/libc-top-half/musl/src/math/exp2f_data.h
new file mode 100644 (file)
index 0000000..fe744f1
--- /dev/null
@@ -0,0 +1,23 @@
+/*
+ * Copyright (c) 2017-2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+#ifndef _EXP2F_DATA_H
+#define _EXP2F_DATA_H
+
+#include <features.h>
+#include <stdint.h>
+
+/* Shared between expf, exp2f and powf.  */
+#define EXP2F_TABLE_BITS 5
+#define EXP2F_POLY_ORDER 3
+extern hidden const struct exp2f_data {
+       uint64_t tab[1 << EXP2F_TABLE_BITS];
+       double shift_scaled;
+       double poly[EXP2F_POLY_ORDER];
+       double shift;
+       double invln2_scaled;
+       double poly_scaled[EXP2F_POLY_ORDER];
+} __exp2f_data;
+
+#endif
diff --git a/libc-top-half/musl/src/math/exp_data.c b/libc-top-half/musl/src/math/exp_data.c
new file mode 100644 (file)
index 0000000..21be014
--- /dev/null
@@ -0,0 +1,182 @@
+/*
+ * Shared data between exp, exp2 and pow.
+ *
+ * Copyright (c) 2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+
+#include "exp_data.h"
+
+#define N (1 << EXP_TABLE_BITS)
+
+const struct exp_data __exp_data = {
+// N/ln2
+.invln2N = 0x1.71547652b82fep0 * N,
+// -ln2/N
+.negln2hiN = -0x1.62e42fefa0000p-8,
+.negln2loN = -0x1.cf79abc9e3b3ap-47,
+// Used for rounding when !TOINT_INTRINSICS
+#if EXP_USE_TOINT_NARROW
+.shift = 0x1800000000.8p0,
+#else
+.shift = 0x1.8p52,
+#endif
+// exp polynomial coefficients.
+.poly = {
+// abs error: 1.555*2^-66
+// ulp error: 0.509 (0.511 without fma)
+// if |x| < ln2/256+eps
+// abs error if |x| < ln2/256+0x1p-15: 1.09*2^-65
+// abs error if |x| < ln2/128: 1.7145*2^-56
+0x1.ffffffffffdbdp-2,
+0x1.555555555543cp-3,
+0x1.55555cf172b91p-5,
+0x1.1111167a4d017p-7,
+},
+.exp2_shift = 0x1.8p52 / N,
+// exp2 polynomial coefficients.
+.exp2_poly = {
+// abs error: 1.2195*2^-65
+// ulp error: 0.507 (0.511 without fma)
+// if |x| < 1/256
+// abs error if |x| < 1/128: 1.9941*2^-56
+0x1.62e42fefa39efp-1,
+0x1.ebfbdff82c424p-3,
+0x1.c6b08d70cf4b5p-5,
+0x1.3b2abd24650ccp-7,
+0x1.5d7e09b4e3a84p-10,
+},
+// 2^(k/N) ~= H[k]*(1 + T[k]) for int k in [0,N)
+// tab[2*k] = asuint64(T[k])
+// tab[2*k+1] = asuint64(H[k]) - (k << 52)/N
+.tab = {
+0x0, 0x3ff0000000000000,
+0x3c9b3b4f1a88bf6e, 0x3feff63da9fb3335,
+0xbc7160139cd8dc5d, 0x3fefec9a3e778061,
+0xbc905e7a108766d1, 0x3fefe315e86e7f85,
+0x3c8cd2523567f613, 0x3fefd9b0d3158574,
+0xbc8bce8023f98efa, 0x3fefd06b29ddf6de,
+0x3c60f74e61e6c861, 0x3fefc74518759bc8,
+0x3c90a3e45b33d399, 0x3fefbe3ecac6f383,
+0x3c979aa65d837b6d, 0x3fefb5586cf9890f,
+0x3c8eb51a92fdeffc, 0x3fefac922b7247f7,
+0x3c3ebe3d702f9cd1, 0x3fefa3ec32d3d1a2,
+0xbc6a033489906e0b, 0x3fef9b66affed31b,
+0xbc9556522a2fbd0e, 0x3fef9301d0125b51,
+0xbc5080ef8c4eea55, 0x3fef8abdc06c31cc,
+0xbc91c923b9d5f416, 0x3fef829aaea92de0,
+0x3c80d3e3e95c55af, 0x3fef7a98c8a58e51,
+0xbc801b15eaa59348, 0x3fef72b83c7d517b,
+0xbc8f1ff055de323d, 0x3fef6af9388c8dea,
+0x3c8b898c3f1353bf, 0x3fef635beb6fcb75,
+0xbc96d99c7611eb26, 0x3fef5be084045cd4,
+0x3c9aecf73e3a2f60, 0x3fef54873168b9aa,
+0xbc8fe782cb86389d, 0x3fef4d5022fcd91d,
+0x3c8a6f4144a6c38d, 0x3fef463b88628cd6,
+0x3c807a05b0e4047d, 0x3fef3f49917ddc96,
+0x3c968efde3a8a894, 0x3fef387a6e756238,
+0x3c875e18f274487d, 0x3fef31ce4fb2a63f,
+0x3c80472b981fe7f2, 0x3fef2b4565e27cdd,
+0xbc96b87b3f71085e, 0x3fef24dfe1f56381,
+0x3c82f7e16d09ab31, 0x3fef1e9df51fdee1,
+0xbc3d219b1a6fbffa, 0x3fef187fd0dad990,
+0x3c8b3782720c0ab4, 0x3fef1285a6e4030b,
+0x3c6e149289cecb8f, 0x3fef0cafa93e2f56,
+0x3c834d754db0abb6, 0x3fef06fe0a31b715,
+0x3c864201e2ac744c, 0x3fef0170fc4cd831,
+0x3c8fdd395dd3f84a, 0x3feefc08b26416ff,
+0xbc86a3803b8e5b04, 0x3feef6c55f929ff1,
+0xbc924aedcc4b5068, 0x3feef1a7373aa9cb,
+0xbc9907f81b512d8e, 0x3feeecae6d05d866,
+0xbc71d1e83e9436d2, 0x3feee7db34e59ff7,
+0xbc991919b3ce1b15, 0x3feee32dc313a8e5,
+0x3c859f48a72a4c6d, 0x3feedea64c123422,
+0xbc9312607a28698a, 0x3feeda4504ac801c,
+0xbc58a78f4817895b, 0x3feed60a21f72e2a,
+0xbc7c2c9b67499a1b, 0x3feed1f5d950a897,
+0x3c4363ed60c2ac11, 0x3feece086061892d,
+0x3c9666093b0664ef, 0x3feeca41ed1d0057,
+0x3c6ecce1daa10379, 0x3feec6a2b5c13cd0,
+0x3c93ff8e3f0f1230, 0x3feec32af0d7d3de,
+0x3c7690cebb7aafb0, 0x3feebfdad5362a27,
+0x3c931dbdeb54e077, 0x3feebcb299fddd0d,
+0xbc8f94340071a38e, 0x3feeb9b2769d2ca7,
+0xbc87deccdc93a349, 0x3feeb6daa2cf6642,
+0xbc78dec6bd0f385f, 0x3feeb42b569d4f82,
+0xbc861246ec7b5cf6, 0x3feeb1a4ca5d920f,
+0x3c93350518fdd78e, 0x3feeaf4736b527da,
+0x3c7b98b72f8a9b05, 0x3feead12d497c7fd,
+0x3c9063e1e21c5409, 0x3feeab07dd485429,
+0x3c34c7855019c6ea, 0x3feea9268a5946b7,
+0x3c9432e62b64c035, 0x3feea76f15ad2148,
+0xbc8ce44a6199769f, 0x3feea5e1b976dc09,
+0xbc8c33c53bef4da8, 0x3feea47eb03a5585,
+0xbc845378892be9ae, 0x3feea34634ccc320,
+0xbc93cedd78565858, 0x3feea23882552225,
+0x3c5710aa807e1964, 0x3feea155d44ca973,
+0xbc93b3efbf5e2228, 0x3feea09e667f3bcd,
+0xbc6a12ad8734b982, 0x3feea012750bdabf,
+0xbc6367efb86da9ee, 0x3fee9fb23c651a2f,
+0xbc80dc3d54e08851, 0x3fee9f7df9519484,
+0xbc781f647e5a3ecf, 0x3fee9f75e8ec5f74,
+0xbc86ee4ac08b7db0, 0x3fee9f9a48a58174,
+0xbc8619321e55e68a, 0x3fee9feb564267c9,
+0x3c909ccb5e09d4d3, 0x3feea0694fde5d3f,
+0xbc7b32dcb94da51d, 0x3feea11473eb0187,
+0x3c94ecfd5467c06b, 0x3feea1ed0130c132,
+0x3c65ebe1abd66c55, 0x3feea2f336cf4e62,
+0xbc88a1c52fb3cf42, 0x3feea427543e1a12,
+0xbc9369b6f13b3734, 0x3feea589994cce13,
+0xbc805e843a19ff1e, 0x3feea71a4623c7ad,
+0xbc94d450d872576e, 0x3feea8d99b4492ed,
+0x3c90ad675b0e8a00, 0x3feeaac7d98a6699,
+0x3c8db72fc1f0eab4, 0x3feeace5422aa0db,
+0xbc65b6609cc5e7ff, 0x3feeaf3216b5448c,
+0x3c7bf68359f35f44, 0x3feeb1ae99157736,
+0xbc93091fa71e3d83, 0x3feeb45b0b91ffc6,
+0xbc5da9b88b6c1e29, 0x3feeb737b0cdc5e5,
+0xbc6c23f97c90b959, 0x3feeba44cbc8520f,
+0xbc92434322f4f9aa, 0x3feebd829fde4e50,
+0xbc85ca6cd7668e4b, 0x3feec0f170ca07ba,
+0x3c71affc2b91ce27, 0x3feec49182a3f090,
+0x3c6dd235e10a73bb, 0x3feec86319e32323,
+0xbc87c50422622263, 0x3feecc667b5de565,
+0x3c8b1c86e3e231d5, 0x3feed09bec4a2d33,
+0xbc91bbd1d3bcbb15, 0x3feed503b23e255d,
+0x3c90cc319cee31d2, 0x3feed99e1330b358,
+0x3c8469846e735ab3, 0x3feede6b5579fdbf,
+0xbc82dfcd978e9db4, 0x3feee36bbfd3f37a,
+0x3c8c1a7792cb3387, 0x3feee89f995ad3ad,
+0xbc907b8f4ad1d9fa, 0x3feeee07298db666,
+0xbc55c3d956dcaeba, 0x3feef3a2b84f15fb,
+0xbc90a40e3da6f640, 0x3feef9728de5593a,
+0xbc68d6f438ad9334, 0x3feeff76f2fb5e47,
+0xbc91eee26b588a35, 0x3fef05b030a1064a,
+0x3c74ffd70a5fddcd, 0x3fef0c1e904bc1d2,
+0xbc91bdfbfa9298ac, 0x3fef12c25bd71e09,
+0x3c736eae30af0cb3, 0x3fef199bdd85529c,
+0x3c8ee3325c9ffd94, 0x3fef20ab5fffd07a,
+0x3c84e08fd10959ac, 0x3fef27f12e57d14b,
+0x3c63cdaf384e1a67, 0x3fef2f6d9406e7b5,
+0x3c676b2c6c921968, 0x3fef3720dcef9069,
+0xbc808a1883ccb5d2, 0x3fef3f0b555dc3fa,
+0xbc8fad5d3ffffa6f, 0x3fef472d4a07897c,
+0xbc900dae3875a949, 0x3fef4f87080d89f2,
+0x3c74a385a63d07a7, 0x3fef5818dcfba487,
+0xbc82919e2040220f, 0x3fef60e316c98398,
+0x3c8e5a50d5c192ac, 0x3fef69e603db3285,
+0x3c843a59ac016b4b, 0x3fef7321f301b460,
+0xbc82d52107b43e1f, 0x3fef7c97337b9b5f,
+0xbc892ab93b470dc9, 0x3fef864614f5a129,
+0x3c74b604603a88d3, 0x3fef902ee78b3ff6,
+0x3c83c5ec519d7271, 0x3fef9a51fbc74c83,
+0xbc8ff7128fd391f0, 0x3fefa4afa2a490da,
+0xbc8dae98e223747d, 0x3fefaf482d8e67f1,
+0x3c8ec3bc41aa2008, 0x3fefba1bee615a27,
+0x3c842b94c3a9eb32, 0x3fefc52b376bba97,
+0x3c8a64a931d185ee, 0x3fefd0765b6e4540,
+0xbc8e37bae43be3ed, 0x3fefdbfdad9cbe14,
+0x3c77893b4d91cd9d, 0x3fefe7c1819e90d8,
+0x3c5305c14160cc89, 0x3feff3c22b8f71f1,
+},
+};
diff --git a/libc-top-half/musl/src/math/exp_data.h b/libc-top-half/musl/src/math/exp_data.h
new file mode 100644 (file)
index 0000000..3e24bac
--- /dev/null
@@ -0,0 +1,26 @@
+/*
+ * Copyright (c) 2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+#ifndef _EXP_DATA_H
+#define _EXP_DATA_H
+
+#include <features.h>
+#include <stdint.h>
+
+#define EXP_TABLE_BITS 7
+#define EXP_POLY_ORDER 5
+#define EXP_USE_TOINT_NARROW 0
+#define EXP2_POLY_ORDER 5
+extern hidden const struct exp_data {
+       double invln2N;
+       double shift;
+       double negln2hiN;
+       double negln2loN;
+       double poly[4]; /* Last four coefficients.  */
+       double exp2_shift;
+       double exp2_poly[EXP2_POLY_ORDER];
+       uint64_t tab[2*(1 << EXP_TABLE_BITS)];
+} __exp_data;
+
+#endif
index feee2b0ed21741c88f520d354655bccaaca7f402..f9fbf8e727db635c0ea0b5685d374895b8bbffd2 100644 (file)
@@ -1,83 +1,80 @@
-/* origin: FreeBSD /usr/src/lib/msun/src/e_expf.c */
 /*
- * Conversion to float by Ian Lance Taylor, Cygnus Support, ian@cygnus.com.
- */
-/*
- * ====================================================
- * Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
+ * Single-precision e^x function.
  *
- * Developed at SunPro, a Sun Microsystems, Inc. business.
- * Permission to use, copy, modify, and distribute this
- * software is freely granted, provided that this notice
- * is preserved.
- * ====================================================
+ * Copyright (c) 2017-2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
  */
 
+#include <math.h>
+#include <stdint.h>
 #include "libm.h"
+#include "exp2f_data.h"
 
-static const float
-half[2] = {0.5,-0.5},
-ln2hi   = 6.9314575195e-1f,  /* 0x3f317200 */
-ln2lo   = 1.4286067653e-6f,  /* 0x35bfbe8e */
-invln2  = 1.4426950216e+0f,  /* 0x3fb8aa3b */
 /*
- * Domain [-0.34568, 0.34568], range ~[-4.278e-9, 4.447e-9]:
- * |x*(exp(x)+1)/(exp(x)-1) - p(x)| < 2**-27.74
- */
-P1 =  1.6666625440e-1f, /*  0xaaaa8f.0p-26 */
-P2 = -2.7667332906e-3f; /* -0xb55215.0p-32 */
+EXP2F_TABLE_BITS = 5
+EXP2F_POLY_ORDER = 3
 
-float expf(float x)
+ULP error: 0.502 (nearest rounding.)
+Relative error: 1.69 * 2^-34 in [-ln2/64, ln2/64] (before rounding.)
+Wrong count: 170635 (all nearest rounding wrong results with fma.)
+Non-nearest ULP error: 1 (rounded ULP error)
+*/
+
+#define N (1 << EXP2F_TABLE_BITS)
+#define InvLn2N __exp2f_data.invln2_scaled
+#define T __exp2f_data.tab
+#define C __exp2f_data.poly_scaled
+
+static inline uint32_t top12(float x)
 {
-       float_t hi, lo, c, xx, y;
-       int k, sign;
-       uint32_t hx;
+       return asuint(x) >> 20;
+}
 
-       GET_FLOAT_WORD(hx, x);
-       sign = hx >> 31;   /* sign bit of x */
-       hx &= 0x7fffffff;  /* high word of |x| */
+float expf(float x)
+{
+       uint32_t abstop;
+       uint64_t ki, t;
+       double_t kd, xd, z, r, r2, y, s;
 
-       /* special cases */
-       if (hx >= 0x42aeac50) {  /* if |x| >= -87.33655f or NaN */
-               if (hx > 0x7f800000) /* NaN */
-                       return x;
-               if (hx >= 0x42b17218 && !sign) {  /* x >= 88.722839f */
-                       /* overflow */
-                       x *= 0x1p127f;
-                       return x;
-               }
-               if (sign) {
-                       /* underflow */
-                       FORCE_EVAL(-0x1p-149f/x);
-                       if (hx >= 0x42cff1b5)  /* x <= -103.972084f */
-                               return 0;
-               }
+       xd = (double_t)x;
+       abstop = top12(x) & 0x7ff;
+       if (predict_false(abstop >= top12(88.0f))) {
+               /* |x| >= 88 or x is nan.  */
+               if (asuint(x) == asuint(-INFINITY))
+                       return 0.0f;
+               if (abstop >= top12(INFINITY))
+                       return x + x;
+               if (x > 0x1.62e42ep6f) /* x > log(0x1p128) ~= 88.72 */
+                       return __math_oflowf(0);
+               if (x < -0x1.9fe368p6f) /* x < log(0x1p-150) ~= -103.97 */
+                       return __math_uflowf(0);
        }
 
-       /* argument reduction */
-       if (hx > 0x3eb17218) {  /* if |x| > 0.5 ln2 */
-               if (hx > 0x3f851592)  /* if |x| > 1.5 ln2 */
-                       k = invln2*x + half[sign];
-               else
-                       k = 1 - sign - sign;
-               hi = x - k*ln2hi;  /* k*ln2hi is exact here */
-               lo = k*ln2lo;
-               x = hi - lo;
-       } else if (hx > 0x39000000) {  /* |x| > 2**-14 */
-               k = 0;
-               hi = x;
-               lo = 0;
-       } else {
-               /* raise inexact */
-               FORCE_EVAL(0x1p127f + x);
-               return 1 + x;
-       }
+       /* x*N/Ln2 = k + r with r in [-1/2, 1/2] and int k.  */
+       z = InvLn2N * xd;
+
+       /* Round and convert z to int, the result is in [-150*N, 128*N] and
+          ideally ties-to-even rule is used, otherwise the magnitude of r
+          can be bigger which gives larger approximation error.  */
+#if TOINT_INTRINSICS
+       kd = roundtoint(z);
+       ki = converttoint(z);
+#else
+# define SHIFT __exp2f_data.shift
+       kd = eval_as_double(z + SHIFT);
+       ki = asuint64(kd);
+       kd -= SHIFT;
+#endif
+       r = z - kd;
 
-       /* x is now in primary range */
-       xx = x*x;
-       c = x - xx*(P1+xx*P2);
-       y = 1 + (x*c/(2-c) - lo + hi);
-       if (k == 0)
-               return y;
-       return scalbnf(y, k);
+       /* exp(x) = 2^(k/N) * 2^(r/N) ~= s * (C0*r^3 + C1*r^2 + C2*r + 1) */
+       t = T[ki % N];
+       t += ki << (52 - EXP2F_TABLE_BITS);
+       s = asdouble(t);
+       z = C[0] * r + C[1];
+       r2 = r * r;
+       y = C[2] * r + 1;
+       y = z * r2 + y;
+       y = y * s;
+       return eval_as_float(y);
 }
index e61e113d41af91f86d4482a979c84966be66fe33..cc52585a949886be2788a80f46af23f0784fde7f 100644 (file)
-/* origin: FreeBSD /usr/src/lib/msun/src/e_log.c */
 /*
- * ====================================================
- * Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
+ * Double-precision log(x) function.
  *
- * Developed at SunSoft, a Sun Microsystems, Inc. business.
- * Permission to use, copy, modify, and distribute this
- * software is freely granted, provided that this notice
- * is preserved.
- * ====================================================
- */
-/* log(x)
- * Return the logarithm of x
- *
- * Method :
- *   1. Argument Reduction: find k and f such that
- *                      x = 2^k * (1+f),
- *         where  sqrt(2)/2 < 1+f < sqrt(2) .
- *
- *   2. Approximation of log(1+f).
- *      Let s = f/(2+f) ; based on log(1+f) = log(1+s) - log(1-s)
- *               = 2s + 2/3 s**3 + 2/5 s**5 + .....,
- *               = 2s + s*R
- *      We use a special Remez algorithm on [0,0.1716] to generate
- *      a polynomial of degree 14 to approximate R The maximum error
- *      of this polynomial approximation is bounded by 2**-58.45. In
- *      other words,
- *                      2      4      6      8      10      12      14
- *          R(z) ~ Lg1*s +Lg2*s +Lg3*s +Lg4*s +Lg5*s  +Lg6*s  +Lg7*s
- *      (the values of Lg1 to Lg7 are listed in the program)
- *      and
- *          |      2          14          |     -58.45
- *          | Lg1*s +...+Lg7*s    -  R(z) | <= 2
- *          |                             |
- *      Note that 2s = f - s*f = f - hfsq + s*hfsq, where hfsq = f*f/2.
- *      In order to guarantee error in log below 1ulp, we compute log
- *      by
- *              log(1+f) = f - s*(f - R)        (if f is not too large)
- *              log(1+f) = f - (hfsq - s*(hfsq+R)).     (better accuracy)
- *
- *      3. Finally,  log(x) = k*ln2 + log(1+f).
- *                          = k*ln2_hi+(f-(hfsq-(s*(hfsq+R)+k*ln2_lo)))
- *         Here ln2 is split into two floating point number:
- *                      ln2_hi + ln2_lo,
- *         where n*ln2_hi is always exact for |n| < 2000.
- *
- * Special cases:
- *      log(x) is NaN with signal if x < 0 (including -INF) ;
- *      log(+INF) is +INF; log(0) is -INF with signal;
- *      log(NaN) is that NaN with no signal.
- *
- * Accuracy:
- *      according to an error analysis, the error is always less than
- *      1 ulp (unit in the last place).
- *
- * Constants:
- * The hexadecimal values are the intended ones for the following
- * constants. The decimal values may be used, provided that the
- * compiler will convert from decimal to binary accurately enough
- * to produce the hexadecimal values shown.
+ * Copyright (c) 2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
  */
 
 #include <math.h>
 #include <stdint.h>
+#include "libm.h"
+#include "log_data.h"
+
+#define T __log_data.tab
+#define T2 __log_data.tab2
+#define B __log_data.poly1
+#define A __log_data.poly
+#define Ln2hi __log_data.ln2hi
+#define Ln2lo __log_data.ln2lo
+#define N (1 << LOG_TABLE_BITS)
+#define OFF 0x3fe6000000000000
 
-static const double
-ln2_hi = 6.93147180369123816490e-01,  /* 3fe62e42 fee00000 */
-ln2_lo = 1.90821492927058770002e-10,  /* 3dea39ef 35793c76 */
-Lg1 = 6.666666666666735130e-01,  /* 3FE55555 55555593 */
-Lg2 = 3.999999999940941908e-01,  /* 3FD99999 9997FA04 */
-Lg3 = 2.857142874366239149e-01,  /* 3FD24924 94229359 */
-Lg4 = 2.222219843214978396e-01,  /* 3FCC71C5 1D8E78AF */
-Lg5 = 1.818357216161805012e-01,  /* 3FC74664 96CB03DE */
-Lg6 = 1.531383769920937332e-01,  /* 3FC39A09 D078C69F */
-Lg7 = 1.479819860511658591e-01;  /* 3FC2F112 DF3E5244 */
+/* Top 16 bits of a double.  */
+static inline uint32_t top16(double x)
+{
+       return asuint64(x) >> 48;
+}
 
 double log(double x)
 {
-       union {double f; uint64_t i;} u = {x};
-       double_t hfsq,f,s,z,R,w,t1,t2,dk;
-       uint32_t hx;
-       int k;
+       double_t w, z, r, r2, r3, y, invc, logc, kd, hi, lo;
+       uint64_t ix, iz, tmp;
+       uint32_t top;
+       int k, i;
+
+       ix = asuint64(x);
+       top = top16(x);
+#define LO asuint64(1.0 - 0x1p-4)
+#define HI asuint64(1.0 + 0x1.09p-4)
+       if (predict_false(ix - LO < HI - LO)) {
+               /* Handle close to 1.0 inputs separately.  */
+               /* Fix sign of zero with downward rounding when x==1.  */
+               if (WANT_ROUNDING && predict_false(ix == asuint64(1.0)))
+                       return 0;
+               r = x - 1.0;
+               r2 = r * r;
+               r3 = r * r2;
+               y = r3 *
+                   (B[1] + r * B[2] + r2 * B[3] +
+                    r3 * (B[4] + r * B[5] + r2 * B[6] +
+                          r3 * (B[7] + r * B[8] + r2 * B[9] + r3 * B[10])));
+               /* Worst-case error is around 0.507 ULP.  */
+               w = r * 0x1p27;
+               double_t rhi = r + w - w;
+               double_t rlo = r - rhi;
+               w = rhi * rhi * B[0]; /* B[0] == -0.5.  */
+               hi = r + w;
+               lo = r - hi + w;
+               lo += B[0] * rlo * (rhi + r);
+               y += lo;
+               y += hi;
+               return eval_as_double(y);
+       }
+       if (predict_false(top - 0x0010 >= 0x7ff0 - 0x0010)) {
+               /* x < 0x1p-1022 or inf or nan.  */
+               if (ix * 2 == 0)
+                       return __math_divzero(1);
+               if (ix == asuint64(INFINITY)) /* log(inf) == inf.  */
+                       return x;
+               if ((top & 0x8000) || (top & 0x7ff0) == 0x7ff0)
+                       return __math_invalid(x);
+               /* x is subnormal, normalize it.  */
+               ix = asuint64(x * 0x1p52);
+               ix -= 52ULL << 52;
+       }
+
+       /* x = 2^k z; where z is in range [OFF,2*OFF) and exact.
+          The range is split into N subintervals.
+          The ith subinterval contains z and c is near its center.  */
+       tmp = ix - OFF;
+       i = (tmp >> (52 - LOG_TABLE_BITS)) % N;
+       k = (int64_t)tmp >> 52; /* arithmetic shift */
+       iz = ix - (tmp & 0xfffULL << 52);
+       invc = T[i].invc;
+       logc = T[i].logc;
+       z = asdouble(iz);
 
-       hx = u.i>>32;
-       k = 0;
-       if (hx < 0x00100000 || hx>>31) {
-               if (u.i<<1 == 0)
-                       return -1/(x*x);  /* log(+-0)=-inf */
-               if (hx>>31)
-                       return (x-x)/0.0; /* log(-#) = NaN */
-               /* subnormal number, scale x up */
-               k -= 54;
-               x *= 0x1p54;
-               u.f = x;
-               hx = u.i>>32;
-       } else if (hx >= 0x7ff00000) {
-               return x;
-       } else if (hx == 0x3ff00000 && u.i<<32 == 0)
-               return 0;
+       /* log(x) = log1p(z/c-1) + log(c) + k*Ln2.  */
+       /* r ~= z/c - 1, |r| < 1/(2*N).  */
+#if __FP_FAST_FMA
+       /* rounding error: 0x1p-55/N.  */
+       r = __builtin_fma(z, invc, -1.0);
+#else
+       /* rounding error: 0x1p-55/N + 0x1p-66.  */
+       r = (z - T2[i].chi - T2[i].clo) * invc;
+#endif
+       kd = (double_t)k;
 
-       /* reduce x into [sqrt(2)/2, sqrt(2)] */
-       hx += 0x3ff00000 - 0x3fe6a09e;
-       k += (int)(hx>>20) - 0x3ff;
-       hx = (hx&0x000fffff) + 0x3fe6a09e;
-       u.i = (uint64_t)hx<<32 | (u.i&0xffffffff);
-       x = u.f;
+       /* hi + lo = r + log(c) + k*Ln2.  */
+       w = kd * Ln2hi + logc;
+       hi = w + r;
+       lo = w - hi + r + kd * Ln2lo;
 
-       f = x - 1.0;
-       hfsq = 0.5*f*f;
-       s = f/(2.0+f);
-       z = s*s;
-       w = z*z;
-       t1 = w*(Lg2+w*(Lg4+w*Lg6));
-       t2 = z*(Lg1+w*(Lg3+w*(Lg5+w*Lg7)));
-       R = t2 + t1;
-       dk = k;
-       return s*(hfsq+R) + dk*ln2_lo - hfsq + f + dk*ln2_hi;
+       /* log(x) = lo + (log1p(r) - r) + hi.  */
+       r2 = r * r; /* rounding error: 0x1p-54/N^2.  */
+       /* Worst case error if |y| > 0x1p-5:
+          0.5 + 4.13/N + abs-poly-error*2^57 ULP (+ 0.002 ULP without fma)
+          Worst case error if |y| > 0x1p-4:
+          0.5 + 2.06/N + abs-poly-error*2^56 ULP (+ 0.001 ULP without fma).  */
+       y = lo + r2 * A[0] +
+           r * r2 * (A[1] + r * A[2] + r2 * (A[3] + r * A[4])) + hi;
+       return eval_as_double(y);
 }
index 0aafad4b86c1cd3bf7b69090534aa1f5a05fda36..1276ed4e310097a7acf622f060f5feb9f9806064 100644 (file)
-/* origin: FreeBSD /usr/src/lib/msun/src/e_log2.c */
 /*
- * ====================================================
- * Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
+ * Double-precision log2(x) function.
  *
- * Developed at SunSoft, a Sun Microsystems, Inc. business.
- * Permission to use, copy, modify, and distribute this
- * software is freely granted, provided that this notice
- * is preserved.
- * ====================================================
- */
-/*
- * Return the base 2 logarithm of x.  See log.c for most comments.
- *
- * Reduce x to 2^k (1+f) and calculate r = log(1+f) - f + f*f/2
- * as in log.c, then combine and scale in extra precision:
- *    log2(x) = (f - f*f/2 + r)/log(2) + k
+ * Copyright (c) 2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
  */
 
 #include <math.h>
 #include <stdint.h>
+#include "libm.h"
+#include "log2_data.h"
 
-static const double
-ivln2hi = 1.44269504072144627571e+00, /* 0x3ff71547, 0x65200000 */
-ivln2lo = 1.67517131648865118353e-10, /* 0x3de705fc, 0x2eefa200 */
-Lg1 = 6.666666666666735130e-01,  /* 3FE55555 55555593 */
-Lg2 = 3.999999999940941908e-01,  /* 3FD99999 9997FA04 */
-Lg3 = 2.857142874366239149e-01,  /* 3FD24924 94229359 */
-Lg4 = 2.222219843214978396e-01,  /* 3FCC71C5 1D8E78AF */
-Lg5 = 1.818357216161805012e-01,  /* 3FC74664 96CB03DE */
-Lg6 = 1.531383769920937332e-01,  /* 3FC39A09 D078C69F */
-Lg7 = 1.479819860511658591e-01;  /* 3FC2F112 DF3E5244 */
+#define T __log2_data.tab
+#define T2 __log2_data.tab2
+#define B __log2_data.poly1
+#define A __log2_data.poly
+#define InvLn2hi __log2_data.invln2hi
+#define InvLn2lo __log2_data.invln2lo
+#define N (1 << LOG2_TABLE_BITS)
+#define OFF 0x3fe6000000000000
 
-double log2(double x)
+/* Top 16 bits of a double.  */
+static inline uint32_t top16(double x)
 {
-       union {double f; uint64_t i;} u = {x};
-       double_t hfsq,f,s,z,R,w,t1,t2,y,hi,lo,val_hi,val_lo;
-       uint32_t hx;
-       int k;
-
-       hx = u.i>>32;
-       k = 0;
-       if (hx < 0x00100000 || hx>>31) {
-               if (u.i<<1 == 0)
-                       return -1/(x*x);  /* log(+-0)=-inf */
-               if (hx>>31)
-                       return (x-x)/0.0; /* log(-#) = NaN */
-               /* subnormal number, scale x up */
-               k -= 54;
-               x *= 0x1p54;
-               u.f = x;
-               hx = u.i>>32;
-       } else if (hx >= 0x7ff00000) {
-               return x;
-       } else if (hx == 0x3ff00000 && u.i<<32 == 0)
-               return 0;
-
-       /* reduce x into [sqrt(2)/2, sqrt(2)] */
-       hx += 0x3ff00000 - 0x3fe6a09e;
-       k += (int)(hx>>20) - 0x3ff;
-       hx = (hx&0x000fffff) + 0x3fe6a09e;
-       u.i = (uint64_t)hx<<32 | (u.i&0xffffffff);
-       x = u.f;
+       return asuint64(x) >> 48;
+}
 
-       f = x - 1.0;
-       hfsq = 0.5*f*f;
-       s = f/(2.0+f);
-       z = s*s;
-       w = z*z;
-       t1 = w*(Lg2+w*(Lg4+w*Lg6));
-       t2 = z*(Lg1+w*(Lg3+w*(Lg5+w*Lg7)));
-       R = t2 + t1;
+double log2(double x)
+{
+       double_t z, r, r2, r4, y, invc, logc, kd, hi, lo, t1, t2, t3, p;
+       uint64_t ix, iz, tmp;
+       uint32_t top;
+       int k, i;
 
-       /*
-        * f-hfsq must (for args near 1) be evaluated in extra precision
-        * to avoid a large cancellation when x is near sqrt(2) or 1/sqrt(2).
-        * This is fairly efficient since f-hfsq only depends on f, so can
-        * be evaluated in parallel with R.  Not combining hfsq with R also
-        * keeps R small (though not as small as a true `lo' term would be),
-        * so that extra precision is not needed for terms involving R.
-        *
-        * Compiler bugs involving extra precision used to break Dekker's
-        * theorem for spitting f-hfsq as hi+lo, unless double_t was used
-        * or the multi-precision calculations were avoided when double_t
-        * has extra precision.  These problems are now automatically
-        * avoided as a side effect of the optimization of combining the
-        * Dekker splitting step with the clear-low-bits step.
-        *
-        * y must (for args near sqrt(2) and 1/sqrt(2)) be added in extra
-        * precision to avoid a very large cancellation when x is very near
-        * these values.  Unlike the above cancellations, this problem is
-        * specific to base 2.  It is strange that adding +-1 is so much
-        * harder than adding +-ln2 or +-log10_2.
-        *
-        * This uses Dekker's theorem to normalize y+val_hi, so the
-        * compiler bugs are back in some configurations, sigh.  And I
-        * don't want to used double_t to avoid them, since that gives a
-        * pessimization and the support for avoiding the pessimization
-        * is not yet available.
-        *
-        * The multi-precision calculations for the multiplications are
-        * routine.
-        */
+       ix = asuint64(x);
+       top = top16(x);
+#define LO asuint64(1.0 - 0x1.5b51p-5)
+#define HI asuint64(1.0 + 0x1.6ab2p-5)
+       if (predict_false(ix - LO < HI - LO)) {
+               /* Handle close to 1.0 inputs separately.  */
+               /* Fix sign of zero with downward rounding when x==1.  */
+               if (WANT_ROUNDING && predict_false(ix == asuint64(1.0)))
+                       return 0;
+               r = x - 1.0;
+#if __FP_FAST_FMA
+               hi = r * InvLn2hi;
+               lo = r * InvLn2lo + __builtin_fma(r, InvLn2hi, -hi);
+#else
+               double_t rhi, rlo;
+               rhi = asdouble(asuint64(r) & -1ULL << 32);
+               rlo = r - rhi;
+               hi = rhi * InvLn2hi;
+               lo = rlo * InvLn2hi + r * InvLn2lo;
+#endif
+               r2 = r * r; /* rounding error: 0x1p-62.  */
+               r4 = r2 * r2;
+               /* Worst-case error is less than 0.54 ULP (0.55 ULP without fma).  */
+               p = r2 * (B[0] + r * B[1]);
+               y = hi + p;
+               lo += hi - y + p;
+               lo += r4 * (B[2] + r * B[3] + r2 * (B[4] + r * B[5]) +
+                           r4 * (B[6] + r * B[7] + r2 * (B[8] + r * B[9])));
+               y += lo;
+               return eval_as_double(y);
+       }
+       if (predict_false(top - 0x0010 >= 0x7ff0 - 0x0010)) {
+               /* x < 0x1p-1022 or inf or nan.  */
+               if (ix * 2 == 0)
+                       return __math_divzero(1);
+               if (ix == asuint64(INFINITY)) /* log(inf) == inf.  */
+                       return x;
+               if ((top & 0x8000) || (top & 0x7ff0) == 0x7ff0)
+                       return __math_invalid(x);
+               /* x is subnormal, normalize it.  */
+               ix = asuint64(x * 0x1p52);
+               ix -= 52ULL << 52;
+       }
 
-       /* hi+lo = f - hfsq + s*(hfsq+R) ~ log(1+f) */
-       hi = f - hfsq;
-       u.f = hi;
-       u.i &= (uint64_t)-1<<32;
-       hi = u.f;
-       lo = f - hi - hfsq + s*(hfsq+R);
+       /* x = 2^k z; where z is in range [OFF,2*OFF) and exact.
+          The range is split into N subintervals.
+          The ith subinterval contains z and c is near its center.  */
+       tmp = ix - OFF;
+       i = (tmp >> (52 - LOG2_TABLE_BITS)) % N;
+       k = (int64_t)tmp >> 52; /* arithmetic shift */
+       iz = ix - (tmp & 0xfffULL << 52);
+       invc = T[i].invc;
+       logc = T[i].logc;
+       z = asdouble(iz);
+       kd = (double_t)k;
 
-       val_hi = hi*ivln2hi;
-       val_lo = (lo+hi)*ivln2lo + lo*ivln2hi;
+       /* log2(x) = log2(z/c) + log2(c) + k.  */
+       /* r ~= z/c - 1, |r| < 1/(2*N).  */
+#if __FP_FAST_FMA
+       /* rounding error: 0x1p-55/N.  */
+       r = __builtin_fma(z, invc, -1.0);
+       t1 = r * InvLn2hi;
+       t2 = r * InvLn2lo + __builtin_fma(r, InvLn2hi, -t1);
+#else
+       double_t rhi, rlo;
+       /* rounding error: 0x1p-55/N + 0x1p-65.  */
+       r = (z - T2[i].chi - T2[i].clo) * invc;
+       rhi = asdouble(asuint64(r) & -1ULL << 32);
+       rlo = r - rhi;
+       t1 = rhi * InvLn2hi;
+       t2 = rlo * InvLn2hi + r * InvLn2lo;
+#endif
 
-       /* spadd(val_hi, val_lo, y), except for not using double_t: */
-       y = k;
-       w = y + val_hi;
-       val_lo += (y - w) + val_hi;
-       val_hi = w;
+       /* hi + lo = r/ln2 + log2(c) + k.  */
+       t3 = kd + logc;
+       hi = t3 + t1;
+       lo = t3 - hi + t1 + t2;
 
-       return val_lo + val_hi;
+       /* log2(r+1) = r/ln2 + r^2*poly(r).  */
+       /* Evaluation is optimized assuming superscalar pipelined execution.  */
+       r2 = r * r; /* rounding error: 0x1p-54/N^2.  */
+       r4 = r2 * r2;
+       /* Worst-case error if |y| > 0x1p-4: 0.547 ULP (0.550 ULP without fma).
+          ~ 0.5 + 2/N/ln2 + abs-poly-error*0x1p56 ULP (+ 0.003 ULP without fma).  */
+       p = A[0] + r * A[1] + r2 * (A[2] + r * A[3]) + r4 * (A[4] + r * A[5]);
+       y = lo + r2 * p + hi;
+       return eval_as_double(y);
 }
diff --git a/libc-top-half/musl/src/math/log2_data.c b/libc-top-half/musl/src/math/log2_data.c
new file mode 100644 (file)
index 0000000..3dd1ca5
--- /dev/null
@@ -0,0 +1,201 @@
+/*
+ * Data for log2.
+ *
+ * Copyright (c) 2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+
+#include "log2_data.h"
+
+#define N (1 << LOG2_TABLE_BITS)
+
+const struct log2_data __log2_data = {
+// First coefficient: 0x1.71547652b82fe1777d0ffda0d24p0
+.invln2hi = 0x1.7154765200000p+0,
+.invln2lo = 0x1.705fc2eefa200p-33,
+.poly1 = {
+// relative error: 0x1.2fad8188p-63
+// in -0x1.5b51p-5 0x1.6ab2p-5
+-0x1.71547652b82fep-1,
+0x1.ec709dc3a03f7p-2,
+-0x1.71547652b7c3fp-2,
+0x1.2776c50f05be4p-2,
+-0x1.ec709dd768fe5p-3,
+0x1.a61761ec4e736p-3,
+-0x1.7153fbc64a79bp-3,
+0x1.484d154f01b4ap-3,
+-0x1.289e4a72c383cp-3,
+0x1.0b32f285aee66p-3,
+},
+.poly = {
+// relative error: 0x1.a72c2bf8p-58
+// abs error: 0x1.67a552c8p-66
+// in -0x1.f45p-8 0x1.f45p-8
+-0x1.71547652b8339p-1,
+0x1.ec709dc3a04bep-2,
+-0x1.7154764702ffbp-2,
+0x1.2776c50034c48p-2,
+-0x1.ec7b328ea92bcp-3,
+0x1.a6225e117f92ep-3,
+},
+/* Algorithm:
+
+       x = 2^k z
+       log2(x) = k + log2(c) + log2(z/c)
+       log2(z/c) = poly(z/c - 1)
+
+where z is in [1.6p-1; 1.6p0] which is split into N subintervals and z falls
+into the ith one, then table entries are computed as
+
+       tab[i].invc = 1/c
+       tab[i].logc = (double)log2(c)
+       tab2[i].chi = (double)c
+       tab2[i].clo = (double)(c - (double)c)
+
+where c is near the center of the subinterval and is chosen by trying +-2^29
+floating point invc candidates around 1/center and selecting one for which
+
+       1) the rounding error in 0x1.8p10 + logc is 0,
+       2) the rounding error in z - chi - clo is < 0x1p-64 and
+       3) the rounding error in (double)log2(c) is minimized (< 0x1p-68).
+
+Note: 1) ensures that k + logc can be computed without rounding error, 2)
+ensures that z/c - 1 can be computed as (z - chi - clo)*invc with close to a
+single rounding error when there is no fast fma for z*invc - 1, 3) ensures
+that logc + poly(z/c - 1) has small error, however near x == 1 when
+|log2(x)| < 0x1p-4, this is not enough so that is special cased.  */
+.tab = {
+{0x1.724286bb1acf8p+0, -0x1.1095feecdb000p-1},
+{0x1.6e1f766d2cca1p+0, -0x1.08494bd76d000p-1},
+{0x1.6a13d0e30d48ap+0, -0x1.00143aee8f800p-1},
+{0x1.661ec32d06c85p+0, -0x1.efec5360b4000p-2},
+{0x1.623fa951198f8p+0, -0x1.dfdd91ab7e000p-2},
+{0x1.5e75ba4cf026cp+0, -0x1.cffae0cc79000p-2},
+{0x1.5ac055a214fb8p+0, -0x1.c043811fda000p-2},
+{0x1.571ed0f166e1ep+0, -0x1.b0b67323ae000p-2},
+{0x1.53909590bf835p+0, -0x1.a152f5a2db000p-2},
+{0x1.5014fed61adddp+0, -0x1.9217f5af86000p-2},
+{0x1.4cab88e487bd0p+0, -0x1.8304db0719000p-2},
+{0x1.49539b4334feep+0, -0x1.74189f9a9e000p-2},
+{0x1.460cbdfafd569p+0, -0x1.6552bb5199000p-2},
+{0x1.42d664ee4b953p+0, -0x1.56b23a29b1000p-2},
+{0x1.3fb01111dd8a6p+0, -0x1.483650f5fa000p-2},
+{0x1.3c995b70c5836p+0, -0x1.39de937f6a000p-2},
+{0x1.3991c4ab6fd4ap+0, -0x1.2baa1538d6000p-2},
+{0x1.3698e0ce099b5p+0, -0x1.1d98340ca4000p-2},
+{0x1.33ae48213e7b2p+0, -0x1.0fa853a40e000p-2},
+{0x1.30d191985bdb1p+0, -0x1.01d9c32e73000p-2},
+{0x1.2e025cab271d7p+0, -0x1.e857da2fa6000p-3},
+{0x1.2b404cf13cd82p+0, -0x1.cd3c8633d8000p-3},
+{0x1.288b02c7ccb50p+0, -0x1.b26034c14a000p-3},
+{0x1.25e2263944de5p+0, -0x1.97c1c2f4fe000p-3},
+{0x1.234563d8615b1p+0, -0x1.7d6023f800000p-3},
+{0x1.20b46e33eaf38p+0, -0x1.633a71a05e000p-3},
+{0x1.1e2eefdcda3ddp+0, -0x1.494f5e9570000p-3},
+{0x1.1bb4a580b3930p+0, -0x1.2f9e424e0a000p-3},
+{0x1.19453847f2200p+0, -0x1.162595afdc000p-3},
+{0x1.16e06c0d5d73cp+0, -0x1.f9c9a75bd8000p-4},
+{0x1.1485f47b7e4c2p+0, -0x1.c7b575bf9c000p-4},
+{0x1.12358ad0085d1p+0, -0x1.960c60ff48000p-4},
+{0x1.0fef00f532227p+0, -0x1.64ce247b60000p-4},
+{0x1.0db2077d03a8fp+0, -0x1.33f78b2014000p-4},
+{0x1.0b7e6d65980d9p+0, -0x1.0387d1a42c000p-4},
+{0x1.0953efe7b408dp+0, -0x1.a6f9208b50000p-5},
+{0x1.07325cac53b83p+0, -0x1.47a954f770000p-5},
+{0x1.05197e40d1b5cp+0, -0x1.d23a8c50c0000p-6},
+{0x1.03091c1208ea2p+0, -0x1.16a2629780000p-6},
+{0x1.0101025b37e21p+0, -0x1.720f8d8e80000p-8},
+{0x1.fc07ef9caa76bp-1, 0x1.6fe53b1500000p-7},
+{0x1.f4465d3f6f184p-1, 0x1.11ccce10f8000p-5},
+{0x1.ecc079f84107fp-1, 0x1.c4dfc8c8b8000p-5},
+{0x1.e573a99975ae8p-1, 0x1.3aa321e574000p-4},
+{0x1.de5d6f0bd3de6p-1, 0x1.918a0d08b8000p-4},
+{0x1.d77b681ff38b3p-1, 0x1.e72e9da044000p-4},
+{0x1.d0cb5724de943p-1, 0x1.1dcd2507f6000p-3},
+{0x1.ca4b2dc0e7563p-1, 0x1.476ab03dea000p-3},
+{0x1.c3f8ee8d6cb51p-1, 0x1.7074377e22000p-3},
+{0x1.bdd2b4f020c4cp-1, 0x1.98ede8ba94000p-3},
+{0x1.b7d6c006015cap-1, 0x1.c0db86ad2e000p-3},
+{0x1.b20366e2e338fp-1, 0x1.e840aafcee000p-3},
+{0x1.ac57026295039p-1, 0x1.0790ab4678000p-2},
+{0x1.a6d01bc2731ddp-1, 0x1.1ac056801c000p-2},
+{0x1.a16d3bc3ff18bp-1, 0x1.2db11d4fee000p-2},
+{0x1.9c2d14967feadp-1, 0x1.406464ec58000p-2},
+{0x1.970e4f47c9902p-1, 0x1.52dbe093af000p-2},
+{0x1.920fb3982bcf2p-1, 0x1.651902050d000p-2},
+{0x1.8d30187f759f1p-1, 0x1.771d2cdeaf000p-2},
+{0x1.886e5ebb9f66dp-1, 0x1.88e9c857d9000p-2},
+{0x1.83c97b658b994p-1, 0x1.9a80155e16000p-2},
+{0x1.7f405ffc61022p-1, 0x1.abe186ed3d000p-2},
+{0x1.7ad22181415cap-1, 0x1.bd0f2aea0e000p-2},
+{0x1.767dcf99eff8cp-1, 0x1.ce0a43dbf4000p-2},
+},
+#if !__FP_FAST_FMA
+.tab2 = {
+{0x1.6200012b90a8ep-1, 0x1.904ab0644b605p-55},
+{0x1.66000045734a6p-1, 0x1.1ff9bea62f7a9p-57},
+{0x1.69fffc325f2c5p-1, 0x1.27ecfcb3c90bap-55},
+{0x1.6e00038b95a04p-1, 0x1.8ff8856739326p-55},
+{0x1.71fffe09994e3p-1, 0x1.afd40275f82b1p-55},
+{0x1.7600015590e1p-1, -0x1.2fd75b4238341p-56},
+{0x1.7a00012655bd5p-1, 0x1.808e67c242b76p-56},
+{0x1.7e0003259e9a6p-1, -0x1.208e426f622b7p-57},
+{0x1.81fffedb4b2d2p-1, -0x1.402461ea5c92fp-55},
+{0x1.860002dfafcc3p-1, 0x1.df7f4a2f29a1fp-57},
+{0x1.89ffff78c6b5p-1, -0x1.e0453094995fdp-55},
+{0x1.8e00039671566p-1, -0x1.a04f3bec77b45p-55},
+{0x1.91fffe2bf1745p-1, -0x1.7fa34400e203cp-56},
+{0x1.95fffcc5c9fd1p-1, -0x1.6ff8005a0695dp-56},
+{0x1.9a0003bba4767p-1, 0x1.0f8c4c4ec7e03p-56},
+{0x1.9dfffe7b92da5p-1, 0x1.e7fd9478c4602p-55},
+{0x1.a1fffd72efdafp-1, -0x1.a0c554dcdae7ep-57},
+{0x1.a5fffde04ff95p-1, 0x1.67da98ce9b26bp-55},
+{0x1.a9fffca5e8d2bp-1, -0x1.284c9b54c13dep-55},
+{0x1.adfffddad03eap-1, 0x1.812c8ea602e3cp-58},
+{0x1.b1ffff10d3d4dp-1, -0x1.efaddad27789cp-55},
+{0x1.b5fffce21165ap-1, 0x1.3cb1719c61237p-58},
+{0x1.b9fffd950e674p-1, 0x1.3f7d94194cep-56},
+{0x1.be000139ca8afp-1, 0x1.50ac4215d9bcp-56},
+{0x1.c20005b46df99p-1, 0x1.beea653e9c1c9p-57},
+{0x1.c600040b9f7aep-1, -0x1.c079f274a70d6p-56},
+{0x1.ca0006255fd8ap-1, -0x1.a0b4076e84c1fp-56},
+{0x1.cdfffd94c095dp-1, 0x1.8f933f99ab5d7p-55},
+{0x1.d1ffff975d6cfp-1, -0x1.82c08665fe1bep-58},
+{0x1.d5fffa2561c93p-1, -0x1.b04289bd295f3p-56},
+{0x1.d9fff9d228b0cp-1, 0x1.70251340fa236p-55},
+{0x1.de00065bc7e16p-1, -0x1.5011e16a4d80cp-56},
+{0x1.e200002f64791p-1, 0x1.9802f09ef62ep-55},
+{0x1.e600057d7a6d8p-1, -0x1.e0b75580cf7fap-56},
+{0x1.ea00027edc00cp-1, -0x1.c848309459811p-55},
+{0x1.ee0006cf5cb7cp-1, -0x1.f8027951576f4p-55},
+{0x1.f2000782b7dccp-1, -0x1.f81d97274538fp-55},
+{0x1.f6000260c450ap-1, -0x1.071002727ffdcp-59},
+{0x1.f9fffe88cd533p-1, -0x1.81bdce1fda8bp-58},
+{0x1.fdfffd50f8689p-1, 0x1.7f91acb918e6ep-55},
+{0x1.0200004292367p+0, 0x1.b7ff365324681p-54},
+{0x1.05fffe3e3d668p+0, 0x1.6fa08ddae957bp-55},
+{0x1.0a0000a85a757p+0, -0x1.7e2de80d3fb91p-58},
+{0x1.0e0001a5f3fccp+0, -0x1.1823305c5f014p-54},
+{0x1.11ffff8afbaf5p+0, -0x1.bfabb6680bac2p-55},
+{0x1.15fffe54d91adp+0, -0x1.d7f121737e7efp-54},
+{0x1.1a00011ac36e1p+0, 0x1.c000a0516f5ffp-54},
+{0x1.1e00019c84248p+0, -0x1.082fbe4da5dap-54},
+{0x1.220000ffe5e6ep+0, -0x1.8fdd04c9cfb43p-55},
+{0x1.26000269fd891p+0, 0x1.cfe2a7994d182p-55},
+{0x1.2a00029a6e6dap+0, -0x1.00273715e8bc5p-56},
+{0x1.2dfffe0293e39p+0, 0x1.b7c39dab2a6f9p-54},
+{0x1.31ffff7dcf082p+0, 0x1.df1336edc5254p-56},
+{0x1.35ffff05a8b6p+0, -0x1.e03564ccd31ebp-54},
+{0x1.3a0002e0eaeccp+0, 0x1.5f0e74bd3a477p-56},
+{0x1.3e000043bb236p+0, 0x1.c7dcb149d8833p-54},
+{0x1.4200002d187ffp+0, 0x1.e08afcf2d3d28p-56},
+{0x1.460000d387cb1p+0, 0x1.20837856599a6p-55},
+{0x1.4a00004569f89p+0, -0x1.9fa5c904fbcd2p-55},
+{0x1.4e000043543f3p+0, -0x1.81125ed175329p-56},
+{0x1.51fffcc027f0fp+0, 0x1.883d8847754dcp-54},
+{0x1.55ffffd87b36fp+0, -0x1.709e731d02807p-55},
+{0x1.59ffff21df7bap+0, 0x1.7f79f68727b02p-55},
+{0x1.5dfffebfc3481p+0, -0x1.180902e30e93ep-54},
+},
+#endif
+};
diff --git a/libc-top-half/musl/src/math/log2_data.h b/libc-top-half/musl/src/math/log2_data.h
new file mode 100644 (file)
index 0000000..276a786
--- /dev/null
@@ -0,0 +1,28 @@
+/*
+ * Copyright (c) 2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+#ifndef _LOG2_DATA_H
+#define _LOG2_DATA_H
+
+#include <features.h>
+
+#define LOG2_TABLE_BITS 6
+#define LOG2_POLY_ORDER 7
+#define LOG2_POLY1_ORDER 11
+extern hidden const struct log2_data {
+       double invln2hi;
+       double invln2lo;
+       double poly[LOG2_POLY_ORDER - 1];
+       double poly1[LOG2_POLY1_ORDER - 1];
+       struct {
+               double invc, logc;
+       } tab[1 << LOG2_TABLE_BITS];
+#if !__FP_FAST_FMA
+       struct {
+               double chi, clo;
+       } tab2[1 << LOG2_TABLE_BITS];
+#endif
+} __log2_data;
+
+#endif
index b3e305fe2a629f13a6967444d1d875289b430a0f..c368f88f33f5cc4eb261a247ffebf6df760c63ce 100644 (file)
@@ -1,74 +1,72 @@
-/* origin: FreeBSD /usr/src/lib/msun/src/e_log2f.c */
 /*
- * ====================================================
- * Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
+ * Single-precision log2 function.
  *
- * Developed at SunPro, a Sun Microsystems, Inc. business.
- * Permission to use, copy, modify, and distribute this
- * software is freely granted, provided that this notice
- * is preserved.
- * ====================================================
- */
-/*
- * See comments in log2.c.
+ * Copyright (c) 2017-2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
  */
 
 #include <math.h>
 #include <stdint.h>
+#include "libm.h"
+#include "log2f_data.h"
+
+/*
+LOG2F_TABLE_BITS = 4
+LOG2F_POLY_ORDER = 4
+
+ULP error: 0.752 (nearest rounding.)
+Relative error: 1.9 * 2^-26 (before rounding.)
+*/
 
-static const float
-ivln2hi =  1.4428710938e+00, /* 0x3fb8b000 */
-ivln2lo = -1.7605285393e-04, /* 0xb9389ad4 */
-/* |(log(1+s)-log(1-s))/s - Lg(s)| < 2**-34.24 (~[-4.95e-11, 4.97e-11]). */
-Lg1 = 0xaaaaaa.0p-24, /* 0.66666662693 */
-Lg2 = 0xccce13.0p-25, /* 0.40000972152 */
-Lg3 = 0x91e9ee.0p-25, /* 0.28498786688 */
-Lg4 = 0xf89e26.0p-26; /* 0.24279078841 */
+#define N (1 << LOG2F_TABLE_BITS)
+#define T __log2f_data.tab
+#define A __log2f_data.poly
+#define OFF 0x3f330000
 
 float log2f(float x)
 {
-       union {float f; uint32_t i;} u = {x};
-       float_t hfsq,f,s,z,R,w,t1,t2,hi,lo;
-       uint32_t ix;
-       int k;
+       double_t z, r, r2, p, y, y0, invc, logc;
+       uint32_t ix, iz, top, tmp;
+       int k, i;
 
-       ix = u.i;
-       k = 0;
-       if (ix < 0x00800000 || ix>>31) {  /* x < 2**-126  */
-               if (ix<<1 == 0)
-                       return -1/(x*x);  /* log(+-0)=-inf */
-               if (ix>>31)
-                       return (x-x)/0.0f; /* log(-#) = NaN */
-               /* subnormal number, scale up x */
-               k -= 25;
-               x *= 0x1p25f;
-               u.f = x;
-               ix = u.i;
-       } else if (ix >= 0x7f800000) {
-               return x;
-       } else if (ix == 0x3f800000)
+       ix = asuint(x);
+       /* Fix sign of zero with downward rounding when x==1.  */
+       if (WANT_ROUNDING && predict_false(ix == 0x3f800000))
                return 0;
+       if (predict_false(ix - 0x00800000 >= 0x7f800000 - 0x00800000)) {
+               /* x < 0x1p-126 or inf or nan.  */
+               if (ix * 2 == 0)
+                       return __math_divzerof(1);
+               if (ix == 0x7f800000) /* log2(inf) == inf.  */
+                       return x;
+               if ((ix & 0x80000000) || ix * 2 >= 0xff000000)
+                       return __math_invalidf(x);
+               /* x is subnormal, normalize it.  */
+               ix = asuint(x * 0x1p23f);
+               ix -= 23 << 23;
+       }
 
-       /* reduce x into [sqrt(2)/2, sqrt(2)] */
-       ix += 0x3f800000 - 0x3f3504f3;
-       k += (int)(ix>>23) - 0x7f;
-       ix = (ix&0x007fffff) + 0x3f3504f3;
-       u.i = ix;
-       x = u.f;
+       /* x = 2^k z; where z is in range [OFF,2*OFF] and exact.
+          The range is split into N subintervals.
+          The ith subinterval contains z and c is near its center.  */
+       tmp = ix - OFF;
+       i = (tmp >> (23 - LOG2F_TABLE_BITS)) % N;
+       top = tmp & 0xff800000;
+       iz = ix - top;
+       k = (int32_t)tmp >> 23; /* arithmetic shift */
+       invc = T[i].invc;
+       logc = T[i].logc;
+       z = (double_t)asfloat(iz);
 
-       f = x - 1.0f;
-       s = f/(2.0f + f);
-       z = s*s;
-       w = z*z;
-       t1= w*(Lg2+w*Lg4);
-       t2= z*(Lg1+w*Lg3);
-       R = t2 + t1;
-       hfsq = 0.5f*f*f;
+       /* log2(x) = log1p(z/c-1)/ln2 + log2(c) + k */
+       r = z * invc - 1;
+       y0 = logc + (double_t)k;
 
-       hi = f - hfsq;
-       u.f = hi;
-       u.i &= 0xfffff000;
-       hi = u.f;
-       lo = f - hi - hfsq + s*(hfsq+R);
-       return (lo+hi)*ivln2lo + lo*ivln2hi + hi*ivln2hi + k;
+       /* Pipelined polynomial evaluation to approximate log1p(r)/ln2.  */
+       r2 = r * r;
+       y = A[1] * r + A[2];
+       y = A[0] * r2 + y;
+       p = A[3] * r + y0;
+       y = y * r2 + p;
+       return eval_as_float(y);
 }
diff --git a/libc-top-half/musl/src/math/log2f_data.c b/libc-top-half/musl/src/math/log2f_data.c
new file mode 100644 (file)
index 0000000..24e450f
--- /dev/null
@@ -0,0 +1,33 @@
+/*
+ * Data definition for log2f.
+ *
+ * Copyright (c) 2017-2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+
+#include "log2f_data.h"
+
+const struct log2f_data __log2f_data = {
+  .tab = {
+  { 0x1.661ec79f8f3bep+0, -0x1.efec65b963019p-2 },
+  { 0x1.571ed4aaf883dp+0, -0x1.b0b6832d4fca4p-2 },
+  { 0x1.49539f0f010bp+0, -0x1.7418b0a1fb77bp-2 },
+  { 0x1.3c995b0b80385p+0, -0x1.39de91a6dcf7bp-2 },
+  { 0x1.30d190c8864a5p+0, -0x1.01d9bf3f2b631p-2 },
+  { 0x1.25e227b0b8eap+0, -0x1.97c1d1b3b7afp-3 },
+  { 0x1.1bb4a4a1a343fp+0, -0x1.2f9e393af3c9fp-3 },
+  { 0x1.12358f08ae5bap+0, -0x1.960cbbf788d5cp-4 },
+  { 0x1.0953f419900a7p+0, -0x1.a6f9db6475fcep-5 },
+  { 0x1p+0, 0x0p+0 },
+  { 0x1.e608cfd9a47acp-1, 0x1.338ca9f24f53dp-4 },
+  { 0x1.ca4b31f026aap-1, 0x1.476a9543891bap-3 },
+  { 0x1.b2036576afce6p-1, 0x1.e840b4ac4e4d2p-3 },
+  { 0x1.9c2d163a1aa2dp-1, 0x1.40645f0c6651cp-2 },
+  { 0x1.886e6037841edp-1, 0x1.88e9c2c1b9ff8p-2 },
+  { 0x1.767dcf5534862p-1, 0x1.ce0a44eb17bccp-2 },
+  },
+  .poly = {
+  -0x1.712b6f70a7e4dp-2, 0x1.ecabf496832ep-2, -0x1.715479ffae3dep-1,
+  0x1.715475f35c8b8p0,
+  }
+};
diff --git a/libc-top-half/musl/src/math/log2f_data.h b/libc-top-half/musl/src/math/log2f_data.h
new file mode 100644 (file)
index 0000000..4fa4895
--- /dev/null
@@ -0,0 +1,19 @@
+/*
+ * Copyright (c) 2017-2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+#ifndef _LOG2F_DATA_H
+#define _LOG2F_DATA_H
+
+#include <features.h>
+
+#define LOG2F_TABLE_BITS 4
+#define LOG2F_POLY_ORDER 4
+extern hidden const struct log2f_data {
+       struct {
+               double invc, logc;
+       } tab[1 << LOG2F_TABLE_BITS];
+       double poly[LOG2F_POLY_ORDER];
+} __log2f_data;
+
+#endif
diff --git a/libc-top-half/musl/src/math/log_data.c b/libc-top-half/musl/src/math/log_data.c
new file mode 100644 (file)
index 0000000..1a6ec71
--- /dev/null
@@ -0,0 +1,328 @@
+/*
+ * Data for log.
+ *
+ * Copyright (c) 2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+
+#include "log_data.h"
+
+#define N (1 << LOG_TABLE_BITS)
+
+const struct log_data __log_data = {
+.ln2hi = 0x1.62e42fefa3800p-1,
+.ln2lo = 0x1.ef35793c76730p-45,
+.poly1 = {
+// relative error: 0x1.c04d76cp-63
+// in -0x1p-4 0x1.09p-4 (|log(1+x)| > 0x1p-4 outside the interval)
+-0x1p-1,
+0x1.5555555555577p-2,
+-0x1.ffffffffffdcbp-3,
+0x1.999999995dd0cp-3,
+-0x1.55555556745a7p-3,
+0x1.24924a344de3p-3,
+-0x1.fffffa4423d65p-4,
+0x1.c7184282ad6cap-4,
+-0x1.999eb43b068ffp-4,
+0x1.78182f7afd085p-4,
+-0x1.5521375d145cdp-4,
+},
+.poly = {
+// relative error: 0x1.926199e8p-56
+// abs error: 0x1.882ff33p-65
+// in -0x1.fp-9 0x1.fp-9
+-0x1.0000000000001p-1,
+0x1.555555551305bp-2,
+-0x1.fffffffeb459p-3,
+0x1.999b324f10111p-3,
+-0x1.55575e506c89fp-3,
+},
+/* Algorithm:
+
+       x = 2^k z
+       log(x) = k ln2 + log(c) + log(z/c)
+       log(z/c) = poly(z/c - 1)
+
+where z is in [1.6p-1; 1.6p0] which is split into N subintervals and z falls
+into the ith one, then table entries are computed as
+
+       tab[i].invc = 1/c
+       tab[i].logc = (double)log(c)
+       tab2[i].chi = (double)c
+       tab2[i].clo = (double)(c - (double)c)
+
+where c is near the center of the subinterval and is chosen by trying +-2^29
+floating point invc candidates around 1/center and selecting one for which
+
+       1) the rounding error in 0x1.8p9 + logc is 0,
+       2) the rounding error in z - chi - clo is < 0x1p-66 and
+       3) the rounding error in (double)log(c) is minimized (< 0x1p-66).
+
+Note: 1) ensures that k*ln2hi + logc can be computed without rounding error,
+2) ensures that z/c - 1 can be computed as (z - chi - clo)*invc with close to
+a single rounding error when there is no fast fma for z*invc - 1, 3) ensures
+that logc + poly(z/c - 1) has small error, however near x == 1 when
+|log(x)| < 0x1p-4, this is not enough so that is special cased.  */
+.tab = {
+{0x1.734f0c3e0de9fp+0, -0x1.7cc7f79e69000p-2},
+{0x1.713786a2ce91fp+0, -0x1.76feec20d0000p-2},
+{0x1.6f26008fab5a0p+0, -0x1.713e31351e000p-2},
+{0x1.6d1a61f138c7dp+0, -0x1.6b85b38287800p-2},
+{0x1.6b1490bc5b4d1p+0, -0x1.65d5590807800p-2},
+{0x1.69147332f0cbap+0, -0x1.602d076180000p-2},
+{0x1.6719f18224223p+0, -0x1.5a8ca86909000p-2},
+{0x1.6524f99a51ed9p+0, -0x1.54f4356035000p-2},
+{0x1.63356aa8f24c4p+0, -0x1.4f637c36b4000p-2},
+{0x1.614b36b9ddc14p+0, -0x1.49da7fda85000p-2},
+{0x1.5f66452c65c4cp+0, -0x1.445923989a800p-2},
+{0x1.5d867b5912c4fp+0, -0x1.3edf439b0b800p-2},
+{0x1.5babccb5b90dep+0, -0x1.396ce448f7000p-2},
+{0x1.59d61f2d91a78p+0, -0x1.3401e17bda000p-2},
+{0x1.5805612465687p+0, -0x1.2e9e2ef468000p-2},
+{0x1.56397cee76bd3p+0, -0x1.2941b3830e000p-2},
+{0x1.54725e2a77f93p+0, -0x1.23ec58cda8800p-2},
+{0x1.52aff42064583p+0, -0x1.1e9e129279000p-2},
+{0x1.50f22dbb2bddfp+0, -0x1.1956d2b48f800p-2},
+{0x1.4f38f4734ded7p+0, -0x1.141679ab9f800p-2},
+{0x1.4d843cfde2840p+0, -0x1.0edd094ef9800p-2},
+{0x1.4bd3ec078a3c8p+0, -0x1.09aa518db1000p-2},
+{0x1.4a27fc3e0258ap+0, -0x1.047e65263b800p-2},
+{0x1.4880524d48434p+0, -0x1.feb224586f000p-3},
+{0x1.46dce1b192d0bp+0, -0x1.f474a7517b000p-3},
+{0x1.453d9d3391854p+0, -0x1.ea4443d103000p-3},
+{0x1.43a2744b4845ap+0, -0x1.e020d44e9b000p-3},
+{0x1.420b54115f8fbp+0, -0x1.d60a22977f000p-3},
+{0x1.40782da3ef4b1p+0, -0x1.cc00104959000p-3},
+{0x1.3ee8f5d57fe8fp+0, -0x1.c202956891000p-3},
+{0x1.3d5d9a00b4ce9p+0, -0x1.b81178d811000p-3},
+{0x1.3bd60c010c12bp+0, -0x1.ae2c9ccd3d000p-3},
+{0x1.3a5242b75dab8p+0, -0x1.a45402e129000p-3},
+{0x1.38d22cd9fd002p+0, -0x1.9a877681df000p-3},
+{0x1.3755bc5847a1cp+0, -0x1.90c6d69483000p-3},
+{0x1.35dce49ad36e2p+0, -0x1.87120a645c000p-3},
+{0x1.34679984dd440p+0, -0x1.7d68fb4143000p-3},
+{0x1.32f5cceffcb24p+0, -0x1.73cb83c627000p-3},
+{0x1.3187775a10d49p+0, -0x1.6a39a9b376000p-3},
+{0x1.301c8373e3990p+0, -0x1.60b3154b7a000p-3},
+{0x1.2eb4ebb95f841p+0, -0x1.5737d76243000p-3},
+{0x1.2d50a0219a9d1p+0, -0x1.4dc7b8fc23000p-3},
+{0x1.2bef9a8b7fd2ap+0, -0x1.4462c51d20000p-3},
+{0x1.2a91c7a0c1babp+0, -0x1.3b08abc830000p-3},
+{0x1.293726014b530p+0, -0x1.31b996b490000p-3},
+{0x1.27dfa5757a1f5p+0, -0x1.2875490a44000p-3},
+{0x1.268b39b1d3bbfp+0, -0x1.1f3b9f879a000p-3},
+{0x1.2539d838ff5bdp+0, -0x1.160c8252ca000p-3},
+{0x1.23eb7aac9083bp+0, -0x1.0ce7f57f72000p-3},
+{0x1.22a012ba940b6p+0, -0x1.03cdc49fea000p-3},
+{0x1.2157996cc4132p+0, -0x1.f57bdbc4b8000p-4},
+{0x1.201201dd2fc9bp+0, -0x1.e370896404000p-4},
+{0x1.1ecf4494d480bp+0, -0x1.d17983ef94000p-4},
+{0x1.1d8f5528f6569p+0, -0x1.bf9674ed8a000p-4},
+{0x1.1c52311577e7cp+0, -0x1.adc79202f6000p-4},
+{0x1.1b17c74cb26e9p+0, -0x1.9c0c3e7288000p-4},
+{0x1.19e010c2c1ab6p+0, -0x1.8a646b372c000p-4},
+{0x1.18ab07bb670bdp+0, -0x1.78d01b3ac0000p-4},
+{0x1.1778a25efbcb6p+0, -0x1.674f145380000p-4},
+{0x1.1648d354c31dap+0, -0x1.55e0e6d878000p-4},
+{0x1.151b990275fddp+0, -0x1.4485cdea1e000p-4},
+{0x1.13f0ea432d24cp+0, -0x1.333d94d6aa000p-4},
+{0x1.12c8b7210f9dap+0, -0x1.22079f8c56000p-4},
+{0x1.11a3028ecb531p+0, -0x1.10e4698622000p-4},
+{0x1.107fbda8434afp+0, -0x1.ffa6c6ad20000p-5},
+{0x1.0f5ee0f4e6bb3p+0, -0x1.dda8d4a774000p-5},
+{0x1.0e4065d2a9fcep+0, -0x1.bbcece4850000p-5},
+{0x1.0d244632ca521p+0, -0x1.9a1894012c000p-5},
+{0x1.0c0a77ce2981ap+0, -0x1.788583302c000p-5},
+{0x1.0af2f83c636d1p+0, -0x1.5715e67d68000p-5},
+{0x1.09ddb98a01339p+0, -0x1.35c8a49658000p-5},
+{0x1.08cabaf52e7dfp+0, -0x1.149e364154000p-5},
+{0x1.07b9f2f4e28fbp+0, -0x1.e72c082eb8000p-6},
+{0x1.06ab58c358f19p+0, -0x1.a55f152528000p-6},
+{0x1.059eea5ecf92cp+0, -0x1.63d62cf818000p-6},
+{0x1.04949cdd12c90p+0, -0x1.228fb8caa0000p-6},
+{0x1.038c6c6f0ada9p+0, -0x1.c317b20f90000p-7},
+{0x1.02865137932a9p+0, -0x1.419355daa0000p-7},
+{0x1.0182427ea7348p+0, -0x1.81203c2ec0000p-8},
+{0x1.008040614b195p+0, -0x1.0040979240000p-9},
+{0x1.fe01ff726fa1ap-1, 0x1.feff384900000p-9},
+{0x1.fa11cc261ea74p-1, 0x1.7dc41353d0000p-7},
+{0x1.f6310b081992ep-1, 0x1.3cea3c4c28000p-6},
+{0x1.f25f63ceeadcdp-1, 0x1.b9fc114890000p-6},
+{0x1.ee9c8039113e7p-1, 0x1.1b0d8ce110000p-5},
+{0x1.eae8078cbb1abp-1, 0x1.58a5bd001c000p-5},
+{0x1.e741aa29d0c9bp-1, 0x1.95c8340d88000p-5},
+{0x1.e3a91830a99b5p-1, 0x1.d276aef578000p-5},
+{0x1.e01e009609a56p-1, 0x1.07598e598c000p-4},
+{0x1.dca01e577bb98p-1, 0x1.253f5e30d2000p-4},
+{0x1.d92f20b7c9103p-1, 0x1.42edd8b380000p-4},
+{0x1.d5cac66fb5ccep-1, 0x1.606598757c000p-4},
+{0x1.d272caa5ede9dp-1, 0x1.7da76356a0000p-4},
+{0x1.cf26e3e6b2ccdp-1, 0x1.9ab434e1c6000p-4},
+{0x1.cbe6da2a77902p-1, 0x1.b78c7bb0d6000p-4},
+{0x1.c8b266d37086dp-1, 0x1.d431332e72000p-4},
+{0x1.c5894bd5d5804p-1, 0x1.f0a3171de6000p-4},
+{0x1.c26b533bb9f8cp-1, 0x1.067152b914000p-3},
+{0x1.bf583eeece73fp-1, 0x1.147858292b000p-3},
+{0x1.bc4fd75db96c1p-1, 0x1.2266ecdca3000p-3},
+{0x1.b951e0c864a28p-1, 0x1.303d7a6c55000p-3},
+{0x1.b65e2c5ef3e2cp-1, 0x1.3dfc33c331000p-3},
+{0x1.b374867c9888bp-1, 0x1.4ba366b7a8000p-3},
+{0x1.b094b211d304ap-1, 0x1.5933928d1f000p-3},
+{0x1.adbe885f2ef7ep-1, 0x1.66acd2418f000p-3},
+{0x1.aaf1d31603da2p-1, 0x1.740f8ec669000p-3},
+{0x1.a82e63fd358a7p-1, 0x1.815c0f51af000p-3},
+{0x1.a5740ef09738bp-1, 0x1.8e92954f68000p-3},
+{0x1.a2c2a90ab4b27p-1, 0x1.9bb3602f84000p-3},
+{0x1.a01a01393f2d1p-1, 0x1.a8bed1c2c0000p-3},
+{0x1.9d79f24db3c1bp-1, 0x1.b5b515c01d000p-3},
+{0x1.9ae2505c7b190p-1, 0x1.c2967ccbcc000p-3},
+{0x1.9852ef297ce2fp-1, 0x1.cf635d5486000p-3},
+{0x1.95cbaeea44b75p-1, 0x1.dc1bd3446c000p-3},
+{0x1.934c69de74838p-1, 0x1.e8c01b8cfe000p-3},
+{0x1.90d4f2f6752e6p-1, 0x1.f5509c0179000p-3},
+{0x1.8e6528effd79dp-1, 0x1.00e6c121fb800p-2},
+{0x1.8bfce9fcc007cp-1, 0x1.071b80e93d000p-2},
+{0x1.899c0dabec30ep-1, 0x1.0d46b9e867000p-2},
+{0x1.87427aa2317fbp-1, 0x1.13687334bd000p-2},
+{0x1.84f00acb39a08p-1, 0x1.1980d67234800p-2},
+{0x1.82a49e8653e55p-1, 0x1.1f8ffe0cc8000p-2},
+{0x1.8060195f40260p-1, 0x1.2595fd7636800p-2},
+{0x1.7e22563e0a329p-1, 0x1.2b9300914a800p-2},
+{0x1.7beb377dcb5adp-1, 0x1.3187210436000p-2},
+{0x1.79baa679725c2p-1, 0x1.377266dec1800p-2},
+{0x1.77907f2170657p-1, 0x1.3d54ffbaf3000p-2},
+{0x1.756cadbd6130cp-1, 0x1.432eee32fe000p-2},
+},
+#if !__FP_FAST_FMA
+.tab2 = {
+{0x1.61000014fb66bp-1, 0x1.e026c91425b3cp-56},
+{0x1.63000034db495p-1, 0x1.dbfea48005d41p-55},
+{0x1.650000d94d478p-1, 0x1.e7fa786d6a5b7p-55},
+{0x1.67000074e6fadp-1, 0x1.1fcea6b54254cp-57},
+{0x1.68ffffedf0faep-1, -0x1.c7e274c590efdp-56},
+{0x1.6b0000763c5bcp-1, -0x1.ac16848dcda01p-55},
+{0x1.6d0001e5cc1f6p-1, 0x1.33f1c9d499311p-55},
+{0x1.6efffeb05f63ep-1, -0x1.e80041ae22d53p-56},
+{0x1.710000e86978p-1, 0x1.bff6671097952p-56},
+{0x1.72ffffc67e912p-1, 0x1.c00e226bd8724p-55},
+{0x1.74fffdf81116ap-1, -0x1.e02916ef101d2p-57},
+{0x1.770000f679c9p-1, -0x1.7fc71cd549c74p-57},
+{0x1.78ffffa7ec835p-1, 0x1.1bec19ef50483p-55},
+{0x1.7affffe20c2e6p-1, -0x1.07e1729cc6465p-56},
+{0x1.7cfffed3fc9p-1, -0x1.08072087b8b1cp-55},
+{0x1.7efffe9261a76p-1, 0x1.dc0286d9df9aep-55},
+{0x1.81000049ca3e8p-1, 0x1.97fd251e54c33p-55},
+{0x1.8300017932c8fp-1, -0x1.afee9b630f381p-55},
+{0x1.850000633739cp-1, 0x1.9bfbf6b6535bcp-55},
+{0x1.87000204289c6p-1, -0x1.bbf65f3117b75p-55},
+{0x1.88fffebf57904p-1, -0x1.9006ea23dcb57p-55},
+{0x1.8b00022bc04dfp-1, -0x1.d00df38e04b0ap-56},
+{0x1.8cfffe50c1b8ap-1, -0x1.8007146ff9f05p-55},
+{0x1.8effffc918e43p-1, 0x1.3817bd07a7038p-55},
+{0x1.910001efa5fc7p-1, 0x1.93e9176dfb403p-55},
+{0x1.9300013467bb9p-1, 0x1.f804e4b980276p-56},
+{0x1.94fffe6ee076fp-1, -0x1.f7ef0d9ff622ep-55},
+{0x1.96fffde3c12d1p-1, -0x1.082aa962638bap-56},
+{0x1.98ffff4458a0dp-1, -0x1.7801b9164a8efp-55},
+{0x1.9afffdd982e3ep-1, -0x1.740e08a5a9337p-55},
+{0x1.9cfffed49fb66p-1, 0x1.fce08c19bep-60},
+{0x1.9f00020f19c51p-1, -0x1.a3faa27885b0ap-55},
+{0x1.a10001145b006p-1, 0x1.4ff489958da56p-56},
+{0x1.a300007bbf6fap-1, 0x1.cbeab8a2b6d18p-55},
+{0x1.a500010971d79p-1, 0x1.8fecadd78793p-55},
+{0x1.a70001df52e48p-1, -0x1.f41763dd8abdbp-55},
+{0x1.a90001c593352p-1, -0x1.ebf0284c27612p-55},
+{0x1.ab0002a4f3e4bp-1, -0x1.9fd043cff3f5fp-57},
+{0x1.acfffd7ae1ed1p-1, -0x1.23ee7129070b4p-55},
+{0x1.aefffee510478p-1, 0x1.a063ee00edea3p-57},
+{0x1.b0fffdb650d5bp-1, 0x1.a06c8381f0ab9p-58},
+{0x1.b2ffffeaaca57p-1, -0x1.9011e74233c1dp-56},
+{0x1.b4fffd995badcp-1, -0x1.9ff1068862a9fp-56},
+{0x1.b7000249e659cp-1, 0x1.aff45d0864f3ep-55},
+{0x1.b8ffff987164p-1, 0x1.cfe7796c2c3f9p-56},
+{0x1.bafffd204cb4fp-1, -0x1.3ff27eef22bc4p-57},
+{0x1.bcfffd2415c45p-1, -0x1.cffb7ee3bea21p-57},
+{0x1.beffff86309dfp-1, -0x1.14103972e0b5cp-55},
+{0x1.c0fffe1b57653p-1, 0x1.bc16494b76a19p-55},
+{0x1.c2ffff1fa57e3p-1, -0x1.4feef8d30c6edp-57},
+{0x1.c4fffdcbfe424p-1, -0x1.43f68bcec4775p-55},
+{0x1.c6fffed54b9f7p-1, 0x1.47ea3f053e0ecp-55},
+{0x1.c8fffeb998fd5p-1, 0x1.383068df992f1p-56},
+{0x1.cb0002125219ap-1, -0x1.8fd8e64180e04p-57},
+{0x1.ccfffdd94469cp-1, 0x1.e7ebe1cc7ea72p-55},
+{0x1.cefffeafdc476p-1, 0x1.ebe39ad9f88fep-55},
+{0x1.d1000169af82bp-1, 0x1.57d91a8b95a71p-56},
+{0x1.d30000d0ff71dp-1, 0x1.9c1906970c7dap-55},
+{0x1.d4fffea790fc4p-1, -0x1.80e37c558fe0cp-58},
+{0x1.d70002edc87e5p-1, -0x1.f80d64dc10f44p-56},
+{0x1.d900021dc82aap-1, -0x1.47c8f94fd5c5cp-56},
+{0x1.dafffd86b0283p-1, 0x1.c7f1dc521617ep-55},
+{0x1.dd000296c4739p-1, 0x1.8019eb2ffb153p-55},
+{0x1.defffe54490f5p-1, 0x1.e00d2c652cc89p-57},
+{0x1.e0fffcdabf694p-1, -0x1.f8340202d69d2p-56},
+{0x1.e2fffdb52c8ddp-1, 0x1.b00c1ca1b0864p-56},
+{0x1.e4ffff24216efp-1, 0x1.2ffa8b094ab51p-56},
+{0x1.e6fffe88a5e11p-1, -0x1.7f673b1efbe59p-58},
+{0x1.e9000119eff0dp-1, -0x1.4808d5e0bc801p-55},
+{0x1.eafffdfa51744p-1, 0x1.80006d54320b5p-56},
+{0x1.ed0001a127fa1p-1, -0x1.002f860565c92p-58},
+{0x1.ef00007babcc4p-1, -0x1.540445d35e611p-55},
+{0x1.f0ffff57a8d02p-1, -0x1.ffb3139ef9105p-59},
+{0x1.f30001ee58ac7p-1, 0x1.a81acf2731155p-55},
+{0x1.f4ffff5823494p-1, 0x1.a3f41d4d7c743p-55},
+{0x1.f6ffffca94c6bp-1, -0x1.202f41c987875p-57},
+{0x1.f8fffe1f9c441p-1, 0x1.77dd1f477e74bp-56},
+{0x1.fafffd2e0e37ep-1, -0x1.f01199a7ca331p-57},
+{0x1.fd0001c77e49ep-1, 0x1.181ee4bceacb1p-56},
+{0x1.feffff7e0c331p-1, -0x1.e05370170875ap-57},
+{0x1.00ffff465606ep+0, -0x1.a7ead491c0adap-55},
+{0x1.02ffff3867a58p+0, -0x1.77f69c3fcb2ep-54},
+{0x1.04ffffdfc0d17p+0, 0x1.7bffe34cb945bp-54},
+{0x1.0700003cd4d82p+0, 0x1.20083c0e456cbp-55},
+{0x1.08ffff9f2cbe8p+0, -0x1.dffdfbe37751ap-57},
+{0x1.0b000010cda65p+0, -0x1.13f7faee626ebp-54},
+{0x1.0d00001a4d338p+0, 0x1.07dfa79489ff7p-55},
+{0x1.0effffadafdfdp+0, -0x1.7040570d66bcp-56},
+{0x1.110000bbafd96p+0, 0x1.e80d4846d0b62p-55},
+{0x1.12ffffae5f45dp+0, 0x1.dbffa64fd36efp-54},
+{0x1.150000dd59ad9p+0, 0x1.a0077701250aep-54},
+{0x1.170000f21559ap+0, 0x1.dfdf9e2e3deeep-55},
+{0x1.18ffffc275426p+0, 0x1.10030dc3b7273p-54},
+{0x1.1b000123d3c59p+0, 0x1.97f7980030188p-54},
+{0x1.1cffff8299eb7p+0, -0x1.5f932ab9f8c67p-57},
+{0x1.1effff48ad4p+0, 0x1.37fbf9da75bebp-54},
+{0x1.210000c8b86a4p+0, 0x1.f806b91fd5b22p-54},
+{0x1.2300003854303p+0, 0x1.3ffc2eb9fbf33p-54},
+{0x1.24fffffbcf684p+0, 0x1.601e77e2e2e72p-56},
+{0x1.26ffff52921d9p+0, 0x1.ffcbb767f0c61p-56},
+{0x1.2900014933a3cp+0, -0x1.202ca3c02412bp-56},
+{0x1.2b00014556313p+0, -0x1.2808233f21f02p-54},
+{0x1.2cfffebfe523bp+0, -0x1.8ff7e384fdcf2p-55},
+{0x1.2f0000bb8ad96p+0, -0x1.5ff51503041c5p-55},
+{0x1.30ffffb7ae2afp+0, -0x1.10071885e289dp-55},
+{0x1.32ffffeac5f7fp+0, -0x1.1ff5d3fb7b715p-54},
+{0x1.350000ca66756p+0, 0x1.57f82228b82bdp-54},
+{0x1.3700011fbf721p+0, 0x1.000bac40dd5ccp-55},
+{0x1.38ffff9592fb9p+0, -0x1.43f9d2db2a751p-54},
+{0x1.3b00004ddd242p+0, 0x1.57f6b707638e1p-55},
+{0x1.3cffff5b2c957p+0, 0x1.a023a10bf1231p-56},
+{0x1.3efffeab0b418p+0, 0x1.87f6d66b152bp-54},
+{0x1.410001532aff4p+0, 0x1.7f8375f198524p-57},
+{0x1.4300017478b29p+0, 0x1.301e672dc5143p-55},
+{0x1.44fffe795b463p+0, 0x1.9ff69b8b2895ap-55},
+{0x1.46fffe80475ep+0, -0x1.5c0b19bc2f254p-54},
+{0x1.48fffef6fc1e7p+0, 0x1.b4009f23a2a72p-54},
+{0x1.4afffe5bea704p+0, -0x1.4ffb7bf0d7d45p-54},
+{0x1.4d000171027dep+0, -0x1.9c06471dc6a3dp-54},
+{0x1.4f0000ff03ee2p+0, 0x1.77f890b85531cp-54},
+{0x1.5100012dc4bd1p+0, 0x1.004657166a436p-57},
+{0x1.530001605277ap+0, -0x1.6bfcece233209p-54},
+{0x1.54fffecdb704cp+0, -0x1.902720505a1d7p-55},
+{0x1.56fffef5f54a9p+0, 0x1.bbfe60ec96412p-54},
+{0x1.5900017e61012p+0, 0x1.87ec581afef9p-55},
+{0x1.5b00003c93e92p+0, -0x1.f41080abf0ccp-54},
+{0x1.5d0001d4919bcp+0, -0x1.8812afb254729p-54},
+{0x1.5efffe7b87a89p+0, -0x1.47eb780ed6904p-54},
+},
+#endif
+};
diff --git a/libc-top-half/musl/src/math/log_data.h b/libc-top-half/musl/src/math/log_data.h
new file mode 100644 (file)
index 0000000..1be22ab
--- /dev/null
@@ -0,0 +1,28 @@
+/*
+ * Copyright (c) 2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+#ifndef _LOG_DATA_H
+#define _LOG_DATA_H
+
+#include <features.h>
+
+#define LOG_TABLE_BITS 7
+#define LOG_POLY_ORDER 6
+#define LOG_POLY1_ORDER 12
+extern hidden const struct log_data {
+       double ln2hi;
+       double ln2lo;
+       double poly[LOG_POLY_ORDER - 1]; /* First coefficient is 1.  */
+       double poly1[LOG_POLY1_ORDER - 1];
+       struct {
+               double invc, logc;
+       } tab[1 << LOG_TABLE_BITS];
+#if !__FP_FAST_FMA
+       struct {
+               double chi, clo;
+       } tab2[1 << LOG_TABLE_BITS];
+#endif
+} __log_data;
+
+#endif
index 52230a1bd4dd6776fc55163729763766b589010e..7ee5d7fe623d6ef97204207c81ebd9f04e99b878 100644 (file)
@@ -1,69 +1,71 @@
-/* origin: FreeBSD /usr/src/lib/msun/src/e_logf.c */
 /*
- * Conversion to float by Ian Lance Taylor, Cygnus Support, ian@cygnus.com.
- */
-/*
- * ====================================================
- * Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
+ * Single-precision log function.
  *
- * Developed at SunPro, a Sun Microsystems, Inc. business.
- * Permission to use, copy, modify, and distribute this
- * software is freely granted, provided that this notice
- * is preserved.
- * ====================================================
+ * Copyright (c) 2017-2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
  */
 
 #include <math.h>
 #include <stdint.h>
+#include "libm.h"
+#include "logf_data.h"
+
+/*
+LOGF_TABLE_BITS = 4
+LOGF_POLY_ORDER = 4
+
+ULP error: 0.818 (nearest rounding.)
+Relative error: 1.957 * 2^-26 (before rounding.)
+*/
 
-static const float
-ln2_hi = 6.9313812256e-01, /* 0x3f317180 */
-ln2_lo = 9.0580006145e-06, /* 0x3717f7d1 */
-/* |(log(1+s)-log(1-s))/s - Lg(s)| < 2**-34.24 (~[-4.95e-11, 4.97e-11]). */
-Lg1 = 0xaaaaaa.0p-24, /* 0.66666662693 */
-Lg2 = 0xccce13.0p-25, /* 0.40000972152 */
-Lg3 = 0x91e9ee.0p-25, /* 0.28498786688 */
-Lg4 = 0xf89e26.0p-26; /* 0.24279078841 */
+#define T __logf_data.tab
+#define A __logf_data.poly
+#define Ln2 __logf_data.ln2
+#define N (1 << LOGF_TABLE_BITS)
+#define OFF 0x3f330000
 
 float logf(float x)
 {
-       union {float f; uint32_t i;} u = {x};
-       float_t hfsq,f,s,z,R,w,t1,t2,dk;
-       uint32_t ix;
-       int k;
+       double_t z, r, r2, y, y0, invc, logc;
+       uint32_t ix, iz, tmp;
+       int k, i;
 
-       ix = u.i;
-       k = 0;
-       if (ix < 0x00800000 || ix>>31) {  /* x < 2**-126  */
-               if (ix<<1 == 0)
-                       return -1/(x*x);  /* log(+-0)=-inf */
-               if (ix>>31)
-                       return (x-x)/0.0f; /* log(-#) = NaN */
-               /* subnormal number, scale up x */
-               k -= 25;
-               x *= 0x1p25f;
-               u.f = x;
-               ix = u.i;
-       } else if (ix >= 0x7f800000) {
-               return x;
-       } else if (ix == 0x3f800000)
+       ix = asuint(x);
+       /* Fix sign of zero with downward rounding when x==1.  */
+       if (WANT_ROUNDING && predict_false(ix == 0x3f800000))
                return 0;
+       if (predict_false(ix - 0x00800000 >= 0x7f800000 - 0x00800000)) {
+               /* x < 0x1p-126 or inf or nan.  */
+               if (ix * 2 == 0)
+                       return __math_divzerof(1);
+               if (ix == 0x7f800000) /* log(inf) == inf.  */
+                       return x;
+               if ((ix & 0x80000000) || ix * 2 >= 0xff000000)
+                       return __math_invalidf(x);
+               /* x is subnormal, normalize it.  */
+               ix = asuint(x * 0x1p23f);
+               ix -= 23 << 23;
+       }
+
+       /* x = 2^k z; where z is in range [OFF,2*OFF] and exact.
+          The range is split into N subintervals.
+          The ith subinterval contains z and c is near its center.  */
+       tmp = ix - OFF;
+       i = (tmp >> (23 - LOGF_TABLE_BITS)) % N;
+       k = (int32_t)tmp >> 23; /* arithmetic shift */
+       iz = ix - (tmp & 0x1ff << 23);
+       invc = T[i].invc;
+       logc = T[i].logc;
+       z = (double_t)asfloat(iz);
 
-       /* reduce x into [sqrt(2)/2, sqrt(2)] */
-       ix += 0x3f800000 - 0x3f3504f3;
-       k += (int)(ix>>23) - 0x7f;
-       ix = (ix&0x007fffff) + 0x3f3504f3;
-       u.i = ix;
-       x = u.f;
+       /* log(x) = log1p(z/c-1) + log(c) + k*Ln2 */
+       r = z * invc - 1;
+       y0 = logc + (double_t)k * Ln2;
 
-       f = x - 1.0f;
-       s = f/(2.0f + f);
-       z = s*s;
-       w = z*z;
-       t1= w*(Lg2+w*Lg4);
-       t2= z*(Lg1+w*Lg3);
-       R = t2 + t1;
-       hfsq = 0.5f*f*f;
-       dk = k;
-       return s*(hfsq+R) + dk*ln2_lo - hfsq + f + dk*ln2_hi;
+       /* Pipelined polynomial evaluation to approximate log1p(r).  */
+       r2 = r * r;
+       y = A[1] * r + A[2];
+       y = A[0] * r2 + y;
+       y = y * r2 + (y0 + r);
+       return eval_as_float(y);
 }
diff --git a/libc-top-half/musl/src/math/logf_data.c b/libc-top-half/musl/src/math/logf_data.c
new file mode 100644 (file)
index 0000000..857221f
--- /dev/null
@@ -0,0 +1,33 @@
+/*
+ * Data definition for logf.
+ *
+ * Copyright (c) 2017-2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+
+#include "logf_data.h"
+
+const struct logf_data __logf_data = {
+  .tab = {
+  { 0x1.661ec79f8f3bep+0, -0x1.57bf7808caadep-2 },
+  { 0x1.571ed4aaf883dp+0, -0x1.2bef0a7c06ddbp-2 },
+  { 0x1.49539f0f010bp+0, -0x1.01eae7f513a67p-2 },
+  { 0x1.3c995b0b80385p+0, -0x1.b31d8a68224e9p-3 },
+  { 0x1.30d190c8864a5p+0, -0x1.6574f0ac07758p-3 },
+  { 0x1.25e227b0b8eap+0, -0x1.1aa2bc79c81p-3 },
+  { 0x1.1bb4a4a1a343fp+0, -0x1.a4e76ce8c0e5ep-4 },
+  { 0x1.12358f08ae5bap+0, -0x1.1973c5a611cccp-4 },
+  { 0x1.0953f419900a7p+0, -0x1.252f438e10c1ep-5 },
+  { 0x1p+0, 0x0p+0 },
+  { 0x1.e608cfd9a47acp-1, 0x1.aa5aa5df25984p-5 },
+  { 0x1.ca4b31f026aap-1, 0x1.c5e53aa362eb4p-4 },
+  { 0x1.b2036576afce6p-1, 0x1.526e57720db08p-3 },
+  { 0x1.9c2d163a1aa2dp-1, 0x1.bc2860d22477p-3 },
+  { 0x1.886e6037841edp-1, 0x1.1058bc8a07ee1p-2 },
+  { 0x1.767dcf5534862p-1, 0x1.4043057b6ee09p-2 },
+  },
+  .ln2 = 0x1.62e42fefa39efp-1,
+  .poly = {
+  -0x1.00ea348b88334p-2, 0x1.5575b0be00b6ap-2, -0x1.ffffef20a4123p-2,
+  }
+};
diff --git a/libc-top-half/musl/src/math/logf_data.h b/libc-top-half/musl/src/math/logf_data.h
new file mode 100644 (file)
index 0000000..00cff6f
--- /dev/null
@@ -0,0 +1,20 @@
+/*
+ * Copyright (c) 2017-2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+#ifndef _LOGF_DATA_H
+#define _LOGF_DATA_H
+
+#include <features.h>
+
+#define LOGF_TABLE_BITS 4
+#define LOGF_POLY_ORDER 4
+extern hidden const struct logf_data {
+       struct {
+               double invc, logc;
+       } tab[1 << LOGF_TABLE_BITS];
+       double ln2;
+       double poly[LOGF_POLY_ORDER - 1]; /* First order coefficient is 1.  */
+} __logf_data;
+
+#endif
index 3ddc1b6ff8ebfd0266e70fc9bd3cb372303a9df0..694c2ef64d008cf78696a6d660353e83792d22f3 100644 (file)
-/* origin: FreeBSD /usr/src/lib/msun/src/e_pow.c */
 /*
- * ====================================================
- * Copyright (C) 2004 by Sun Microsystems, Inc. All rights reserved.
+ * Double-precision x^y function.
  *
- * Permission to use, copy, modify, and distribute this
- * software is freely granted, provided that this notice
- * is preserved.
- * ====================================================
- */
-/* pow(x,y) return x**y
- *
- *                    n
- * Method:  Let x =  2   * (1+f)
- *      1. Compute and return log2(x) in two pieces:
- *              log2(x) = w1 + w2,
- *         where w1 has 53-24 = 29 bit trailing zeros.
- *      2. Perform y*log2(x) = n+y' by simulating muti-precision
- *         arithmetic, where |y'|<=0.5.
- *      3. Return x**y = 2**n*exp(y'*log2)
- *
- * Special cases:
- *      1.  (anything) ** 0  is 1
- *      2.  1 ** (anything)  is 1
- *      3.  (anything except 1) ** NAN is NAN
- *      4.  NAN ** (anything except 0) is NAN
- *      5.  +-(|x| > 1) **  +INF is +INF
- *      6.  +-(|x| > 1) **  -INF is +0
- *      7.  +-(|x| < 1) **  +INF is +0
- *      8.  +-(|x| < 1) **  -INF is +INF
- *      9.  -1          ** +-INF is 1
- *      10. +0 ** (+anything except 0, NAN)               is +0
- *      11. -0 ** (+anything except 0, NAN, odd integer)  is +0
- *      12. +0 ** (-anything except 0, NAN)               is +INF, raise divbyzero
- *      13. -0 ** (-anything except 0, NAN, odd integer)  is +INF, raise divbyzero
- *      14. -0 ** (+odd integer) is -0
- *      15. -0 ** (-odd integer) is -INF, raise divbyzero
- *      16. +INF ** (+anything except 0,NAN) is +INF
- *      17. +INF ** (-anything except 0,NAN) is +0
- *      18. -INF ** (+odd integer) is -INF
- *      19. -INF ** (anything) = -0 ** (-anything), (anything except odd integer)
- *      20. (anything) ** 1 is (anything)
- *      21. (anything) ** -1 is 1/(anything)
- *      22. (-anything) ** (integer) is (-1)**(integer)*(+anything**integer)
- *      23. (-anything except 0 and inf) ** (non-integer) is NAN
- *
- * Accuracy:
- *      pow(x,y) returns x**y nearly rounded. In particular
- *                      pow(integer,integer)
- *      always returns the correct integer provided it is
- *      representable.
- *
- * Constants :
- * The hexadecimal values are the intended ones for the following
- * constants. The decimal values may be used, provided that the
- * compiler will convert from decimal to binary accurately enough
- * to produce the hexadecimal values shown.
+ * Copyright (c) 2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
  */
 
+#include <math.h>
+#include <stdint.h>
 #include "libm.h"
+#include "exp_data.h"
+#include "pow_data.h"
 
-static const double
-bp[]   = {1.0, 1.5,},
-dp_h[] = { 0.0, 5.84962487220764160156e-01,}, /* 0x3FE2B803, 0x40000000 */
-dp_l[] = { 0.0, 1.35003920212974897128e-08,}, /* 0x3E4CFDEB, 0x43CFD006 */
-two53  =  9007199254740992.0, /* 0x43400000, 0x00000000 */
-huge   =  1.0e300,
-tiny   =  1.0e-300,
-/* poly coefs for (3/2)*(log(x)-2s-2/3*s**3 */
-L1 =  5.99999999999994648725e-01, /* 0x3FE33333, 0x33333303 */
-L2 =  4.28571428578550184252e-01, /* 0x3FDB6DB6, 0xDB6FABFF */
-L3 =  3.33333329818377432918e-01, /* 0x3FD55555, 0x518F264D */
-L4 =  2.72728123808534006489e-01, /* 0x3FD17460, 0xA91D4101 */
-L5 =  2.30660745775561754067e-01, /* 0x3FCD864A, 0x93C9DB65 */
-L6 =  2.06975017800338417784e-01, /* 0x3FCA7E28, 0x4A454EEF */
-P1 =  1.66666666666666019037e-01, /* 0x3FC55555, 0x5555553E */
-P2 = -2.77777777770155933842e-03, /* 0xBF66C16C, 0x16BEBD93 */
-P3 =  6.61375632143793436117e-05, /* 0x3F11566A, 0xAF25DE2C */
-P4 = -1.65339022054652515390e-06, /* 0xBEBBBD41, 0xC5D26BF1 */
-P5 =  4.13813679705723846039e-08, /* 0x3E663769, 0x72BEA4D0 */
-lg2     =  6.93147180559945286227e-01, /* 0x3FE62E42, 0xFEFA39EF */
-lg2_h   =  6.93147182464599609375e-01, /* 0x3FE62E43, 0x00000000 */
-lg2_l   = -1.90465429995776804525e-09, /* 0xBE205C61, 0x0CA86C39 */
-ovt     =  8.0085662595372944372e-017, /* -(1024-log2(ovfl+.5ulp)) */
-cp      =  9.61796693925975554329e-01, /* 0x3FEEC709, 0xDC3A03FD =2/(3ln2) */
-cp_h    =  9.61796700954437255859e-01, /* 0x3FEEC709, 0xE0000000 =(float)cp */
-cp_l    = -7.02846165095275826516e-09, /* 0xBE3E2FE0, 0x145B01F5 =tail of cp_h*/
-ivln2   =  1.44269504088896338700e+00, /* 0x3FF71547, 0x652B82FE =1/ln2 */
-ivln2_h =  1.44269502162933349609e+00, /* 0x3FF71547, 0x60000000 =24b 1/ln2*/
-ivln2_l =  1.92596299112661746887e-08; /* 0x3E54AE0B, 0xF85DDF44 =1/ln2 tail*/
+/*
+Worst-case error: 0.54 ULP (~= ulperr_exp + 1024*Ln2*relerr_log*2^53)
+relerr_log: 1.3 * 2^-68 (Relative error of log, 1.5 * 2^-68 without fma)
+ulperr_exp: 0.509 ULP (ULP error of exp, 0.511 ULP without fma)
+*/
 
-double pow(double x, double y)
+#define T __pow_log_data.tab
+#define A __pow_log_data.poly
+#define Ln2hi __pow_log_data.ln2hi
+#define Ln2lo __pow_log_data.ln2lo
+#define N (1 << POW_LOG_TABLE_BITS)
+#define OFF 0x3fe6955500000000
+
+/* Top 12 bits of a double (sign and exponent bits).  */
+static inline uint32_t top12(double x)
 {
-       double z,ax,z_h,z_l,p_h,p_l;
-       double y1,t1,t2,r,s,t,u,v,w;
-       int32_t i,j,k,yisint,n;
-       int32_t hx,hy,ix,iy;
-       uint32_t lx,ly;
+       return asuint64(x) >> 52;
+}
 
-       EXTRACT_WORDS(hx, lx, x);
-       EXTRACT_WORDS(hy, ly, y);
-       ix = hx & 0x7fffffff;
-       iy = hy & 0x7fffffff;
+/* Compute y+TAIL = log(x) where the rounded result is y and TAIL has about
+   additional 15 bits precision.  IX is the bit representation of x, but
+   normalized in the subnormal range using the sign bit for the exponent.  */
+static inline double_t log_inline(uint64_t ix, double_t *tail)
+{
+       /* double_t for better performance on targets with FLT_EVAL_METHOD==2.  */
+       double_t z, r, y, invc, logc, logctail, kd, hi, t1, t2, lo, lo1, lo2, p;
+       uint64_t iz, tmp;
+       int k, i;
 
-       /* x**0 = 1, even if x is NaN */
-       if ((iy|ly) == 0)
-               return 1.0;
-       /* 1**y = 1, even if y is NaN */
-       if (hx == 0x3ff00000 && lx == 0)
-               return 1.0;
-       /* NaN if either arg is NaN */
-       if (ix > 0x7ff00000 || (ix == 0x7ff00000 && lx != 0) ||
-           iy > 0x7ff00000 || (iy == 0x7ff00000 && ly != 0))
-               return x + y;
+       /* x = 2^k z; where z is in range [OFF,2*OFF) and exact.
+          The range is split into N subintervals.
+          The ith subinterval contains z and c is near its center.  */
+       tmp = ix - OFF;
+       i = (tmp >> (52 - POW_LOG_TABLE_BITS)) % N;
+       k = (int64_t)tmp >> 52; /* arithmetic shift */
+       iz = ix - (tmp & 0xfffULL << 52);
+       z = asdouble(iz);
+       kd = (double_t)k;
 
-       /* determine if y is an odd int when x < 0
-        * yisint = 0       ... y is not an integer
-        * yisint = 1       ... y is an odd int
-        * yisint = 2       ... y is an even int
-        */
-       yisint = 0;
-       if (hx < 0) {
-               if (iy >= 0x43400000)
-                       yisint = 2; /* even integer y */
-               else if (iy >= 0x3ff00000) {
-                       k = (iy>>20) - 0x3ff;  /* exponent */
-                       if (k > 20) {
-                               uint32_t j = ly>>(52-k);
-                               if ((j<<(52-k)) == ly)
-                                       yisint = 2 - (j&1);
-                       } else if (ly == 0) {
-                               uint32_t j = iy>>(20-k);
-                               if ((j<<(20-k)) == iy)
-                                       yisint = 2 - (j&1);
-                       }
-               }
-       }
+       /* log(x) = k*Ln2 + log(c) + log1p(z/c-1).  */
+       invc = T[i].invc;
+       logc = T[i].logc;
+       logctail = T[i].logctail;
 
-       /* special value of y */
-       if (ly == 0) {
-               if (iy == 0x7ff00000) {  /* y is +-inf */
-                       if (((ix-0x3ff00000)|lx) == 0)  /* (-1)**+-inf is 1 */
-                               return 1.0;
-                       else if (ix >= 0x3ff00000) /* (|x|>1)**+-inf = inf,0 */
-                               return hy >= 0 ? y : 0.0;
-                       else                       /* (|x|<1)**+-inf = 0,inf */
-                               return hy >= 0 ? 0.0 : -y;
-               }
-               if (iy == 0x3ff00000) {    /* y is +-1 */
-                       if (hy >= 0)
-                               return x;
-                       y = 1/x;
-#if FLT_EVAL_METHOD!=0
-                       {
-                               union {double f; uint64_t i;} u = {y};
-                               uint64_t i = u.i & -1ULL/2;
-                               if (i>>52 == 0 && (i&(i-1)))
-                                       FORCE_EVAL((float)y);
-                       }
+       /* Note: 1/c is j/N or j/N/2 where j is an integer in [N,2N) and
+     |z/c - 1| < 1/N, so r = z/c - 1 is exactly representible.  */
+#if __FP_FAST_FMA
+       r = __builtin_fma(z, invc, -1.0);
+#else
+       /* Split z such that rhi, rlo and rhi*rhi are exact and |rlo| <= |r|.  */
+       double_t zhi = asdouble((iz + (1ULL << 31)) & (-1ULL << 32));
+       double_t zlo = z - zhi;
+       double_t rhi = zhi * invc - 1.0;
+       double_t rlo = zlo * invc;
+       r = rhi + rlo;
 #endif
-                       return y;
-               }
-               if (hy == 0x40000000)    /* y is 2 */
-                       return x*x;
-               if (hy == 0x3fe00000) {  /* y is 0.5 */
-                       if (hx >= 0)     /* x >= +0 */
-                               return sqrt(x);
-               }
+
+       /* k*Ln2 + log(c) + r.  */
+       t1 = kd * Ln2hi + logc;
+       t2 = t1 + r;
+       lo1 = kd * Ln2lo + logctail;
+       lo2 = t1 - t2 + r;
+
+       /* Evaluation is optimized assuming superscalar pipelined execution.  */
+       double_t ar, ar2, ar3, lo3, lo4;
+       ar = A[0] * r; /* A[0] = -0.5.  */
+       ar2 = r * ar;
+       ar3 = r * ar2;
+       /* k*Ln2 + log(c) + r + A[0]*r*r.  */
+#if __FP_FAST_FMA
+       hi = t2 + ar2;
+       lo3 = __builtin_fma(ar, r, -ar2);
+       lo4 = t2 - hi + ar2;
+#else
+       double_t arhi = A[0] * rhi;
+       double_t arhi2 = rhi * arhi;
+       hi = t2 + arhi2;
+       lo3 = rlo * (ar + arhi);
+       lo4 = t2 - hi + arhi2;
+#endif
+       /* p = log1p(r) - r - A[0]*r*r.  */
+       p = (ar3 * (A[1] + r * A[2] +
+                   ar2 * (A[3] + r * A[4] + ar2 * (A[5] + r * A[6]))));
+       lo = lo1 + lo2 + lo3 + lo4 + p;
+       y = hi + lo;
+       *tail = hi - y + lo;
+       return y;
+}
+
+#undef N
+#undef T
+#define N (1 << EXP_TABLE_BITS)
+#define InvLn2N __exp_data.invln2N
+#define NegLn2hiN __exp_data.negln2hiN
+#define NegLn2loN __exp_data.negln2loN
+#define Shift __exp_data.shift
+#define T __exp_data.tab
+#define C2 __exp_data.poly[5 - EXP_POLY_ORDER]
+#define C3 __exp_data.poly[6 - EXP_POLY_ORDER]
+#define C4 __exp_data.poly[7 - EXP_POLY_ORDER]
+#define C5 __exp_data.poly[8 - EXP_POLY_ORDER]
+#define C6 __exp_data.poly[9 - EXP_POLY_ORDER]
+
+/* Handle cases that may overflow or underflow when computing the result that
+   is scale*(1+TMP) without intermediate rounding.  The bit representation of
+   scale is in SBITS, however it has a computed exponent that may have
+   overflown into the sign bit so that needs to be adjusted before using it as
+   a double.  (int32_t)KI is the k used in the argument reduction and exponent
+   adjustment of scale, positive k here means the result may overflow and
+   negative k means the result may underflow.  */
+static inline double specialcase(double_t tmp, uint64_t sbits, uint64_t ki)
+{
+       double_t scale, y;
+
+       if ((ki & 0x80000000) == 0) {
+               /* k > 0, the exponent of scale might have overflowed by <= 460.  */
+               sbits -= 1009ull << 52;
+               scale = asdouble(sbits);
+               y = 0x1p1009 * (scale + scale * tmp);
+               return eval_as_double(y);
+       }
+       /* k < 0, need special care in the subnormal range.  */
+       sbits += 1022ull << 52;
+       /* Note: sbits is signed scale.  */
+       scale = asdouble(sbits);
+       y = scale + scale * tmp;
+       if (fabs(y) < 1.0) {
+               /* Round y to the right precision before scaling it into the subnormal
+                  range to avoid double rounding that can cause 0.5+E/2 ulp error where
+                  E is the worst-case ulp error outside the subnormal range.  So this
+                  is only useful if the goal is better than 1 ulp worst-case error.  */
+               double_t hi, lo, one = 1.0;
+               if (y < 0.0)
+                       one = -1.0;
+               lo = scale - y + scale * tmp;
+               hi = one + y;
+               lo = one - hi + y + lo;
+               y = eval_as_double(hi + lo) - one;
+               /* Fix the sign of 0.  */
+               if (y == 0.0)
+                       y = asdouble(sbits & 0x8000000000000000);
+               /* The underflow exception needs to be signaled explicitly.  */
+               fp_force_eval(fp_barrier(0x1p-1022) * 0x1p-1022);
        }
+       y = 0x1p-1022 * y;
+       return eval_as_double(y);
+}
 
-       ax = fabs(x);
-       /* special value of x */
-       if (lx == 0) {
-               if (ix == 0x7ff00000 || ix == 0 || ix == 0x3ff00000) { /* x is +-0,+-inf,+-1 */
-                       z = ax;
-                       if (hy < 0)   /* z = (1/|x|) */
-                               z = 1.0/z;
-                       if (hx < 0) {
-                               if (((ix-0x3ff00000)|yisint) == 0) {
-                                       z = (z-z)/(z-z); /* (-1)**non-int is NaN */
-                               } else if (yisint == 1)
-                                       z = -z;          /* (x<0)**odd = -(|x|**odd) */
-                       }
-                       return z;
+#define SIGN_BIAS (0x800 << EXP_TABLE_BITS)
+
+/* Computes sign*exp(x+xtail) where |xtail| < 2^-8/N and |xtail| <= |x|.
+   The sign_bias argument is SIGN_BIAS or 0 and sets the sign to -1 or 1.  */
+static inline double exp_inline(double_t x, double_t xtail, uint32_t sign_bias)
+{
+       uint32_t abstop;
+       uint64_t ki, idx, top, sbits;
+       /* double_t for better performance on targets with FLT_EVAL_METHOD==2.  */
+       double_t kd, z, r, r2, scale, tail, tmp;
+
+       abstop = top12(x) & 0x7ff;
+       if (predict_false(abstop - top12(0x1p-54) >=
+                         top12(512.0) - top12(0x1p-54))) {
+               if (abstop - top12(0x1p-54) >= 0x80000000) {
+                       /* Avoid spurious underflow for tiny x.  */
+                       /* Note: 0 is common input.  */
+                       double_t one = WANT_ROUNDING ? 1.0 + x : 1.0;
+                       return sign_bias ? -one : one;
+               }
+               if (abstop >= top12(1024.0)) {
+                       /* Note: inf and nan are already handled.  */
+                       if (asuint64(x) >> 63)
+                               return __math_uflow(sign_bias);
+                       else
+                               return __math_oflow(sign_bias);
                }
+               /* Large x is special cased below.  */
+               abstop = 0;
        }
 
-       s = 1.0; /* sign of result */
-       if (hx < 0) {
-               if (yisint == 0) /* (x<0)**(non-int) is NaN */
-                       return (x-x)/(x-x);
-               if (yisint == 1) /* (x<0)**(odd int) */
-                       s = -1.0;
-       }
+       /* exp(x) = 2^(k/N) * exp(r), with exp(r) in [2^(-1/2N),2^(1/2N)].  */
+       /* x = ln2/N*k + r, with int k and r in [-ln2/2N, ln2/2N].  */
+       z = InvLn2N * x;
+#if TOINT_INTRINSICS
+       kd = roundtoint(z);
+       ki = converttoint(z);
+#elif EXP_USE_TOINT_NARROW
+       /* z - kd is in [-0.5-2^-16, 0.5] in all rounding modes.  */
+       kd = eval_as_double(z + Shift);
+       ki = asuint64(kd) >> 16;
+       kd = (double_t)(int32_t)ki;
+#else
+       /* z - kd is in [-1, 1] in non-nearest rounding modes.  */
+       kd = eval_as_double(z + Shift);
+       ki = asuint64(kd);
+       kd -= Shift;
+#endif
+       r = x + kd * NegLn2hiN + kd * NegLn2loN;
+       /* The code assumes 2^-200 < |xtail| < 2^-8/N.  */
+       r += xtail;
+       /* 2^(k/N) ~= scale * (1 + tail).  */
+       idx = 2 * (ki % N);
+       top = (ki + sign_bias) << (52 - EXP_TABLE_BITS);
+       tail = asdouble(T[idx]);
+       /* This is only a valid scale when -1023*N < k < 1024*N.  */
+       sbits = T[idx + 1] + top;
+       /* exp(x) = 2^(k/N) * exp(r) ~= scale + scale * (tail + exp(r) - 1).  */
+       /* Evaluation is optimized assuming superscalar pipelined execution.  */
+       r2 = r * r;
+       /* Without fma the worst case error is 0.25/N ulp larger.  */
+       /* Worst case error is less than 0.5+1.11/N+(abs poly error * 2^53) ulp.  */
+       tmp = tail + r + r2 * (C2 + r * C3) + r2 * r2 * (C4 + r * C5);
+       if (predict_false(abstop == 0))
+               return specialcase(tmp, sbits, ki);
+       scale = asdouble(sbits);
+       /* Note: tmp == 0 or |tmp| > 2^-200 and scale > 2^-739, so there
+          is no spurious underflow here even without fma.  */
+       return eval_as_double(scale + scale * tmp);
+}
 
-       /* |y| is huge */
-       if (iy > 0x41e00000) { /* if |y| > 2**31 */
-               if (iy > 0x43f00000) {  /* if |y| > 2**64, must o/uflow */
-                       if (ix <= 0x3fefffff)
-                               return hy < 0 ? huge*huge : tiny*tiny;
-                       if (ix >= 0x3ff00000)
-                               return hy > 0 ? huge*huge : tiny*tiny;
+/* Returns 0 if not int, 1 if odd int, 2 if even int.  The argument is
+   the bit representation of a non-zero finite floating-point value.  */
+static inline int checkint(uint64_t iy)
+{
+       int e = iy >> 52 & 0x7ff;
+       if (e < 0x3ff)
+               return 0;
+       if (e > 0x3ff + 52)
+               return 2;
+       if (iy & ((1ULL << (0x3ff + 52 - e)) - 1))
+               return 0;
+       if (iy & (1ULL << (0x3ff + 52 - e)))
+               return 1;
+       return 2;
+}
+
+/* Returns 1 if input is the bit representation of 0, infinity or nan.  */
+static inline int zeroinfnan(uint64_t i)
+{
+       return 2 * i - 1 >= 2 * asuint64(INFINITY) - 1;
+}
+
+double pow(double x, double y)
+{
+       uint32_t sign_bias = 0;
+       uint64_t ix, iy;
+       uint32_t topx, topy;
+
+       ix = asuint64(x);
+       iy = asuint64(y);
+       topx = top12(x);
+       topy = top12(y);
+       if (predict_false(topx - 0x001 >= 0x7ff - 0x001 ||
+                         (topy & 0x7ff) - 0x3be >= 0x43e - 0x3be)) {
+               /* Note: if |y| > 1075 * ln2 * 2^53 ~= 0x1.749p62 then pow(x,y) = inf/0
+                  and if |y| < 2^-54 / 1075 ~= 0x1.e7b6p-65 then pow(x,y) = +-1.  */
+               /* Special cases: (x < 0x1p-126 or inf or nan) or
+                  (|y| < 0x1p-65 or |y| >= 0x1p63 or nan).  */
+               if (predict_false(zeroinfnan(iy))) {
+                       if (2 * iy == 0)
+                               return issignaling_inline(x) ? x + y : 1.0;
+                       if (ix == asuint64(1.0))
+                               return issignaling_inline(y) ? x + y : 1.0;
+                       if (2 * ix > 2 * asuint64(INFINITY) ||
+                           2 * iy > 2 * asuint64(INFINITY))
+                               return x + y;
+                       if (2 * ix == 2 * asuint64(1.0))
+                               return 1.0;
+                       if ((2 * ix < 2 * asuint64(1.0)) == !(iy >> 63))
+                               return 0.0; /* |x|<1 && y==inf or |x|>1 && y==-inf.  */
+                       return y * y;
                }
-               /* over/underflow if x is not close to one */
-               if (ix < 0x3fefffff)
-                       return hy < 0 ? s*huge*huge : s*tiny*tiny;
-               if (ix > 0x3ff00000)
-                       return hy > 0 ? s*huge*huge : s*tiny*tiny;
-               /* now |1-x| is tiny <= 2**-20, suffice to compute
-                  log(x) by x-x^2/2+x^3/3-x^4/4 */
-               t = ax - 1.0;       /* t has 20 trailing zeros */
-               w = (t*t)*(0.5 - t*(0.3333333333333333333333-t*0.25));
-               u = ivln2_h*t;      /* ivln2_h has 21 sig. bits */
-               v = t*ivln2_l - w*ivln2;
-               t1 = u + v;
-               SET_LOW_WORD(t1, 0);
-               t2 = v - (t1-u);
-       } else {
-               double ss,s2,s_h,s_l,t_h,t_l;
-               n = 0;
-               /* take care subnormal number */
-               if (ix < 0x00100000) {
-                       ax *= two53;
-                       n -= 53;
-                       GET_HIGH_WORD(ix,ax);
+               if (predict_false(zeroinfnan(ix))) {
+                       double_t x2 = x * x;
+                       if (ix >> 63 && checkint(iy) == 1)
+                               x2 = -x2;
+                       /* Without the barrier some versions of clang hoist the 1/x2 and
+                          thus division by zero exception can be signaled spuriously.  */
+                       return iy >> 63 ? fp_barrier(1 / x2) : x2;
                }
-               n += ((ix)>>20) - 0x3ff;
-               j = ix & 0x000fffff;
-               /* determine interval */
-               ix = j | 0x3ff00000;   /* normalize ix */
-               if (j <= 0x3988E)      /* |x|<sqrt(3/2) */
-                       k = 0;
-               else if (j < 0xBB67A)  /* |x|<sqrt(3)   */
-                       k = 1;
-               else {
-                       k = 0;
-                       n += 1;
-                       ix -= 0x00100000;
+               /* Here x and y are non-zero finite.  */
+               if (ix >> 63) {
+                       /* Finite x < 0.  */
+                       int yint = checkint(iy);
+                       if (yint == 0)
+                               return __math_invalid(x);
+                       if (yint == 1)
+                               sign_bias = SIGN_BIAS;
+                       ix &= 0x7fffffffffffffff;
+                       topx &= 0x7ff;
+               }
+               if ((topy & 0x7ff) - 0x3be >= 0x43e - 0x3be) {
+                       /* Note: sign_bias == 0 here because y is not odd.  */
+                       if (ix == asuint64(1.0))
+                               return 1.0;
+                       if ((topy & 0x7ff) < 0x3be) {
+                               /* |y| < 2^-65, x^y ~= 1 + y*log(x).  */
+                               if (WANT_ROUNDING)
+                                       return ix > asuint64(1.0) ? 1.0 + y :
+                                                                   1.0 - y;
+                               else
+                                       return 1.0;
+                       }
+                       return (ix > asuint64(1.0)) == (topy < 0x800) ?
+                                      __math_oflow(0) :
+                                      __math_uflow(0);
+               }
+               if (topx == 0) {
+                       /* Normalize subnormal x so exponent becomes negative.  */
+                       ix = asuint64(x * 0x1p52);
+                       ix &= 0x7fffffffffffffff;
+                       ix -= 52ULL << 52;
                }
-               SET_HIGH_WORD(ax, ix);
-
-               /* compute ss = s_h+s_l = (x-1)/(x+1) or (x-1.5)/(x+1.5) */
-               u = ax - bp[k];        /* bp[0]=1.0, bp[1]=1.5 */
-               v = 1.0/(ax+bp[k]);
-               ss = u*v;
-               s_h = ss;
-               SET_LOW_WORD(s_h, 0);
-               /* t_h=ax+bp[k] High */
-               t_h = 0.0;
-               SET_HIGH_WORD(t_h, ((ix>>1)|0x20000000) + 0x00080000 + (k<<18));
-               t_l = ax - (t_h-bp[k]);
-               s_l = v*((u-s_h*t_h)-s_h*t_l);
-               /* compute log(ax) */
-               s2 = ss*ss;
-               r = s2*s2*(L1+s2*(L2+s2*(L3+s2*(L4+s2*(L5+s2*L6)))));
-               r += s_l*(s_h+ss);
-               s2 = s_h*s_h;
-               t_h = 3.0 + s2 + r;
-               SET_LOW_WORD(t_h, 0);
-               t_l = r - ((t_h-3.0)-s2);
-               /* u+v = ss*(1+...) */
-               u = s_h*t_h;
-               v = s_l*t_h + t_l*ss;
-               /* 2/(3log2)*(ss+...) */
-               p_h = u + v;
-               SET_LOW_WORD(p_h, 0);
-               p_l = v - (p_h-u);
-               z_h = cp_h*p_h;        /* cp_h+cp_l = 2/(3*log2) */
-               z_l = cp_l*p_h+p_l*cp + dp_l[k];
-               /* log2(ax) = (ss+..)*2/(3*log2) = n + dp_h + z_h + z_l */
-               t = (double)n;
-               t1 = ((z_h + z_l) + dp_h[k]) + t;
-               SET_LOW_WORD(t1, 0);
-               t2 = z_l - (((t1 - t) - dp_h[k]) - z_h);
        }
 
-       /* split up y into y1+y2 and compute (y1+y2)*(t1+t2) */
-       y1 = y;
-       SET_LOW_WORD(y1, 0);
-       p_l = (y-y1)*t1 + y*t2;
-       p_h = y1*t1;
-       z = p_l + p_h;
-       EXTRACT_WORDS(j, i, z);
-       if (j >= 0x40900000) {                      /* z >= 1024 */
-               if (((j-0x40900000)|i) != 0)        /* if z > 1024 */
-                       return s*huge*huge;         /* overflow */
-               if (p_l + ovt > z - p_h)
-                       return s*huge*huge;         /* overflow */
-       } else if ((j&0x7fffffff) >= 0x4090cc00) {  /* z <= -1075 */  // FIXME: instead of abs(j) use unsigned j
-               if (((j-0xc090cc00)|i) != 0)        /* z < -1075 */
-                       return s*tiny*tiny;         /* underflow */
-               if (p_l <= z - p_h)
-                       return s*tiny*tiny;         /* underflow */
-       }
-       /*
-        * compute 2**(p_h+p_l)
-        */
-       i = j & 0x7fffffff;
-       k = (i>>20) - 0x3ff;
-       n = 0;
-       if (i > 0x3fe00000) {  /* if |z| > 0.5, set n = [z+0.5] */
-               n = j + (0x00100000>>(k+1));
-               k = ((n&0x7fffffff)>>20) - 0x3ff;  /* new k for n */
-               t = 0.0;
-               SET_HIGH_WORD(t, n & ~(0x000fffff>>k));
-               n = ((n&0x000fffff)|0x00100000)>>(20-k);
-               if (j < 0)
-                       n = -n;
-               p_h -= t;
-       }
-       t = p_l + p_h;
-       SET_LOW_WORD(t, 0);
-       u = t*lg2_h;
-       v = (p_l-(t-p_h))*lg2 + t*lg2_l;
-       z = u + v;
-       w = v - (z-u);
-       t = z*z;
-       t1 = z - t*(P1+t*(P2+t*(P3+t*(P4+t*P5))));
-       r = (z*t1)/(t1-2.0) - (w + z*w);
-       z = 1.0 - (r-z);
-       GET_HIGH_WORD(j, z);
-       j += n<<20;
-       if ((j>>20) <= 0)  /* subnormal output */
-               z = scalbn(z,n);
-       else
-               SET_HIGH_WORD(z, j);
-       return s*z;
+       double_t lo;
+       double_t hi = log_inline(ix, &lo);
+       double_t ehi, elo;
+#if __FP_FAST_FMA
+       ehi = y * hi;
+       elo = y * lo + __builtin_fma(y, hi, -ehi);
+#else
+       double_t yhi = asdouble(iy & -1ULL << 27);
+       double_t ylo = y - yhi;
+       double_t lhi = asdouble(asuint64(hi) & -1ULL << 27);
+       double_t llo = hi - lhi + lo;
+       ehi = yhi * lhi;
+       elo = ylo * lhi + y * llo; /* |elo| < |ehi| * 2^-25.  */
+#endif
+       return exp_inline(ehi, elo, sign_bias);
 }
diff --git a/libc-top-half/musl/src/math/pow_data.c b/libc-top-half/musl/src/math/pow_data.c
new file mode 100644 (file)
index 0000000..81e760d
--- /dev/null
@@ -0,0 +1,180 @@
+/*
+ * Data for the log part of pow.
+ *
+ * Copyright (c) 2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+
+#include "pow_data.h"
+
+#define N (1 << POW_LOG_TABLE_BITS)
+
+const struct pow_log_data __pow_log_data = {
+.ln2hi = 0x1.62e42fefa3800p-1,
+.ln2lo = 0x1.ef35793c76730p-45,
+.poly = {
+// relative error: 0x1.11922ap-70
+// in -0x1.6bp-8 0x1.6bp-8
+// Coefficients are scaled to match the scaling during evaluation.
+-0x1p-1,
+0x1.555555555556p-2 * -2,
+-0x1.0000000000006p-2 * -2,
+0x1.999999959554ep-3 * 4,
+-0x1.555555529a47ap-3 * 4,
+0x1.2495b9b4845e9p-3 * -8,
+-0x1.0002b8b263fc3p-3 * -8,
+},
+/* Algorithm:
+
+       x = 2^k z
+       log(x) = k ln2 + log(c) + log(z/c)
+       log(z/c) = poly(z/c - 1)
+
+where z is in [0x1.69555p-1; 0x1.69555p0] which is split into N subintervals
+and z falls into the ith one, then table entries are computed as
+
+       tab[i].invc = 1/c
+       tab[i].logc = round(0x1p43*log(c))/0x1p43
+       tab[i].logctail = (double)(log(c) - logc)
+
+where c is chosen near the center of the subinterval such that 1/c has only a
+few precision bits so z/c - 1 is exactly representible as double:
+
+       1/c = center < 1 ? round(N/center)/N : round(2*N/center)/N/2
+
+Note: |z/c - 1| < 1/N for the chosen c, |log(c) - logc - logctail| < 0x1p-97,
+the last few bits of logc are rounded away so k*ln2hi + logc has no rounding
+error and the interval for z is selected such that near x == 1, where log(x)
+is tiny, large cancellation error is avoided in logc + poly(z/c - 1).  */
+.tab = {
+#define A(a, b, c) {a, 0, b, c},
+A(0x1.6a00000000000p+0, -0x1.62c82f2b9c800p-2, 0x1.ab42428375680p-48)
+A(0x1.6800000000000p+0, -0x1.5d1bdbf580800p-2, -0x1.ca508d8e0f720p-46)
+A(0x1.6600000000000p+0, -0x1.5767717455800p-2, -0x1.362a4d5b6506dp-45)
+A(0x1.6400000000000p+0, -0x1.51aad872df800p-2, -0x1.684e49eb067d5p-49)
+A(0x1.6200000000000p+0, -0x1.4be5f95777800p-2, -0x1.41b6993293ee0p-47)
+A(0x1.6000000000000p+0, -0x1.4618bc21c6000p-2, 0x1.3d82f484c84ccp-46)
+A(0x1.5e00000000000p+0, -0x1.404308686a800p-2, 0x1.c42f3ed820b3ap-50)
+A(0x1.5c00000000000p+0, -0x1.3a64c55694800p-2, 0x1.0b1c686519460p-45)
+A(0x1.5a00000000000p+0, -0x1.347dd9a988000p-2, 0x1.5594dd4c58092p-45)
+A(0x1.5800000000000p+0, -0x1.2e8e2bae12000p-2, 0x1.67b1e99b72bd8p-45)
+A(0x1.5600000000000p+0, -0x1.2895a13de8800p-2, 0x1.5ca14b6cfb03fp-46)
+A(0x1.5600000000000p+0, -0x1.2895a13de8800p-2, 0x1.5ca14b6cfb03fp-46)
+A(0x1.5400000000000p+0, -0x1.22941fbcf7800p-2, -0x1.65a242853da76p-46)
+A(0x1.5200000000000p+0, -0x1.1c898c1699800p-2, -0x1.fafbc68e75404p-46)
+A(0x1.5000000000000p+0, -0x1.1675cababa800p-2, 0x1.f1fc63382a8f0p-46)
+A(0x1.4e00000000000p+0, -0x1.1058bf9ae4800p-2, -0x1.6a8c4fd055a66p-45)
+A(0x1.4c00000000000p+0, -0x1.0a324e2739000p-2, -0x1.c6bee7ef4030ep-47)
+A(0x1.4a00000000000p+0, -0x1.0402594b4d000p-2, -0x1.036b89ef42d7fp-48)
+A(0x1.4a00000000000p+0, -0x1.0402594b4d000p-2, -0x1.036b89ef42d7fp-48)
+A(0x1.4800000000000p+0, -0x1.fb9186d5e4000p-3, 0x1.d572aab993c87p-47)
+A(0x1.4600000000000p+0, -0x1.ef0adcbdc6000p-3, 0x1.b26b79c86af24p-45)
+A(0x1.4400000000000p+0, -0x1.e27076e2af000p-3, -0x1.72f4f543fff10p-46)
+A(0x1.4200000000000p+0, -0x1.d5c216b4fc000p-3, 0x1.1ba91bbca681bp-45)
+A(0x1.4000000000000p+0, -0x1.c8ff7c79aa000p-3, 0x1.7794f689f8434p-45)
+A(0x1.4000000000000p+0, -0x1.c8ff7c79aa000p-3, 0x1.7794f689f8434p-45)
+A(0x1.3e00000000000p+0, -0x1.bc286742d9000p-3, 0x1.94eb0318bb78fp-46)
+A(0x1.3c00000000000p+0, -0x1.af3c94e80c000p-3, 0x1.a4e633fcd9066p-52)
+A(0x1.3a00000000000p+0, -0x1.a23bc1fe2b000p-3, -0x1.58c64dc46c1eap-45)
+A(0x1.3a00000000000p+0, -0x1.a23bc1fe2b000p-3, -0x1.58c64dc46c1eap-45)
+A(0x1.3800000000000p+0, -0x1.9525a9cf45000p-3, -0x1.ad1d904c1d4e3p-45)
+A(0x1.3600000000000p+0, -0x1.87fa06520d000p-3, 0x1.bbdbf7fdbfa09p-45)
+A(0x1.3400000000000p+0, -0x1.7ab890210e000p-3, 0x1.bdb9072534a58p-45)
+A(0x1.3400000000000p+0, -0x1.7ab890210e000p-3, 0x1.bdb9072534a58p-45)
+A(0x1.3200000000000p+0, -0x1.6d60fe719d000p-3, -0x1.0e46aa3b2e266p-46)
+A(0x1.3000000000000p+0, -0x1.5ff3070a79000p-3, -0x1.e9e439f105039p-46)
+A(0x1.3000000000000p+0, -0x1.5ff3070a79000p-3, -0x1.e9e439f105039p-46)
+A(0x1.2e00000000000p+0, -0x1.526e5e3a1b000p-3, -0x1.0de8b90075b8fp-45)
+A(0x1.2c00000000000p+0, -0x1.44d2b6ccb8000p-3, 0x1.70cc16135783cp-46)
+A(0x1.2c00000000000p+0, -0x1.44d2b6ccb8000p-3, 0x1.70cc16135783cp-46)
+A(0x1.2a00000000000p+0, -0x1.371fc201e9000p-3, 0x1.178864d27543ap-48)
+A(0x1.2800000000000p+0, -0x1.29552f81ff000p-3, -0x1.48d301771c408p-45)
+A(0x1.2600000000000p+0, -0x1.1b72ad52f6000p-3, -0x1.e80a41811a396p-45)
+A(0x1.2600000000000p+0, -0x1.1b72ad52f6000p-3, -0x1.e80a41811a396p-45)
+A(0x1.2400000000000p+0, -0x1.0d77e7cd09000p-3, 0x1.a699688e85bf4p-47)
+A(0x1.2400000000000p+0, -0x1.0d77e7cd09000p-3, 0x1.a699688e85bf4p-47)
+A(0x1.2200000000000p+0, -0x1.fec9131dbe000p-4, -0x1.575545ca333f2p-45)
+A(0x1.2000000000000p+0, -0x1.e27076e2b0000p-4, 0x1.a342c2af0003cp-45)
+A(0x1.2000000000000p+0, -0x1.e27076e2b0000p-4, 0x1.a342c2af0003cp-45)
+A(0x1.1e00000000000p+0, -0x1.c5e548f5bc000p-4, -0x1.d0c57585fbe06p-46)
+A(0x1.1c00000000000p+0, -0x1.a926d3a4ae000p-4, 0x1.53935e85baac8p-45)
+A(0x1.1c00000000000p+0, -0x1.a926d3a4ae000p-4, 0x1.53935e85baac8p-45)
+A(0x1.1a00000000000p+0, -0x1.8c345d631a000p-4, 0x1.37c294d2f5668p-46)
+A(0x1.1a00000000000p+0, -0x1.8c345d631a000p-4, 0x1.37c294d2f5668p-46)
+A(0x1.1800000000000p+0, -0x1.6f0d28ae56000p-4, -0x1.69737c93373dap-45)
+A(0x1.1600000000000p+0, -0x1.51b073f062000p-4, 0x1.f025b61c65e57p-46)
+A(0x1.1600000000000p+0, -0x1.51b073f062000p-4, 0x1.f025b61c65e57p-46)
+A(0x1.1400000000000p+0, -0x1.341d7961be000p-4, 0x1.c5edaccf913dfp-45)
+A(0x1.1400000000000p+0, -0x1.341d7961be000p-4, 0x1.c5edaccf913dfp-45)
+A(0x1.1200000000000p+0, -0x1.16536eea38000p-4, 0x1.47c5e768fa309p-46)
+A(0x1.1000000000000p+0, -0x1.f0a30c0118000p-5, 0x1.d599e83368e91p-45)
+A(0x1.1000000000000p+0, -0x1.f0a30c0118000p-5, 0x1.d599e83368e91p-45)
+A(0x1.0e00000000000p+0, -0x1.b42dd71198000p-5, 0x1.c827ae5d6704cp-46)
+A(0x1.0e00000000000p+0, -0x1.b42dd71198000p-5, 0x1.c827ae5d6704cp-46)
+A(0x1.0c00000000000p+0, -0x1.77458f632c000p-5, -0x1.cfc4634f2a1eep-45)
+A(0x1.0c00000000000p+0, -0x1.77458f632c000p-5, -0x1.cfc4634f2a1eep-45)
+A(0x1.0a00000000000p+0, -0x1.39e87b9fec000p-5, 0x1.502b7f526feaap-48)
+A(0x1.0a00000000000p+0, -0x1.39e87b9fec000p-5, 0x1.502b7f526feaap-48)
+A(0x1.0800000000000p+0, -0x1.f829b0e780000p-6, -0x1.980267c7e09e4p-45)
+A(0x1.0800000000000p+0, -0x1.f829b0e780000p-6, -0x1.980267c7e09e4p-45)
+A(0x1.0600000000000p+0, -0x1.7b91b07d58000p-6, -0x1.88d5493faa639p-45)
+A(0x1.0400000000000p+0, -0x1.fc0a8b0fc0000p-7, -0x1.f1e7cf6d3a69cp-50)
+A(0x1.0400000000000p+0, -0x1.fc0a8b0fc0000p-7, -0x1.f1e7cf6d3a69cp-50)
+A(0x1.0200000000000p+0, -0x1.fe02a6b100000p-8, -0x1.9e23f0dda40e4p-46)
+A(0x1.0200000000000p+0, -0x1.fe02a6b100000p-8, -0x1.9e23f0dda40e4p-46)
+A(0x1.0000000000000p+0, 0x0.0000000000000p+0, 0x0.0000000000000p+0)
+A(0x1.0000000000000p+0, 0x0.0000000000000p+0, 0x0.0000000000000p+0)
+A(0x1.fc00000000000p-1, 0x1.0101575890000p-7, -0x1.0c76b999d2be8p-46)
+A(0x1.f800000000000p-1, 0x1.0205658938000p-6, -0x1.3dc5b06e2f7d2p-45)
+A(0x1.f400000000000p-1, 0x1.8492528c90000p-6, -0x1.aa0ba325a0c34p-45)
+A(0x1.f000000000000p-1, 0x1.0415d89e74000p-5, 0x1.111c05cf1d753p-47)
+A(0x1.ec00000000000p-1, 0x1.466aed42e0000p-5, -0x1.c167375bdfd28p-45)
+A(0x1.e800000000000p-1, 0x1.894aa149fc000p-5, -0x1.97995d05a267dp-46)
+A(0x1.e400000000000p-1, 0x1.ccb73cdddc000p-5, -0x1.a68f247d82807p-46)
+A(0x1.e200000000000p-1, 0x1.eea31c006c000p-5, -0x1.e113e4fc93b7bp-47)
+A(0x1.de00000000000p-1, 0x1.1973bd1466000p-4, -0x1.5325d560d9e9bp-45)
+A(0x1.da00000000000p-1, 0x1.3bdf5a7d1e000p-4, 0x1.cc85ea5db4ed7p-45)
+A(0x1.d600000000000p-1, 0x1.5e95a4d97a000p-4, -0x1.c69063c5d1d1ep-45)
+A(0x1.d400000000000p-1, 0x1.700d30aeac000p-4, 0x1.c1e8da99ded32p-49)
+A(0x1.d000000000000p-1, 0x1.9335e5d594000p-4, 0x1.3115c3abd47dap-45)
+A(0x1.cc00000000000p-1, 0x1.b6ac88dad6000p-4, -0x1.390802bf768e5p-46)
+A(0x1.ca00000000000p-1, 0x1.c885801bc4000p-4, 0x1.646d1c65aacd3p-45)
+A(0x1.c600000000000p-1, 0x1.ec739830a2000p-4, -0x1.dc068afe645e0p-45)
+A(0x1.c400000000000p-1, 0x1.fe89139dbe000p-4, -0x1.534d64fa10afdp-45)
+A(0x1.c000000000000p-1, 0x1.1178e8227e000p-3, 0x1.1ef78ce2d07f2p-45)
+A(0x1.be00000000000p-1, 0x1.1aa2b7e23f000p-3, 0x1.ca78e44389934p-45)
+A(0x1.ba00000000000p-1, 0x1.2d1610c868000p-3, 0x1.39d6ccb81b4a1p-47)
+A(0x1.b800000000000p-1, 0x1.365fcb0159000p-3, 0x1.62fa8234b7289p-51)
+A(0x1.b400000000000p-1, 0x1.4913d8333b000p-3, 0x1.5837954fdb678p-45)
+A(0x1.b200000000000p-1, 0x1.527e5e4a1b000p-3, 0x1.633e8e5697dc7p-45)
+A(0x1.ae00000000000p-1, 0x1.6574ebe8c1000p-3, 0x1.9cf8b2c3c2e78p-46)
+A(0x1.ac00000000000p-1, 0x1.6f0128b757000p-3, -0x1.5118de59c21e1p-45)
+A(0x1.aa00000000000p-1, 0x1.7898d85445000p-3, -0x1.c661070914305p-46)
+A(0x1.a600000000000p-1, 0x1.8beafeb390000p-3, -0x1.73d54aae92cd1p-47)
+A(0x1.a400000000000p-1, 0x1.95a5adcf70000p-3, 0x1.7f22858a0ff6fp-47)
+A(0x1.a000000000000p-1, 0x1.a93ed3c8ae000p-3, -0x1.8724350562169p-45)
+A(0x1.9e00000000000p-1, 0x1.b31d8575bd000p-3, -0x1.c358d4eace1aap-47)
+A(0x1.9c00000000000p-1, 0x1.bd087383be000p-3, -0x1.d4bc4595412b6p-45)
+A(0x1.9a00000000000p-1, 0x1.c6ffbc6f01000p-3, -0x1.1ec72c5962bd2p-48)
+A(0x1.9600000000000p-1, 0x1.db13db0d49000p-3, -0x1.aff2af715b035p-45)
+A(0x1.9400000000000p-1, 0x1.e530effe71000p-3, 0x1.212276041f430p-51)
+A(0x1.9200000000000p-1, 0x1.ef5ade4dd0000p-3, -0x1.a211565bb8e11p-51)
+A(0x1.9000000000000p-1, 0x1.f991c6cb3b000p-3, 0x1.bcbecca0cdf30p-46)
+A(0x1.8c00000000000p-1, 0x1.07138604d5800p-2, 0x1.89cdb16ed4e91p-48)
+A(0x1.8a00000000000p-1, 0x1.0c42d67616000p-2, 0x1.7188b163ceae9p-45)
+A(0x1.8800000000000p-1, 0x1.1178e8227e800p-2, -0x1.c210e63a5f01cp-45)
+A(0x1.8600000000000p-1, 0x1.16b5ccbacf800p-2, 0x1.b9acdf7a51681p-45)
+A(0x1.8400000000000p-1, 0x1.1bf99635a6800p-2, 0x1.ca6ed5147bdb7p-45)
+A(0x1.8200000000000p-1, 0x1.214456d0eb800p-2, 0x1.a87deba46baeap-47)
+A(0x1.7e00000000000p-1, 0x1.2bef07cdc9000p-2, 0x1.a9cfa4a5004f4p-45)
+A(0x1.7c00000000000p-1, 0x1.314f1e1d36000p-2, -0x1.8e27ad3213cb8p-45)
+A(0x1.7a00000000000p-1, 0x1.36b6776be1000p-2, 0x1.16ecdb0f177c8p-46)
+A(0x1.7800000000000p-1, 0x1.3c25277333000p-2, 0x1.83b54b606bd5cp-46)
+A(0x1.7600000000000p-1, 0x1.419b423d5e800p-2, 0x1.8e436ec90e09dp-47)
+A(0x1.7400000000000p-1, 0x1.4718dc271c800p-2, -0x1.f27ce0967d675p-45)
+A(0x1.7200000000000p-1, 0x1.4c9e09e173000p-2, -0x1.e20891b0ad8a4p-45)
+A(0x1.7000000000000p-1, 0x1.522ae0738a000p-2, 0x1.ebe708164c759p-45)
+A(0x1.6e00000000000p-1, 0x1.57bf753c8d000p-2, 0x1.fadedee5d40efp-46)
+A(0x1.6c00000000000p-1, 0x1.5d5bddf596000p-2, -0x1.a0b2a08a465dcp-47)
+},
+};
diff --git a/libc-top-half/musl/src/math/pow_data.h b/libc-top-half/musl/src/math/pow_data.h
new file mode 100644 (file)
index 0000000..5d609ae
--- /dev/null
@@ -0,0 +1,22 @@
+/*
+ * Copyright (c) 2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+#ifndef _POW_DATA_H
+#define _POW_DATA_H
+
+#include <features.h>
+
+#define POW_LOG_TABLE_BITS 7
+#define POW_LOG_POLY_ORDER 8
+extern hidden const struct pow_log_data {
+       double ln2hi;
+       double ln2lo;
+       double poly[POW_LOG_POLY_ORDER - 1]; /* First coefficient is 1.  */
+       /* Note: the pad field is unused, but allows slightly faster indexing.  */
+       struct {
+               double invc, pad, logc, logctail;
+       } tab[1 << POW_LOG_TABLE_BITS];
+} __pow_log_data;
+
+#endif
index 427c8965b9e8e78bca69660427a4e313087c3e0a..de8fab545545b4f2800cdb468fe99a07efea5487 100644 (file)
-/* origin: FreeBSD /usr/src/lib/msun/src/e_powf.c */
 /*
- * Conversion to float by Ian Lance Taylor, Cygnus Support, ian@cygnus.com.
- */
-/*
- * ====================================================
- * Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
- *
- * Developed at SunPro, a Sun Microsystems, Inc. business.
- * Permission to use, copy, modify, and distribute this
- * software is freely granted, provided that this notice
- * is preserved.
- * ====================================================
+ * Copyright (c) 2017-2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
  */
 
+#include <math.h>
+#include <stdint.h>
 #include "libm.h"
+#include "exp2f_data.h"
+#include "powf_data.h"
 
-static const float
-bp[]   = {1.0, 1.5,},
-dp_h[] = { 0.0, 5.84960938e-01,}, /* 0x3f15c000 */
-dp_l[] = { 0.0, 1.56322085e-06,}, /* 0x35d1cfdc */
-two24  =  16777216.0,  /* 0x4b800000 */
-huge   =  1.0e30,
-tiny   =  1.0e-30,
-/* poly coefs for (3/2)*(log(x)-2s-2/3*s**3 */
-L1 =  6.0000002384e-01, /* 0x3f19999a */
-L2 =  4.2857143283e-01, /* 0x3edb6db7 */
-L3 =  3.3333334327e-01, /* 0x3eaaaaab */
-L4 =  2.7272811532e-01, /* 0x3e8ba305 */
-L5 =  2.3066075146e-01, /* 0x3e6c3255 */
-L6 =  2.0697501302e-01, /* 0x3e53f142 */
-P1 =  1.6666667163e-01, /* 0x3e2aaaab */
-P2 = -2.7777778450e-03, /* 0xbb360b61 */
-P3 =  6.6137559770e-05, /* 0x388ab355 */
-P4 = -1.6533901999e-06, /* 0xb5ddea0e */
-P5 =  4.1381369442e-08, /* 0x3331bb4c */
-lg2     =  6.9314718246e-01, /* 0x3f317218 */
-lg2_h   =  6.93145752e-01,   /* 0x3f317200 */
-lg2_l   =  1.42860654e-06,   /* 0x35bfbe8c */
-ovt     =  4.2995665694e-08, /* -(128-log2(ovfl+.5ulp)) */
-cp      =  9.6179670095e-01, /* 0x3f76384f =2/(3ln2) */
-cp_h    =  9.6191406250e-01, /* 0x3f764000 =12b cp */
-cp_l    = -1.1736857402e-04, /* 0xb8f623c6 =tail of cp_h */
-ivln2   =  1.4426950216e+00, /* 0x3fb8aa3b =1/ln2 */
-ivln2_h =  1.4426879883e+00, /* 0x3fb8aa00 =16b 1/ln2*/
-ivln2_l =  7.0526075433e-06; /* 0x36eca570 =1/ln2 tail*/
+/*
+POWF_LOG2_POLY_ORDER = 5
+EXP2F_TABLE_BITS = 5
 
-float powf(float x, float y)
+ULP error: 0.82 (~ 0.5 + relerr*2^24)
+relerr: 1.27 * 2^-26 (Relative error ~= 128*Ln2*relerr_log2 + relerr_exp2)
+relerr_log2: 1.83 * 2^-33 (Relative error of logx.)
+relerr_exp2: 1.69 * 2^-34 (Relative error of exp2(ylogx).)
+*/
+
+#define N (1 << POWF_LOG2_TABLE_BITS)
+#define T __powf_log2_data.tab
+#define A __powf_log2_data.poly
+#define OFF 0x3f330000
+
+/* Subnormal input is normalized so ix has negative biased exponent.
+   Output is multiplied by N (POWF_SCALE) if TOINT_INTRINICS is set.  */
+static inline double_t log2_inline(uint32_t ix)
 {
-       float z,ax,z_h,z_l,p_h,p_l;
-       float y1,t1,t2,r,s,sn,t,u,v,w;
-       int32_t i,j,k,yisint,n;
-       int32_t hx,hy,ix,iy,is;
+       double_t z, r, r2, r4, p, q, y, y0, invc, logc;
+       uint32_t iz, top, tmp;
+       int k, i;
 
-       GET_FLOAT_WORD(hx, x);
-       GET_FLOAT_WORD(hy, y);
-       ix = hx & 0x7fffffff;
-       iy = hy & 0x7fffffff;
+       /* x = 2^k z; where z is in range [OFF,2*OFF] and exact.
+          The range is split into N subintervals.
+          The ith subinterval contains z and c is near its center.  */
+       tmp = ix - OFF;
+       i = (tmp >> (23 - POWF_LOG2_TABLE_BITS)) % N;
+       top = tmp & 0xff800000;
+       iz = ix - top;
+       k = (int32_t)top >> (23 - POWF_SCALE_BITS); /* arithmetic shift */
+       invc = T[i].invc;
+       logc = T[i].logc;
+       z = (double_t)asfloat(iz);
 
-       /* x**0 = 1, even if x is NaN */
-       if (iy == 0)
-               return 1.0f;
-       /* 1**y = 1, even if y is NaN */
-       if (hx == 0x3f800000)
-               return 1.0f;
-       /* NaN if either arg is NaN */
-       if (ix > 0x7f800000 || iy > 0x7f800000)
-               return x + y;
+       /* log2(x) = log1p(z/c-1)/ln2 + log2(c) + k */
+       r = z * invc - 1;
+       y0 = logc + (double_t)k;
 
-       /* determine if y is an odd int when x < 0
-        * yisint = 0       ... y is not an integer
-        * yisint = 1       ... y is an odd int
-        * yisint = 2       ... y is an even int
-        */
-       yisint  = 0;
-       if (hx < 0) {
-               if (iy >= 0x4b800000)
-                       yisint = 2; /* even integer y */
-               else if (iy >= 0x3f800000) {
-                       k = (iy>>23) - 0x7f;         /* exponent */
-                       j = iy>>(23-k);
-                       if ((j<<(23-k)) == iy)
-                               yisint = 2 - (j & 1);
-               }
-       }
+       /* Pipelined polynomial evaluation to approximate log1p(r)/ln2.  */
+       r2 = r * r;
+       y = A[0] * r + A[1];
+       p = A[2] * r + A[3];
+       r4 = r2 * r2;
+       q = A[4] * r + y0;
+       q = p * r2 + q;
+       y = y * r4 + q;
+       return y;
+}
 
-       /* special value of y */
-       if (iy == 0x7f800000) {  /* y is +-inf */
-               if (ix == 0x3f800000)      /* (-1)**+-inf is 1 */
-                       return 1.0f;
-               else if (ix > 0x3f800000)  /* (|x|>1)**+-inf = inf,0 */
-                       return hy >= 0 ? y : 0.0f;
-               else                       /* (|x|<1)**+-inf = 0,inf */
-                       return hy >= 0 ? 0.0f: -y;
-       }
-       if (iy == 0x3f800000)    /* y is +-1 */
-               return hy >= 0 ? x : 1.0f/x;
-       if (hy == 0x40000000)    /* y is 2 */
-               return x*x;
-       if (hy == 0x3f000000) {  /* y is  0.5 */
-               if (hx >= 0)     /* x >= +0 */
-                       return sqrtf(x);
-       }
+#undef N
+#undef T
+#define N (1 << EXP2F_TABLE_BITS)
+#define T __exp2f_data.tab
+#define SIGN_BIAS (1 << (EXP2F_TABLE_BITS + 11))
 
-       ax = fabsf(x);
-       /* special value of x */
-       if (ix == 0x7f800000 || ix == 0 || ix == 0x3f800000) { /* x is +-0,+-inf,+-1 */
-               z = ax;
-               if (hy < 0)  /* z = (1/|x|) */
-                       z = 1.0f/z;
-               if (hx < 0) {
-                       if (((ix-0x3f800000)|yisint) == 0) {
-                               z = (z-z)/(z-z); /* (-1)**non-int is NaN */
-                       } else if (yisint == 1)
-                               z = -z;          /* (x<0)**odd = -(|x|**odd) */
-               }
-               return z;
-       }
+/* The output of log2 and thus the input of exp2 is either scaled by N
+   (in case of fast toint intrinsics) or not.  The unscaled xd must be
+   in [-1021,1023], sign_bias sets the sign of the result.  */
+static inline float exp2_inline(double_t xd, uint32_t sign_bias)
+{
+       uint64_t ki, ski, t;
+       double_t kd, z, r, r2, y, s;
 
-       sn = 1.0f; /* sign of result */
-       if (hx < 0) {
-               if (yisint == 0) /* (x<0)**(non-int) is NaN */
-                       return (x-x)/(x-x);
-               if (yisint == 1) /* (x<0)**(odd int) */
-                       sn = -1.0f;
-       }
+#if TOINT_INTRINSICS
+#define C __exp2f_data.poly_scaled
+       /* N*x = k + r with r in [-1/2, 1/2] */
+       kd = roundtoint(xd); /* k */
+       ki = converttoint(xd);
+#else
+#define C __exp2f_data.poly
+#define SHIFT __exp2f_data.shift_scaled
+       /* x = k/N + r with r in [-1/(2N), 1/(2N)] */
+       kd = eval_as_double(xd + SHIFT);
+       ki = asuint64(kd);
+       kd -= SHIFT; /* k/N */
+#endif
+       r = xd - kd;
 
-       /* |y| is huge */
-       if (iy > 0x4d000000) { /* if |y| > 2**27 */
-               /* over/underflow if x is not close to one */
-               if (ix < 0x3f7ffff8)
-                       return hy < 0 ? sn*huge*huge : sn*tiny*tiny;
-               if (ix > 0x3f800007)
-                       return hy > 0 ? sn*huge*huge : sn*tiny*tiny;
-               /* now |1-x| is tiny <= 2**-20, suffice to compute
-                  log(x) by x-x^2/2+x^3/3-x^4/4 */
-               t = ax - 1;     /* t has 20 trailing zeros */
-               w = (t*t)*(0.5f - t*(0.333333333333f - t*0.25f));
-               u = ivln2_h*t;  /* ivln2_h has 16 sig. bits */
-               v = t*ivln2_l - w*ivln2;
-               t1 = u + v;
-               GET_FLOAT_WORD(is, t1);
-               SET_FLOAT_WORD(t1, is & 0xfffff000);
-               t2 = v - (t1-u);
-       } else {
-               float s2,s_h,s_l,t_h,t_l;
-               n = 0;
-               /* take care subnormal number */
-               if (ix < 0x00800000) {
-                       ax *= two24;
-                       n -= 24;
-                       GET_FLOAT_WORD(ix, ax);
-               }
-               n += ((ix)>>23) - 0x7f;
-               j = ix & 0x007fffff;
-               /* determine interval */
-               ix = j | 0x3f800000;     /* normalize ix */
-               if (j <= 0x1cc471)       /* |x|<sqrt(3/2) */
-                       k = 0;
-               else if (j < 0x5db3d7)   /* |x|<sqrt(3)   */
-                       k = 1;
-               else {
-                       k = 0;
-                       n += 1;
-                       ix -= 0x00800000;
-               }
-               SET_FLOAT_WORD(ax, ix);
+       /* exp2(x) = 2^(k/N) * 2^r ~= s * (C0*r^3 + C1*r^2 + C2*r + 1) */
+       t = T[ki % N];
+       ski = ki + sign_bias;
+       t += ski << (52 - EXP2F_TABLE_BITS);
+       s = asdouble(t);
+       z = C[0] * r + C[1];
+       r2 = r * r;
+       y = C[2] * r + 1;
+       y = z * r2 + y;
+       y = y * s;
+       return eval_as_float(y);
+}
 
-               /* compute s = s_h+s_l = (x-1)/(x+1) or (x-1.5)/(x+1.5) */
-               u = ax - bp[k];   /* bp[0]=1.0, bp[1]=1.5 */
-               v = 1.0f/(ax+bp[k]);
-               s = u*v;
-               s_h = s;
-               GET_FLOAT_WORD(is, s_h);
-               SET_FLOAT_WORD(s_h, is & 0xfffff000);
-               /* t_h=ax+bp[k] High */
-               is = ((ix>>1) & 0xfffff000) | 0x20000000;
-               SET_FLOAT_WORD(t_h, is + 0x00400000 + (k<<21));
-               t_l = ax - (t_h - bp[k]);
-               s_l = v*((u - s_h*t_h) - s_h*t_l);
-               /* compute log(ax) */
-               s2 = s*s;
-               r = s2*s2*(L1+s2*(L2+s2*(L3+s2*(L4+s2*(L5+s2*L6)))));
-               r += s_l*(s_h+s);
-               s2 = s_h*s_h;
-               t_h = 3.0f + s2 + r;
-               GET_FLOAT_WORD(is, t_h);
-               SET_FLOAT_WORD(t_h, is & 0xfffff000);
-               t_l = r - ((t_h - 3.0f) - s2);
-               /* u+v = s*(1+...) */
-               u = s_h*t_h;
-               v = s_l*t_h + t_l*s;
-               /* 2/(3log2)*(s+...) */
-               p_h = u + v;
-               GET_FLOAT_WORD(is, p_h);
-               SET_FLOAT_WORD(p_h, is & 0xfffff000);
-               p_l = v - (p_h - u);
-               z_h = cp_h*p_h;  /* cp_h+cp_l = 2/(3*log2) */
-               z_l = cp_l*p_h + p_l*cp+dp_l[k];
-               /* log2(ax) = (s+..)*2/(3*log2) = n + dp_h + z_h + z_l */
-               t = (float)n;
-               t1 = (((z_h + z_l) + dp_h[k]) + t);
-               GET_FLOAT_WORD(is, t1);
-               SET_FLOAT_WORD(t1, is & 0xfffff000);
-               t2 = z_l - (((t1 - t) - dp_h[k]) - z_h);
-       }
+/* Returns 0 if not int, 1 if odd int, 2 if even int.  The argument is
+   the bit representation of a non-zero finite floating-point value.  */
+static inline int checkint(uint32_t iy)
+{
+       int e = iy >> 23 & 0xff;
+       if (e < 0x7f)
+               return 0;
+       if (e > 0x7f + 23)
+               return 2;
+       if (iy & ((1 << (0x7f + 23 - e)) - 1))
+               return 0;
+       if (iy & (1 << (0x7f + 23 - e)))
+               return 1;
+       return 2;
+}
+
+static inline int zeroinfnan(uint32_t ix)
+{
+       return 2 * ix - 1 >= 2u * 0x7f800000 - 1;
+}
 
-       /* split up y into y1+y2 and compute (y1+y2)*(t1+t2) */
-       GET_FLOAT_WORD(is, y);
-       SET_FLOAT_WORD(y1, is & 0xfffff000);
-       p_l = (y-y1)*t1 + y*t2;
-       p_h = y1*t1;
-       z = p_l + p_h;
-       GET_FLOAT_WORD(j, z);
-       if (j > 0x43000000)          /* if z > 128 */
-               return sn*huge*huge;  /* overflow */
-       else if (j == 0x43000000) {  /* if z == 128 */
-               if (p_l + ovt > z - p_h)
-                       return sn*huge*huge;  /* overflow */
-       } else if ((j&0x7fffffff) > 0x43160000)  /* z < -150 */ // FIXME: check should be  (uint32_t)j > 0xc3160000
-               return sn*tiny*tiny;  /* underflow */
-       else if (j == 0xc3160000) {  /* z == -150 */
-               if (p_l <= z-p_h)
-                       return sn*tiny*tiny;  /* underflow */
+float powf(float x, float y)
+{
+       uint32_t sign_bias = 0;
+       uint32_t ix, iy;
+
+       ix = asuint(x);
+       iy = asuint(y);
+       if (predict_false(ix - 0x00800000 >= 0x7f800000 - 0x00800000 ||
+                         zeroinfnan(iy))) {
+               /* Either (x < 0x1p-126 or inf or nan) or (y is 0 or inf or nan).  */
+               if (predict_false(zeroinfnan(iy))) {
+                       if (2 * iy == 0)
+                               return issignalingf_inline(x) ? x + y : 1.0f;
+                       if (ix == 0x3f800000)
+                               return issignalingf_inline(y) ? x + y : 1.0f;
+                       if (2 * ix > 2u * 0x7f800000 ||
+                           2 * iy > 2u * 0x7f800000)
+                               return x + y;
+                       if (2 * ix == 2 * 0x3f800000)
+                               return 1.0f;
+                       if ((2 * ix < 2 * 0x3f800000) == !(iy & 0x80000000))
+                               return 0.0f; /* |x|<1 && y==inf or |x|>1 && y==-inf.  */
+                       return y * y;
+               }
+               if (predict_false(zeroinfnan(ix))) {
+                       float_t x2 = x * x;
+                       if (ix & 0x80000000 && checkint(iy) == 1)
+                               x2 = -x2;
+                       /* Without the barrier some versions of clang hoist the 1/x2 and
+                          thus division by zero exception can be signaled spuriously.  */
+                       return iy & 0x80000000 ? fp_barrierf(1 / x2) : x2;
+               }
+               /* x and y are non-zero finite.  */
+               if (ix & 0x80000000) {
+                       /* Finite x < 0.  */
+                       int yint = checkint(iy);
+                       if (yint == 0)
+                               return __math_invalidf(x);
+                       if (yint == 1)
+                               sign_bias = SIGN_BIAS;
+                       ix &= 0x7fffffff;
+               }
+               if (ix < 0x00800000) {
+                       /* Normalize subnormal x so exponent becomes negative.  */
+                       ix = asuint(x * 0x1p23f);
+                       ix &= 0x7fffffff;
+                       ix -= 23 << 23;
+               }
        }
-       /*
-        * compute 2**(p_h+p_l)
-        */
-       i = j & 0x7fffffff;
-       k = (i>>23) - 0x7f;
-       n = 0;
-       if (i > 0x3f000000) {   /* if |z| > 0.5, set n = [z+0.5] */
-               n = j + (0x00800000>>(k+1));
-               k = ((n&0x7fffffff)>>23) - 0x7f;  /* new k for n */
-               SET_FLOAT_WORD(t, n & ~(0x007fffff>>k));
-               n = ((n&0x007fffff)|0x00800000)>>(23-k);
-               if (j < 0)
-                       n = -n;
-               p_h -= t;
+       double_t logx = log2_inline(ix);
+       double_t ylogx = y * logx; /* cannot overflow, y is single prec.  */
+       if (predict_false((asuint64(ylogx) >> 47 & 0xffff) >=
+                         asuint64(126.0 * POWF_SCALE) >> 47)) {
+               /* |y*log(x)| >= 126.  */
+               if (ylogx > 0x1.fffffffd1d571p+6 * POWF_SCALE)
+                       return __math_oflowf(sign_bias);
+               if (ylogx <= -150.0 * POWF_SCALE)
+                       return __math_uflowf(sign_bias);
        }
-       t = p_l + p_h;
-       GET_FLOAT_WORD(is, t);
-       SET_FLOAT_WORD(t, is & 0xffff8000);
-       u = t*lg2_h;
-       v = (p_l-(t-p_h))*lg2 + t*lg2_l;
-       z = u + v;
-       w = v - (z - u);
-       t = z*z;
-       t1 = z - t*(P1+t*(P2+t*(P3+t*(P4+t*P5))));
-       r = (z*t1)/(t1-2.0f) - (w+z*w);
-       z = 1.0f - (r - z);
-       GET_FLOAT_WORD(j, z);
-       j += n<<23;
-       if ((j>>23) <= 0)  /* subnormal output */
-               z = scalbnf(z, n);
-       else
-               SET_FLOAT_WORD(z, j);
-       return sn*z;
+       return exp2_inline(ylogx, sign_bias);
 }
diff --git a/libc-top-half/musl/src/math/powf_data.c b/libc-top-half/musl/src/math/powf_data.c
new file mode 100644 (file)
index 0000000..13e1d9a
--- /dev/null
@@ -0,0 +1,34 @@
+/*
+ * Data definition for powf.
+ *
+ * Copyright (c) 2017-2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+
+#include "powf_data.h"
+
+const struct powf_log2_data __powf_log2_data = {
+  .tab = {
+  { 0x1.661ec79f8f3bep+0, -0x1.efec65b963019p-2 * POWF_SCALE },
+  { 0x1.571ed4aaf883dp+0, -0x1.b0b6832d4fca4p-2 * POWF_SCALE },
+  { 0x1.49539f0f010bp+0, -0x1.7418b0a1fb77bp-2 * POWF_SCALE },
+  { 0x1.3c995b0b80385p+0, -0x1.39de91a6dcf7bp-2 * POWF_SCALE },
+  { 0x1.30d190c8864a5p+0, -0x1.01d9bf3f2b631p-2 * POWF_SCALE },
+  { 0x1.25e227b0b8eap+0, -0x1.97c1d1b3b7afp-3 * POWF_SCALE },
+  { 0x1.1bb4a4a1a343fp+0, -0x1.2f9e393af3c9fp-3 * POWF_SCALE },
+  { 0x1.12358f08ae5bap+0, -0x1.960cbbf788d5cp-4 * POWF_SCALE },
+  { 0x1.0953f419900a7p+0, -0x1.a6f9db6475fcep-5 * POWF_SCALE },
+  { 0x1p+0, 0x0p+0 * POWF_SCALE },
+  { 0x1.e608cfd9a47acp-1, 0x1.338ca9f24f53dp-4 * POWF_SCALE },
+  { 0x1.ca4b31f026aap-1, 0x1.476a9543891bap-3 * POWF_SCALE },
+  { 0x1.b2036576afce6p-1, 0x1.e840b4ac4e4d2p-3 * POWF_SCALE },
+  { 0x1.9c2d163a1aa2dp-1, 0x1.40645f0c6651cp-2 * POWF_SCALE },
+  { 0x1.886e6037841edp-1, 0x1.88e9c2c1b9ff8p-2 * POWF_SCALE },
+  { 0x1.767dcf5534862p-1, 0x1.ce0a44eb17bccp-2 * POWF_SCALE },
+  },
+  .poly = {
+  0x1.27616c9496e0bp-2 * POWF_SCALE, -0x1.71969a075c67ap-2 * POWF_SCALE,
+  0x1.ec70a6ca7baddp-2 * POWF_SCALE, -0x1.7154748bef6c8p-1 * POWF_SCALE,
+  0x1.71547652ab82bp0 * POWF_SCALE,
+  }
+};
diff --git a/libc-top-half/musl/src/math/powf_data.h b/libc-top-half/musl/src/math/powf_data.h
new file mode 100644 (file)
index 0000000..5b136e2
--- /dev/null
@@ -0,0 +1,26 @@
+/*
+ * Copyright (c) 2017-2018, Arm Limited.
+ * SPDX-License-Identifier: MIT
+ */
+#ifndef _POWF_DATA_H
+#define _POWF_DATA_H
+
+#include "libm.h"
+#include "exp2f_data.h"
+
+#define POWF_LOG2_TABLE_BITS 4
+#define POWF_LOG2_POLY_ORDER 5
+#if TOINT_INTRINSICS
+#define POWF_SCALE_BITS EXP2F_TABLE_BITS
+#else
+#define POWF_SCALE_BITS 0
+#endif
+#define POWF_SCALE ((double)(1 << POWF_SCALE_BITS))
+extern hidden const struct powf_log2_data {
+       struct {
+               double invc, logc;
+       } tab[1 << POWF_LOG2_TABLE_BITS];
+       double poly[POWF_LOG2_POLY_ORDER];
+} __powf_log2_data;
+
+#endif
diff --git a/libc-top-half/musl/src/math/riscv64/copysign.c b/libc-top-half/musl/src/math/riscv64/copysign.c
new file mode 100644 (file)
index 0000000..c785417
--- /dev/null
@@ -0,0 +1,15 @@
+#include <math.h>
+
+#if __riscv_flen >= 64
+
+double copysign(double x, double y)
+{
+       __asm__ ("fsgnj.d %0, %1, %2" : "=f"(x) : "f"(x), "f"(y));
+       return x;
+}
+
+#else
+
+#include "../copysign.c"
+
+#endif
diff --git a/libc-top-half/musl/src/math/riscv64/copysignf.c b/libc-top-half/musl/src/math/riscv64/copysignf.c
new file mode 100644 (file)
index 0000000..a125611
--- /dev/null
@@ -0,0 +1,15 @@
+#include <math.h>
+
+#if __riscv_flen >= 32
+
+float copysignf(float x, float y)
+{
+       __asm__ ("fsgnj.s %0, %1, %2" : "=f"(x) : "f"(x), "f"(y));
+       return x;
+}
+
+#else
+
+#include "../copysignf.c"
+
+#endif
diff --git a/libc-top-half/musl/src/math/riscv64/fabs.c b/libc-top-half/musl/src/math/riscv64/fabs.c
new file mode 100644 (file)
index 0000000..5290b6f
--- /dev/null
@@ -0,0 +1,15 @@
+#include <math.h>
+
+#if __riscv_flen >= 64
+
+double fabs(double x)
+{
+       __asm__ ("fabs.d %0, %1" : "=f"(x) : "f"(x));
+       return x;
+}
+
+#else
+
+#include "../fabs.c"
+
+#endif
diff --git a/libc-top-half/musl/src/math/riscv64/fabsf.c b/libc-top-half/musl/src/math/riscv64/fabsf.c
new file mode 100644 (file)
index 0000000..f5032e3
--- /dev/null
@@ -0,0 +1,15 @@
+#include <math.h>
+
+#if __riscv_flen >= 32
+
+float fabsf(float x)
+{
+       __asm__ ("fabs.s %0, %1" : "=f"(x) : "f"(x));
+       return x;
+}
+
+#else
+
+#include "../fabsf.c"
+
+#endif
diff --git a/libc-top-half/musl/src/math/riscv64/fma.c b/libc-top-half/musl/src/math/riscv64/fma.c
new file mode 100644 (file)
index 0000000..99b0571
--- /dev/null
@@ -0,0 +1,15 @@
+#include <math.h>
+
+#if __riscv_flen >= 64
+
+double fma(double x, double y, double z)
+{
+       __asm__ ("fmadd.d %0, %1, %2, %3" : "=f"(x) : "f"(x), "f"(y), "f"(z));
+       return x;
+}
+
+#else
+
+#include "../fma.c"
+
+#endif
diff --git a/libc-top-half/musl/src/math/riscv64/fmaf.c b/libc-top-half/musl/src/math/riscv64/fmaf.c
new file mode 100644 (file)
index 0000000..f9dc47e
--- /dev/null
@@ -0,0 +1,15 @@
+#include <math.h>
+
+#if __riscv_flen >= 32
+
+float fmaf(float x, float y, float z)
+{
+       __asm__ ("fmadd.s %0, %1, %2, %3" : "=f"(x) : "f"(x), "f"(y), "f"(z));
+       return x;
+}
+
+#else
+
+#include "../fmaf.c"
+
+#endif
diff --git a/libc-top-half/musl/src/math/riscv64/fmax.c b/libc-top-half/musl/src/math/riscv64/fmax.c
new file mode 100644 (file)
index 0000000..023709c
--- /dev/null
@@ -0,0 +1,15 @@
+#include <math.h>
+
+#if __riscv_flen >= 64
+
+double fmax(double x, double y)
+{
+       __asm__ ("fmax.d %0, %1, %2" : "=f"(x) : "f"(x), "f"(y));
+       return x;
+}
+
+#else
+
+#include "../fmax.c"
+
+#endif
diff --git a/libc-top-half/musl/src/math/riscv64/fmaxf.c b/libc-top-half/musl/src/math/riscv64/fmaxf.c
new file mode 100644 (file)
index 0000000..863d2bd
--- /dev/null
@@ -0,0 +1,15 @@
+#include <math.h>
+
+#if __riscv_flen >= 32
+
+float fmaxf(float x, float y)
+{
+       __asm__ ("fmax.s %0, %1, %2" : "=f"(x) : "f"(x), "f"(y));
+       return x;
+}
+
+#else
+
+#include "../fmaxf.c"
+
+#endif
diff --git a/libc-top-half/musl/src/math/riscv64/fmin.c b/libc-top-half/musl/src/math/riscv64/fmin.c
new file mode 100644 (file)
index 0000000..a4e3b06
--- /dev/null
@@ -0,0 +1,15 @@
+#include <math.h>
+
+#if __riscv_flen >= 64
+
+double fmin(double x, double y)
+{
+       __asm__ ("fmin.d %0, %1, %2" : "=f"(x) : "f"(x), "f"(y));
+       return x;
+}
+
+#else
+
+#include "../fmin.c"
+
+#endif
diff --git a/libc-top-half/musl/src/math/riscv64/fminf.c b/libc-top-half/musl/src/math/riscv64/fminf.c
new file mode 100644 (file)
index 0000000..32156e8
--- /dev/null
@@ -0,0 +1,15 @@
+#include <math.h>
+
+#if __riscv_flen >= 32
+
+float fminf(float x, float y)
+{
+       __asm__ ("fmin.s %0, %1, %2" : "=f"(x) : "f"(x), "f"(y));
+       return x;
+}
+
+#else
+
+#include "../fminf.c"
+
+#endif
diff --git a/libc-top-half/musl/src/math/riscv64/sqrt.c b/libc-top-half/musl/src/math/riscv64/sqrt.c
new file mode 100644 (file)
index 0000000..867a504
--- /dev/null
@@ -0,0 +1,15 @@
+#include <math.h>
+
+#if __riscv_flen >= 64
+
+double sqrt(double x)
+{
+       __asm__ ("fsqrt.d %0, %1" : "=f"(x) : "f"(x));
+       return x;
+}
+
+#else
+
+#include "../sqrt.c"
+
+#endif
diff --git a/libc-top-half/musl/src/math/riscv64/sqrtf.c b/libc-top-half/musl/src/math/riscv64/sqrtf.c
new file mode 100644 (file)
index 0000000..610c2cf
--- /dev/null
@@ -0,0 +1,15 @@
+#include <math.h>
+
+#if __riscv_flen >= 32
+
+float sqrtf(float x)
+{
+       __asm__ ("fsqrt.s %0, %1" : "=f"(x) : "f"(x));
+       return x;
+}
+
+#else
+
+#include "../sqrtf.c"
+
+#endif
index a0b320fc32692bc244d40f0c0191f8d94eefb388..2a8257dc9c2dfb0e8a41c4cd98a698a6cc42aad5 100644 (file)
@@ -7,7 +7,7 @@ int putgrent(const struct group *gr, FILE *f)
        int r;
        size_t i;
        flockfile(f);
-       if ((r = fprintf(f, "%s:%s:%d:", gr->gr_name, gr->gr_passwd, gr->gr_gid))<0) goto done;
+       if ((r = fprintf(f, "%s:%s:%u:", gr->gr_name, gr->gr_passwd, gr->gr_gid))<0) goto done;
        if (gr->gr_mem) for (i=0; gr->gr_mem[i]; i++)
                if ((r = fprintf(f, "%s%s", i?",":"", gr->gr_mem[i]))<0) goto done;
        r = fputc('\n', f);
index 3a02e5730482044d56e1458b26360fefa3f85541..312b76530254d14b246ca1fc5972096c3f53ba65 100644 (file)
@@ -4,7 +4,7 @@
 
 int putpwent(const struct passwd *pw, FILE *f)
 {
-       return fprintf(f, "%s:%s:%d:%d:%s:%s:%s\n",
+       return fprintf(f, "%s:%s:%u:%u:%s:%s:%s\n",
                pw->pw_name, pw->pw_passwd, pw->pw_uid, pw->pw_gid,
                pw->pw_gecos, pw->pw_dir, pw->pw_shell)<0 ? -1 : 0;
 }
index 11286ef44e3bd5fd1069087f8741e5e0ff3fdcf0..fb42478ae709a3e11619740a11b7a344cb63655a 100644 (file)
@@ -28,6 +28,7 @@ pid_t fork(void)
                self->robust_list.off = 0;
                self->robust_list.pending = 0;
                self->next = self->prev = self;
+               __thread_list_lock = 0;
                libc.threads_minus_1 = 0;
        }
        __restore_sigs(&set);
index 5aaf829d5e7fdedc6ce5eca0394f4ca1a26b728c..306faa055af0512d06327a4e794bc2697777e5e9 100644 (file)
@@ -101,6 +101,10 @@ static int child(void *args_vp)
                                break;
                        case FDOP_DUP2:
                                fd = op->srcfd;
+                               if (fd == p) {
+                                       ret = -EBADF;
+                                       goto fail;
+                               }
                                if (fd != op->fd) {
                                        if ((ret=__sys_dup2(fd, op->fd))<0)
                                                goto fail;
diff --git a/libc-top-half/musl/src/setjmp/riscv64/longjmp.S b/libc-top-half/musl/src/setjmp/riscv64/longjmp.S
new file mode 100644 (file)
index 0000000..41e2d21
--- /dev/null
@@ -0,0 +1,42 @@
+.global __longjmp
+.global _longjmp
+.global longjmp
+.type __longjmp, %function
+.type _longjmp,  %function
+.type longjmp,   %function
+__longjmp:
+_longjmp:
+longjmp:
+       ld s0,    0(a0)
+       ld s1,    8(a0)
+       ld s2,    16(a0)
+       ld s3,    24(a0)
+       ld s4,    32(a0)
+       ld s5,    40(a0)
+       ld s6,    48(a0)
+       ld s7,    56(a0)
+       ld s8,    64(a0)
+       ld s9,    72(a0)
+       ld s10,   80(a0)
+       ld s11,   88(a0)
+       ld sp,    96(a0)
+       ld ra,    104(a0)
+
+#ifndef __riscv_float_abi_soft
+       fld fs0,  112(a0)
+       fld fs1,  120(a0)
+       fld fs2,  128(a0)
+       fld fs3,  136(a0)
+       fld fs4,  144(a0)
+       fld fs5,  152(a0)
+       fld fs6,  160(a0)
+       fld fs7,  168(a0)
+       fld fs8,  176(a0)
+       fld fs9,  184(a0)
+       fld fs10, 192(a0)
+       fld fs11, 200(a0)
+#endif
+
+       seqz a0, a1
+       add a0, a0, a1
+       ret
diff --git a/libc-top-half/musl/src/setjmp/riscv64/setjmp.S b/libc-top-half/musl/src/setjmp/riscv64/setjmp.S
new file mode 100644 (file)
index 0000000..5124967
--- /dev/null
@@ -0,0 +1,41 @@
+.global __setjmp
+.global _setjmp
+.global setjmp
+.type __setjmp, %function
+.type _setjmp,  %function
+.type setjmp,   %function
+__setjmp:
+_setjmp:
+setjmp:
+       sd s0,    0(a0)
+       sd s1,    8(a0)
+       sd s2,    16(a0)
+       sd s3,    24(a0)
+       sd s4,    32(a0)
+       sd s5,    40(a0)
+       sd s6,    48(a0)
+       sd s7,    56(a0)
+       sd s8,    64(a0)
+       sd s9,    72(a0)
+       sd s10,   80(a0)
+       sd s11,   88(a0)
+       sd sp,    96(a0)
+       sd ra,    104(a0)
+
+#ifndef __riscv_float_abi_soft
+       fsd fs0,  112(a0)
+       fsd fs1,  120(a0)
+       fsd fs2,  128(a0)
+       fsd fs3,  136(a0)
+       fsd fs4,  144(a0)
+       fsd fs5,  152(a0)
+       fsd fs6,  160(a0)
+       fsd fs7,  168(a0)
+       fsd fs8,  176(a0)
+       fsd fs9,  184(a0)
+       fsd fs10, 192(a0)
+       fsd fs11, 200(a0)
+#endif
+
+       li a0, 0
+       ret
diff --git a/libc-top-half/musl/src/signal/riscv64/restore.s b/libc-top-half/musl/src/signal/riscv64/restore.s
new file mode 100644 (file)
index 0000000..40012c7
--- /dev/null
@@ -0,0 +1,8 @@
+.global __restore
+.type __restore, %function
+__restore:
+.global __restore_rt
+.type __restore_rt, %function
+__restore_rt:
+       li a7, 139 # SYS_rt_sigreturn
+       ecall
diff --git a/libc-top-half/musl/src/signal/riscv64/sigsetjmp.s b/libc-top-half/musl/src/signal/riscv64/sigsetjmp.s
new file mode 100644 (file)
index 0000000..f9bc162
--- /dev/null
@@ -0,0 +1,23 @@
+.global sigsetjmp
+.global __sigsetjmp
+.type sigsetjmp, %function
+.type __sigsetjmp, %function
+sigsetjmp:
+__sigsetjmp:
+       bnez a1, 1f
+       tail setjmp
+1:
+
+       sd ra, 208(a0)
+       sd s0, 224(a0)
+       mv s0, a0
+
+       call setjmp
+
+       mv a1, a0
+       mv a0, s0
+       ld s0, 224(a0)
+       ld ra, 208(a0)
+
+.hidden __sigsetjmp_tail
+       tail __sigsetjmp_tail
index cfa3f5c19d0de03384ff3f1a3b884149626db07b..d3a6e8215f83c3d0a8038a6d0eee2bc228b104e5 100644 (file)
@@ -5,7 +5,7 @@
 int sigaltstack(const stack_t *restrict ss, stack_t *restrict old)
 {
        if (ss) {
-               if (ss->ss_size < MINSIGSTKSZ) {
+               if (!(ss->ss_flags & SS_DISABLE) && ss->ss_size < MINSIGSTKSZ) {
                        errno = ENOMEM;
                        return -1;
                }
index 0d7b4564677b8f18d0b10979eb937086cd952007..f3e8c4077ec27c5eaf2f23bdf79f6f4491917eff 100644 (file)
@@ -3,7 +3,7 @@
 void (*sigset(int sig, void (*handler)(int)))(int)
 {
        struct sigaction sa, sa_old;
-       sigset_t mask;
+       sigset_t mask, mask_old;
 
        sigemptyset(&mask);
        if (sigaddset(&mask, sig) < 0)
@@ -12,7 +12,7 @@ void (*sigset(int sig, void (*handler)(int)))(int)
        if (handler == SIG_HOLD) {
                if (sigaction(sig, 0, &sa_old) < 0)
                        return SIG_ERR;
-               if (sigprocmask(SIG_BLOCK, &mask, &mask) < 0)
+               if (sigprocmask(SIG_BLOCK, &mask, &mask_old) < 0)
                        return SIG_ERR;
        } else {
                sa.sa_handler = handler;
@@ -20,8 +20,8 @@ void (*sigset(int sig, void (*handler)(int)))(int)
                sigemptyset(&sa.sa_mask);
                if (sigaction(sig, &sa, &sa_old) < 0)
                        return SIG_ERR;
-               if (sigprocmask(SIG_UNBLOCK, &mask, &mask) < 0)
+               if (sigprocmask(SIG_UNBLOCK, &mask, &mask_old) < 0)
                        return SIG_ERR;
        }
-       return sigismember(&mask, sig) ? SIG_HOLD : sa_old.sa_handler;
+       return sigismember(&mask_old, sig) ? SIG_HOLD : sa_old.sa_handler;
 }
index 0801e28f9de1d5c70bc3c9850bb181e4e395a6d1..aa10b818566a8f1d19af680a9d00458d101572fa 100644 (file)
@@ -25,12 +25,18 @@ static wint_t __fgetwc_unlocked_internal(FILE *f)
        do {
                b = c = getc_unlocked(f);
                if (c < 0) {
-                       if (!first) errno = EILSEQ;
+                       if (!first) {
+                               f->flags |= F_ERR;
+                               errno = EILSEQ;
+                       }
                        return WEOF;
                }
                l = mbrtowc(&wc, (void *)&b, 1, &st);
                if (l == -1) {
-                       if (!first) ungetc(b, f);
+                       if (!first) {
+                               f->flags |= F_ERR;
+                               ungetc(b, f);
+                       }
                        return WEOF;
                }
                first = 0;
index d2a0ddb5d1e1afae55c2c7059f6d38188a52ff34..d09c6e26e90f5482f4a6f7bbf5d1aafc93720d13 100644 (file)
@@ -91,7 +91,7 @@ FILE *fmemopen(void *restrict buf, size_t size, const char *restrict mode)
        struct mem_FILE *f;
        int plus = !!strchr(mode, '+');
        
-       if (!size || !strchr("rwa", *mode)) {
+       if (!strchr("rwa", *mode)) {
                errno = EINVAL;
                return 0;
        }
index af666f06824545fc97691865b1cba76c8b3781db..42a01674bf40d7b3888e0af65cdf3de5a85e5db4 100644 (file)
@@ -7,7 +7,7 @@ static long sccp(syscall_arg_t nr,
                  syscall_arg_t u, syscall_arg_t v, syscall_arg_t w,
                  syscall_arg_t x, syscall_arg_t y, syscall_arg_t z)
 {
-       return (__syscall)(nr, u, v, w, x, y, z);
+       return __syscall(nr, u, v, w, x, y, z);
 }
 
 weak_alias(sccp, __syscall_cp_c);
index 7d4dc2ed5f4ad5c5a1bbdda806fada9e017f5992..ebf61dedcd3628229de1a6d605e404da90059b10 100644 (file)
@@ -315,6 +315,7 @@ int __pthread_create(pthread_t *restrict res, const pthread_attr_t *restrict att
        }
        new->robust_list.head = &new->robust_list.head;
        new->CANARY = self->CANARY;
+       new->sysinfo = self->sysinfo;
 
        /* Setup argument structure for the new thread on its stack.
         * It's safe to access from the caller only until the thread
diff --git a/libc-top-half/musl/src/thread/riscv64/__set_thread_area.s b/libc-top-half/musl/src/thread/riscv64/__set_thread_area.s
new file mode 100644 (file)
index 0000000..828154d
--- /dev/null
@@ -0,0 +1,6 @@
+.global __set_thread_area
+.type   __set_thread_area, %function
+__set_thread_area:
+       mv tp, a0
+       li a0, 0
+       ret
diff --git a/libc-top-half/musl/src/thread/riscv64/__unmapself.s b/libc-top-half/musl/src/thread/riscv64/__unmapself.s
new file mode 100644 (file)
index 0000000..2849119
--- /dev/null
@@ -0,0 +1,7 @@
+.global __unmapself
+.type __unmapself, %function
+__unmapself:
+       li a7, 215 # SYS_munmap
+       ecall
+       li a7, 93  # SYS_exit
+       ecall
diff --git a/libc-top-half/musl/src/thread/riscv64/clone.s b/libc-top-half/musl/src/thread/riscv64/clone.s
new file mode 100644 (file)
index 0000000..db90824
--- /dev/null
@@ -0,0 +1,34 @@
+# __clone(func, stack, flags, arg, ptid, tls, ctid)
+#           a0,    a1,    a2,  a3,   a4,  a5,   a6
+
+# syscall(SYS_clone, flags, stack, ptid, tls, ctid)
+#                a7     a0,    a1,   a2,  a3,   a4
+
+.global __clone
+.type  __clone, %function
+__clone:
+       # Save func and arg to stack
+       addi a1, a1, -16
+       sd a0, 0(a1)
+       sd a3, 8(a1)
+
+       # Call SYS_clone
+       mv a0, a2
+       mv a2, a4
+       mv a3, a5
+       mv a4, a6
+       li a7, 220 # SYS_clone
+       ecall
+
+       beqz a0, 1f
+       # Parent
+       ret
+
+       # Child
+1:      ld a1, 0(sp)
+       ld a0, 8(sp)
+       jalr a1
+
+       # Exit
+       li a7, 93 # SYS_exit
+       ecall
diff --git a/libc-top-half/musl/src/thread/riscv64/syscall_cp.s b/libc-top-half/musl/src/thread/riscv64/syscall_cp.s
new file mode 100644 (file)
index 0000000..eeef639
--- /dev/null
@@ -0,0 +1,29 @@
+.global __cp_begin
+.hidden __cp_begin
+.global __cp_end
+.hidden __cp_end
+.global __cp_cancel
+.hidden __cp_cancel
+.hidden __cancel
+.global __syscall_cp_asm
+.hidden __syscall_cp_asm
+.type __syscall_cp_asm, %function
+__syscall_cp_asm:
+__cp_begin:
+       lw t0, 0(a0)
+       bnez t0, __cp_cancel
+
+       mv t0, a1
+       mv a0, a2
+       mv a1, a3
+       mv a2, a4
+       mv a3, a5
+       mv a4, a6
+       mv a5, a7
+       ld a6, 0(sp)
+       mv a7, t0
+       ecall
+__cp_end:
+       ret
+__cp_cancel:
+       tail __cancel
index 855504bca42c743580fbbb3425a3176736411c7a..2985855c72afd3e4b88fca07a1179634b1bf1af6 100644 (file)
@@ -7,7 +7,7 @@ unsigned ualarm(unsigned value, unsigned interval)
        struct itimerval it = {
                .it_interval.tv_usec = interval,
                .it_value.tv_usec = value
-       };
-       setitimer(ITIMER_REAL, &it, &it);
-       return it.it_value.tv_sec*1000000 + it.it_value.tv_usec;
+       }, it_old;
+       setitimer(ITIMER_REAL, &it, &it_old);
+       return it_old.it_value.tv_sec*1000000 + it_old.it_value.tv_usec;
 }