Tree - source-git/mingw-nss - CentOS Git server

source-git / mingw-nss

Blame nss/lib/freebl/mpi/mpi_sparc.c

Blob History Raw

Packit	40b132	`/* This Source Code Form is subject to the terms of the Mozilla Public`
Packit	40b132	`* License, v. 2.0. If a copy of the MPL was not distributed with this`
Packit	40b132	`* file, You can obtain one at http://mozilla.org/MPL/2.0/. */`
Packit	40b132
Packit	40b132	`/* Multiplication performance enhancements for sparc v8+vis CPUs. */`
Packit	40b132
Packit	40b132	`#include "mpi-priv.h"`
Packit	40b132	`#include <stddef.h>`
Packit	40b132	`#include <sys/systeminfo.h>`
Packit	40b132	`#include <strings.h>`
Packit	40b132
Packit	40b132	`/* In the functions below, */`
Packit	40b132	`/* vector y must be 8-byte aligned, and n must be even */`
Packit	40b132	`/* returns carry out of high order word of result */`
Packit	40b132	`/* maximum n is 256 */`
Packit	40b132
Packit	40b132	`/* vector x += vector y * scaler a; where y is of length n words. */`
Packit	40b132	`extern mp_digit mul_add_inp(mp_digit x, const mp_digit y, int n, mp_digit a);`
Packit	40b132
Packit	40b132	`/* vector z = vector x + vector y * scaler a; where y is of length n words. */`
Packit	40b132	`extern mp_digit mul_add(mp_digit z, const mp_digit x, const mp_digit *y,`
Packit	40b132	`int n, mp_digit a);`
Packit	40b132
Packit	40b132	`/* v8 versions of these functions run on any Sparc v8 CPU. */`
Packit	40b132
Packit	40b132	`/* This trick works on Sparc V8 CPUs with the Workshop compilers. */`
Packit	40b132	`#define MP_MUL_DxD(a, b, Phi, Plo) \`
Packit	40b132	`{ unsigned long long product = (unsigned long long)a * b; \`
Packit	40b132	`Plo = (mp_digit)product; \`
Packit	40b132	`Phi = (mp_digit)(product >> MP_DIGIT_BIT); }`
Packit	40b132
Packit	40b132	`/* c = a * b */`
Packit	40b132	`static void`
Packit	40b132	`v8_mpv_mul_d(const mp_digit a, mp_size a_len, mp_digit b, mp_digit c)`
Packit	40b132	`{`
Packit	40b132	`#if !defined(MP_NO_MP_WORD)`
Packit	40b132	`mp_digit d = 0;`
Packit	40b132
Packit	40b132	`/* Inner product: Digits of a */`
Packit	40b132	`while (a_len--) {`
Packit	40b132	`mp_word w = ((mp_word)b * *a++) + d;`
Packit	40b132	`*c++ = ACCUM(w);`
Packit	40b132	`d = CARRYOUT(w);`
Packit	40b132	`}`
Packit	40b132	`*c = d;`
Packit	40b132	`#else`
Packit	40b132	`mp_digit carry = 0;`
Packit	40b132	`while (a_len--) {`
Packit	40b132	`mp_digit a_i = *a++;`
Packit	40b132	`mp_digit a0b0, a1b1;`
Packit	40b132
Packit	40b132	`MP_MUL_DxD(a_i, b, a1b1, a0b0);`
Packit	40b132
Packit	40b132	`a0b0 += carry;`
Packit	40b132	`if (a0b0 < carry)`
Packit	40b132	`++a1b1;`
Packit	40b132	`*c++ = a0b0;`
Packit	40b132	`carry = a1b1;`
Packit	40b132	`}`
Packit	40b132	`*c = carry;`
Packit	40b132	`#endif`
Packit	40b132	`}`
Packit	40b132
Packit	40b132	`/* c += a * b */`
Packit	40b132	`static void`
Packit	40b132	`v8_mpv_mul_d_add(const mp_digit a, mp_size a_len, mp_digit b, mp_digit c)`
Packit	40b132	`{`
Packit	40b132	`#if !defined(MP_NO_MP_WORD)`
Packit	40b132	`mp_digit d = 0;`
Packit	40b132
Packit	40b132	`/* Inner product: Digits of a */`
Packit	40b132	`while (a_len--) {`
Packit	40b132	`mp_word w = ((mp_word)b * a++) + c + d;`
Packit	40b132	`*c++ = ACCUM(w);`
Packit	40b132	`d = CARRYOUT(w);`
Packit	40b132	`}`
Packit	40b132	`*c = d;`
Packit	40b132	`#else`
Packit	40b132	`mp_digit carry = 0;`
Packit	40b132	`while (a_len--) {`
Packit	40b132	`mp_digit a_i = *a++;`
Packit	40b132	`mp_digit a0b0, a1b1;`
Packit	40b132
Packit	40b132	`MP_MUL_DxD(a_i, b, a1b1, a0b0);`
Packit	40b132
Packit	40b132	`a0b0 += carry;`
Packit	40b132	`if (a0b0 < carry)`
Packit	40b132	`++a1b1;`
Packit	40b132	`a0b0 += a_i = *c;`
Packit	40b132	`if (a0b0 < a_i)`
Packit	40b132	`++a1b1;`
Packit	40b132	`*c++ = a0b0;`
Packit	40b132	`carry = a1b1;`
Packit	40b132	`}`
Packit	40b132	`*c = carry;`
Packit	40b132	`#endif`
Packit	40b132	`}`
Packit	40b132
Packit	40b132	`/* Presently, this is only used by the Montgomery arithmetic code. */`
Packit	40b132	`/* c += a * b */`
Packit	40b132	`static void`
Packit	40b132	`v8_mpv_mul_d_add_prop(const mp_digit a, mp_size a_len, mp_digit b, mp_digit c)`
Packit	40b132	`{`
Packit	40b132	`#if !defined(MP_NO_MP_WORD)`
Packit	40b132	`mp_digit d = 0;`
Packit	40b132
Packit	40b132	`/* Inner product: Digits of a */`
Packit	40b132	`while (a_len--) {`
Packit	40b132	`mp_word w = ((mp_word)b * a++) + c + d;`
Packit	40b132	`*c++ = ACCUM(w);`
Packit	40b132	`d = CARRYOUT(w);`
Packit	40b132	`}`
Packit	40b132
Packit	40b132	`while (d) {`
Packit	40b132	`mp_word w = (mp_word)*c + d;`
Packit	40b132	`*c++ = ACCUM(w);`
Packit	40b132	`d = CARRYOUT(w);`
Packit	40b132	`}`
Packit	40b132	`#else`
Packit	40b132	`mp_digit carry = 0;`
Packit	40b132	`while (a_len--) {`
Packit	40b132	`mp_digit a_i = *a++;`
Packit	40b132	`mp_digit a0b0, a1b1;`
Packit	40b132
Packit	40b132	`MP_MUL_DxD(a_i, b, a1b1, a0b0);`
Packit	40b132
Packit	40b132	`a0b0 += carry;`
Packit	40b132	`if (a0b0 < carry)`
Packit	40b132	`++a1b1;`
Packit	40b132
Packit	40b132	`a0b0 += a_i = *c;`
Packit	40b132	`if (a0b0 < a_i)`
Packit	40b132	`++a1b1;`
Packit	40b132
Packit	40b132	`*c++ = a0b0;`
Packit	40b132	`carry = a1b1;`
Packit	40b132	`}`
Packit	40b132	`while (carry) {`
Packit	40b132	`mp_digit c_i = *c;`
Packit	40b132	`carry += c_i;`
Packit	40b132	`*c++ = carry;`
Packit	40b132	`carry = carry < c_i;`
Packit	40b132	`}`
Packit	40b132	`#endif`
Packit	40b132	`}`
Packit	40b132
Packit	40b132	`/* These functions run only on v8plus+vis or v9+vis CPUs. */`
Packit	40b132
Packit	40b132	`/* c = a * b */`
Packit	40b132	`void`
Packit	40b132	`s_mpv_mul_d(const mp_digit a, mp_size a_len, mp_digit b, mp_digit c)`
Packit	40b132	`{`
Packit	40b132	`mp_digit d;`
Packit	40b132	`mp_digit x[258];`
Packit	40b132	`if (a_len <= 256) {`
Packit	40b132	`if (a == c \|\| ((ptrdiff_t)a & 0x7) != 0 \|\| (a_len & 1) != 0) {`
Packit	40b132	`mp_digit * px;`
Packit	40b132	`px = (((ptrdiff_t)x & 0x7) != 0) ? x + 1 : x;`
Packit	40b132	`memcpy(px, a, a_len * sizeof(*a));`
Packit	40b132	`a = px;`
Packit	40b132	`if (a_len & 1) {`
Packit	40b132	`px[a_len] = 0;`
Packit	40b132	`}`
Packit	40b132	`}`
Packit	40b132	`s_mp_setz(c, a_len + 1);`
Packit	40b132	`d = mul_add_inp(c, a, a_len, b);`
Packit	40b132	`c[a_len] = d;`
Packit	40b132	`} else {`
Packit	40b132	`v8_mpv_mul_d(a, a_len, b, c);`
Packit	40b132	`}`
Packit	40b132	`}`
Packit	40b132
Packit	40b132	`/* c += a * b, where a is a_len words long. */`
Packit	40b132	`void`
Packit	40b132	`s_mpv_mul_d_add(const mp_digit a, mp_size a_len, mp_digit b, mp_digit c)`
Packit	40b132	`{`
Packit	40b132	`mp_digit d;`
Packit	40b132	`mp_digit x[258];`
Packit	40b132	`if (a_len <= 256) {`
Packit	40b132	`if (((ptrdiff_t)a & 0x7) != 0 \|\| (a_len & 1) != 0) {`
Packit	40b132	`mp_digit * px;`
Packit	40b132	`px = (((ptrdiff_t)x & 0x7) != 0) ? x + 1 : x;`
Packit	40b132	`memcpy(px, a, a_len * sizeof(*a));`
Packit	40b132	`a = px;`
Packit	40b132	`if (a_len & 1) {`
Packit	40b132	`px[a_len] = 0;`
Packit	40b132	`}`
Packit	40b132	`}`
Packit	40b132	`d = mul_add_inp(c, a, a_len, b);`
Packit	40b132	`c[a_len] = d;`
Packit	40b132	`} else {`
Packit	40b132	`v8_mpv_mul_d_add(a, a_len, b, c);`
Packit	40b132	`}`
Packit	40b132	`}`
Packit	40b132
Packit	40b132	`/* c += a * b, where a is y words long. */`
Packit	40b132	`void`
Packit	40b132	`s_mpv_mul_d_add_prop(const mp_digit a, mp_size a_len, mp_digit b, mp_digit c)`
Packit	40b132	`{`
Packit	40b132	`mp_digit d;`
Packit	40b132	`mp_digit x[258];`
Packit	40b132	`if (a_len <= 256) {`
Packit	40b132	`if (((ptrdiff_t)a & 0x7) != 0 \|\| (a_len & 1) != 0) {`
Packit	40b132	`mp_digit * px;`
Packit	40b132	`px = (((ptrdiff_t)x & 0x7) != 0) ? x + 1 : x;`
Packit	40b132	`memcpy(px, a, a_len * sizeof(*a));`
Packit	40b132	`a = px;`
Packit	40b132	`if (a_len & 1) {`
Packit	40b132	`px[a_len] = 0;`
Packit	40b132	`}`
Packit	40b132	`}`
Packit	40b132	`d = mul_add_inp(c, a, a_len, b);`
Packit	40b132	`if (d) {`
Packit	40b132	`c += a_len;`
Packit	40b132	`do {`
Packit	40b132	`mp_digit sum = d + *c;`
Packit	40b132	`*c++ = sum;`
Packit	40b132	`d = sum < d;`
Packit	40b132	`} while (d);`
Packit	40b132	`}`
Packit	40b132	`} else {`
Packit	40b132	`v8_mpv_mul_d_add_prop(a, a_len, b, c);`
Packit	40b132	`}`
Packit	40b132	`}`

source-git / mingw-nss

Source Code

Blame nss/lib/freebl/mpi/mpi_sparc.c