#include <stdbool.h>
#include "lmmp.h"

lmmpn.h 的引用(Include)关系图:

此图展示该文件直接或间接的被哪些文件引用了:

宏定义
#define	INLINE_ static inline
	Copyright (C) 2026 HJimmyK(Jericho Knox)

#define	LMMP_ADDCB_(r, x, y) ((r) < (y))

#define	LMMP_AORS_(FUNCTION, TEST)

#define	LMMP_AORS_1_(OP, CB)

#define	lmmp_dec(p)
	大数减1宏（预期无借位）

#define	lmmp_dec_1(p, dec)
	大数减指定值宏（预期无借位）

#define	lmmp_inc(p)
	大数加1宏（预期无进位）

#define	lmmp_inc_1(p, inc)
	大数加指定值宏（预期无进位）

#define	LMMP_SUBCB_(r, x, y) ((x) < (y))

函数
static mp_limb_t	lmmp_add_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	大数加法静态内联函数 [dst,na]=[numa,na]+[numb,nb]

static mp_limb_t	lmmp_add_1_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_limb_t x)
	大数加单精度数静态内联函数 [dst,na]=[numa,na]+x

mp_limb_t	lmmp_add_n_ (mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
	无进位的n位加法 [dst,n] = [numa,n] + [numb,n]

mp_limb_t	lmmp_add_n_sub_n_ (mp_ptr dsta, mp_ptr dstb, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
	同时执行n位加法和减法 ([dsta,n],[dstb,n]) = ([numa,n]+[numb,n],[numa,n]-[numb,n])

mp_limb_t	lmmp_add_nc_ (mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n, mp_limb_t c)
	带进位的n位加法 [dst,n] = [numa,n] + [numb,n] + c

mp_limb_t	lmmp_addmul_1_ (mp_ptr numa, mp_srcptr numb, mp_size_t n, mp_limb_t b)
	大数乘以单limb并累加操作 [numa,n] += [numb,n] * b

mp_limb_t	lmmp_addshl1_n_ (mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
	加法结合左移1位操作 [dst,n] = [numa,n] + ([numb,n] << 1)

void	lmmp_bninv_ (mp_ptr dstq, mp_srcptr numa, mp_size_t na, mp_size_t ni)
	精确逆元计算 [dstq,na+ni+2] = B^(2(na+ni)) / ([numa,na] B^ni)

static int	lmmp_cmp_ (mp_srcptr numa, mp_srcptr numb, mp_size_t n)
	大数比较函数（内联）

void	lmmp_div_ (mp_ptr dstq, mp_ptr dstr, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	大数除法和取模操作

mp_limb_t	lmmp_div_1_ (mp_ptr dstq, mp_srcptr numa, mp_size_t na, mp_limb_t x)
	单精度数除法

mp_limb_t	lmmp_div_1_s_ (mp_ptr dstq, mp_ptr numa, mp_size_t na, mp_limb_t x)
	单精度数除法（除数为1个limb）

void	lmmp_div_2_ (mp_ptr dstq, mp_srcptr numa, mp_size_t na, mp_ptr numb)
	双精度数除法 (除数为2个limb)

mp_limb_t	lmmp_div_2_s_ (mp_ptr dstq, mp_ptr numa, mp_size_t na, mp_srcptr numb)
	双精度数除法（除数为2个limb）

mp_limb_t	lmmp_div_3_2_ (mp_ptr numa, mp_srcptr numb, mp_limb_t inv21)
	3/2位除法运算 [numa,2]=[numa,3] mod [numb,2]

mp_limb_t	lmmp_div_basecase_ (mp_ptr dstq, mp_ptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb, mp_limb_t inv21)
	基础除法运算

mp_limb_t	lmmp_div_divide_ (mp_ptr dstq, mp_ptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb, mp_limb_t inv21)
	分治除法运算

static mp_size_t	lmmp_div_inv_size_ (mp_size_t nq, mp_size_t nb)
	计算预计算逆元的尺寸

mp_limb_t	lmmp_div_mulinv_ (mp_ptr dstq, mp_ptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb, mp_srcptr invappr, mp_size_t ni)
	乘法逆元除法

mp_limb_t	lmmp_div_s_ (mp_ptr dstq, mp_ptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	除法运算

static bool	lmmp_endian (void)
	运行时判断端序

mp_bitcnt_t	lmmp_extract_bits_ (mp_srcptr num, mp_size_t n, mp_limb_t *ext, int bits)
	提取高位指定位数，并返回低位bits位数

mp_size_t	lmmp_fft_next_size_ (mp_size_t n)
	计算满足 >=n 的最小费马/梅森乘法可行尺寸

mp_size_t	lmmp_from_str_ (mp_ptr dst, const mp_byte_t *src, mp_size_t len, int base)
	字符串转大数操作 [src,len,base] to [dst,return value,B]

mp_size_t	lmmp_from_str_len_ (const mp_byte_t *src, mp_size_t len, int base)
	计算字符串转大数所需的 limb 缓冲区长度

void	lmmp_inv_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_size_t nf)
	大数求逆操作 [dst,na+nf+1] = (B^(2(na+nf)) - 1) / ([numa,na]B^nf) + [0\|-1]

mp_limb_t	lmmp_inv_1_ (mp_limb_t x)
	1阶逆元计算 (inv1)

mp_limb_t	lmmp_inv_2_1_ (mp_limb_t xh, mp_limb_t xl)
	2-1阶逆元计算 (inv21)

void	lmmp_inv_basecase_ (mp_ptr dst, mp_srcptr numa, mp_size_t na)
	近似逆元计算

void	lmmp_inv_prediv_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_size_t ni)
	除法前的逆元预计算，[dst,ni] = invappr( (ni+1 MSLs of numa) + 1 ) / B

void	lmmp_invappr_ (mp_ptr dst, mp_srcptr numa, mp_size_t na)
	近似逆元计算 (invappr)

void	lmmp_invappr_newton_ (mp_ptr dst, mp_srcptr numa, mp_size_t na)
	近似逆元计算（牛顿迭代法）

int	lmmp_leading_zeros_ (mp_limb_t x)
	计算一个单精度数(limb)中前导零的个数

int	lmmp_limb_bits_ (mp_limb_t x)
	计算满足 2^k > x 的最小自然数k

int	lmmp_limb_popcnt_ (mp_limb_t x)
	计算一个64位无符号整数中1的个数

mp_limb_t	lmmp_mod_1_ (mp_srcptr numa, mp_size_t na, mp_limb_t x)
	单精度数取余

void	lmmp_mod_2_ (mp_srcptr numa, mp_size_t na, mp_ptr numb)
	双精度数取余 (除数为2个limb)

void	lmmp_mul_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	不等长大数乘法操作 [dst,na+nb] = [numa,na] * [numb,nb]

mp_limb_t	lmmp_mul_1_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_limb_t x)
	大数乘以单limb操作 [dst,na] = [numa,na] * x

void	lmmp_mul_basecase_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	基础乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

void	lmmp_mul_fermat_ (mp_ptr dst, mp_size_t rn, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	费马数模乘法 [dst,rn+1]=[numa,na]*[numb,nb] mod B^rn+1

void	lmmp_mul_fft_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	FFT乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

void	lmmp_mul_fft_unbalance_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	FFT不平衡乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

void	lmmp_mul_mersenne_ (mp_ptr dst, mp_size_t rn, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	梅森数模乘法 [dst,rn] = [numa,na]*[numb,nb] mod B^rn-1

void	lmmp_mul_n_ (mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
	等长大数乘法操作 [dst,2n] = [numa,n] [numb,n]

void	lmmp_mul_toom22_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	Toom-22乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

void	lmmp_mul_toom32_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	Toom-32乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

void	lmmp_mul_toom33_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	Toom-33乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

void	lmmp_mul_toom42_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	Toom-42乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

void	lmmp_mul_toom42_unbalance_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	Toom-42不平衡乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

void	lmmp_mul_toom43_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	Toom-43乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

void	lmmp_mul_toom44_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	Toom-44乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

void	lmmp_mul_toom52_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	Toom-52乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

void	lmmp_mul_toom53_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	Toom-53乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

void	lmmp_mul_toom62_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	Toom-62乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

void	lmmp_mul_toom62_unbalance_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	Toom-62不平衡乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

mp_limb_t	lmmp_mulh_ (mp_limb_t a, mp_limb_t b)
	计算两个64位无符号整数相乘的高位结果 (a*b)/B

void	lmmp_mullh_ (mp_limb_t a, mp_limb_t b, mp_ptr dst)
	计算两个64位无符号整数相乘的128位结果 (a*b)

void	lmmp_mullo_ (mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
	低位乘法 [dst,n] = [numa,n] * [numb,n] mod B^n

void	lmmp_mullo_dc_ (mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_ptr tp, mp_size_t n)
	低位乘法 [dst,n] = [numa,n] * [numb,n] mod B^n

void	lmmp_mullo_fft_ (mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n, mp_ptr scratch)
	低位FFT乘法 [dst,n] = [numa,n] * [numb,n] mod B^n

void	lmmp_not_ (mp_ptr dst, mp_srcptr numa, mp_size_t na)
	大数按位取反操作 [dst,na] = ~[numa,na] (对每个limb执行按位非操作)

mp_limb_t	lmmp_shl_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_size_t shl)
	大数左移操作 [dst,na] = [numa,na]<<shl，dst的低shl位填充0

mp_limb_t	lmmp_shl_c_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_size_t shl, mp_limb_t c)
	带进位的大数左移操作 [dst,na] = [numa,na]<<shl，dst的低shl位填充c的低shl位

mp_limb_t	lmmp_shlnot_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_size_t shl)
	左移后按位取反操作 [dst,na] = ~([numa,na] << shl)，dst的低shl位填充1

mp_limb_t	lmmp_shr1add_n_ (mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
	加法后右移1位 [dst,n] = ([numa,n] + [numb,n]) >> 1

mp_limb_t	lmmp_shr1add_nc_ (mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n, mp_limb_t c)
	带进位加法后右移1位 [dst,n] = ([numa,n] + [numb,n] + c) >> 1

mp_limb_t	lmmp_shr1sub_n_ (mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
	减法后右移1位 [dst,n] = ([numa,n] - [numb,n]) >> 1

mp_limb_t	lmmp_shr1sub_nc_ (mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n, mp_limb_t c)
	带借位减法后右移1位 [dst,n] = ([numa,n] - [numb,n] - c) >> 1

mp_limb_t	lmmp_shr_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_size_t shr)
	大数右移操作 [dst,na] = [numa,na]>>shr，dst的高shr位填充0

mp_limb_t	lmmp_shr_c_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_size_t shr, mp_limb_t c)
	带进位的大数右移操作 [dst,na] = [numa,na]>>shr，dst的高shr位填充c的高shr位

void	lmmp_sqr_ (mp_ptr dst, mp_srcptr numa, mp_size_t na)
	大数平方操作 [dst,2*na] = [numa,na]^2

void	lmmp_sqr_basecase_ (mp_ptr dst, mp_srcptr numa, mp_size_t na)
	基础平方运算 [dst,2*na] = [numa,na]^2

void	lmmp_sqr_toom2_ (mp_ptr dst, mp_srcptr numa, mp_size_t na)
	Toom-2平方运算 [dst,2*na] = [numa,na]^2

void	lmmp_sqr_toom3_ (mp_ptr dst, mp_srcptr numa, mp_size_t na)
	Toom-3平方运算 [dst,2*na] = [numa,na]^2

void	lmmp_sqr_toom4_ (mp_ptr pp, mp_srcptr ap, mp_size_t an)
	Toom-4平方运算 [dst,2*na] = [numa,na]^2

void	lmmp_sqrlo_dc_ (mp_ptr dst, mp_srcptr numa, mp_ptr tp, mp_size_t n)
	低位平方 [dst,n] = [numa,n]^2 mod B^n

void	lmmp_sqrt_ (mp_ptr dsts, mp_ptr dstr, mp_srcptr numa, mp_size_t na, mp_size_t nf)
	大数平方根和取余操作

static mp_limb_t	lmmp_sub_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
	大数减法静态内联函数 [dst,na]=[numa,na]-[numb,nb]

static mp_limb_t	lmmp_sub_1_ (mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_limb_t x)
	大数减单精度数静态内联函数 [dst,na]=[numa,na]-x

mp_limb_t	lmmp_sub_n_ (mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
	无借位的n位减法 [dst,n] = [numa,n] - [numb,n]

mp_limb_t	lmmp_sub_nc_ (mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n, mp_limb_t c)
	带借位的n位减法 [dst,n] = [numa,n] - [numb,n] - c

mp_limb_t	lmmp_submul_1_ (mp_ptr numa, mp_srcptr numb, mp_size_t n, mp_limb_t b)
	大数乘以单limb并累减操作 [numa,n] -= [numb,n] * b

mp_limb_t	lmmp_subshl1_n_ (mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
	减法结合左移1位操作 [dst,n] = [numa,n] - ([numb,n] << 1)

int	lmmp_tailing_zeros_ (mp_limb_t x)
	计算一个单精度数(limb)中末尾零的个数

mp_size_t	lmmp_to_str_ (mp_byte_t *dst, mp_srcptr numa, mp_size_t na, int base)
	大数转字符串操作 [numa,na,B] to [dst,return value,base]

mp_size_t	lmmp_to_str_len_ (mp_srcptr numa, mp_size_t na, int base)
	计算大数转换为字符串，字符串需要的缓冲区长度

static int	lmmp_zero_q_ (mp_srcptr p, mp_size_t n)
	大数判零函数（内联）

宏定义说明

◆ INLINE_

#define INLINE_ static inline

This file is part of LAMMP.

LAMMP is free software: you can redistribute it and/or modify it under the terms of the GNU Lesser General Public License (LGPL) as published by the Free Software Foundation; either version 3 of the License, or (at your option) any later version.

This program is distributed WITHOUT ANY WARRANTY.

See https://www.gnu.org/licenses/.

在文件 lmmpn.h 第 55 行定义.

◆ LMMP_ADDCB_

#define LMMP_ADDCB_	(	r,
		x,
		y
	)	((r) < (y))

在文件 lmmpn.h 第 1090 行定义.

◆ LMMP_AORS_

#define LMMP_AORS_	(	FUNCTION,
		TEST
	)

值:

    mp_limb_t _x_;                               \
    if (FUNCTION(dst, numa, numb, nb)) {         \
        do {                                     \
            if (nb >= na)                        \
                return 1;                        \
            _x_ = numa[nb];                      \
        } while (TEST);                          \
    }                                            \
    if (dst != numa && na != nb)                 \
        lmmp_copy(dst + nb, numa + nb, na - nb); \
    return 0

在文件 lmmpn.h 第 1027 行定义.

                                       {         \
        do {                                     \
            if (nb >= na)                        \
                return 1;                        \
            _x_ = numa[nb];                      \
        } while (TEST);                          \
    }                                            \
    if (dst != numa && na != nb)                 \
        lmmp_copy(dst + nb, numa + nb, na - nb); \
    return 0

◆ LMMP_AORS_1_

#define LMMP_AORS_1_	(	OP,
		CB
	)

值:

    mp_size_t _i_ = 1;                              \
    mp_limb_t _x_ = numa[0], _r_ = _x_ OP x;        \
    dst[0] = _r_;                                   \
    if (CB(_r_, _x_, x)) {                          \
        do {                                        \
            if (_i_ >= na)                          \
                return 1;                           \
            _x_ = numa[_i_];                        \
            _r_ = _x_ OP 1;                         \
            dst[_i_] = _r_;                         \
            ++_i_;                                  \
        } while (CB(_r_, _x_, 1));                  \
    }                                               \
    if (numa != dst && na != _i_)                   \
        lmmp_copy(dst + _i_, numa + _i_, na - _i_); \
    return 0

在文件 lmmpn.h 第 1071 行定义.

                         {                          \
        do {                                        \
            if (_i_ >= na)                          \
                return 1;                           \
            _x_ = numa[_i_];                        \
            _r_ = _x_ OP 1;                         \
            dst[_i_] = _r_;                         \
            ++_i_;                                  \
        } while (CB(_r_, _x_, 1));                  \
    }                                               \
    if (numa != dst && na != _i_)                   \
        lmmp_copy(dst + _i_, numa + _i_, na - _i_); \
    return 0

◆ lmmp_dec

#define lmmp_dec ( p )

值:

    do {                           \
        mp_ptr _p_ = (p);          \
        while ((*(_p_++))-- == 0); \
    } while (0)

大数减1宏（预期无借位）

参数

p	指向大数起始位置的指针

注解: 从最低位开始减1，直到遇到非零值（预期无借位溢出）

在文件 lmmpn.h 第 965 行定义.

       {                           \
        mp_ptr _p_ = (p);          \
        while ((*(_p_++))-- == 0); \
    } while (0)

◆ lmmp_dec_1

#define lmmp_dec_1	(	p,
		dec
	)

值:

    do {                               \
        mp_ptr _p_ = (p);              \
        mp_limb_t _dec_ = (dec), _x_;  \
        _x_ = *_p_;                    \
        *_p_ = _x_ - _dec_;            \
        if (_x_ < _dec_)               \
            while ((*(++_p_))-- == 0); \
    } while (0)

大数减指定值宏（预期无借位）

参数

p	指向大数起始位置的指针
dec	要减的单精度数值

注解: 先减最低位，若产生借位则逐位减1，直到无借位（预期无溢出）

在文件 lmmpn.h 第 977 行定义.

       {                               \
        mp_ptr _p_ = (p);              \
        mp_limb_t _dec_ = (dec), _x_;  \
        _x_ = *_p_;                    \
        *_p_ = _x_ - _dec_;            \
        if (_x_ < _dec_)               \
            while ((*(++_p_))-- == 0); \
    } while (0)

◆ lmmp_inc

#define lmmp_inc ( p )

值:

    do {                           \
        mp_ptr _p_ = (p);          \
        while (++(*(_p_++)) == 0); \
    } while (0)

大数加1宏（预期无进位）

参数

p	指向大数起始位置的指针

注解: 从最低位开始加1，直到遇到非零值（预期无进位溢出）

在文件 lmmpn.h 第 938 行定义.

       {                           \
        mp_ptr _p_ = (p);          \
        while (++(*(_p_++)) == 0); \
    } while (0)

◆ lmmp_inc_1

#define lmmp_inc_1	(	p,
		inc
	)

值:

    do {                               \
        mp_ptr _p_ = (p);              \
        mp_limb_t _inc_ = (inc), _x_;  \
        _x_ = *_p_ + _inc_;            \
        *_p_ = _x_;                    \
        if (_x_ < _inc_)               \
            while (++(*(++_p_)) == 0); \
    } while (0)

大数加指定值宏（预期无进位）

参数

p	指向大数起始位置的指针
inc	要加的单精度数值

注解: 先加最低位，若产生进位则逐位加1，直到无进位（预期无溢出）

在文件 lmmpn.h 第 950 行定义.

       {                               \
        mp_ptr _p_ = (p);              \
        mp_limb_t _inc_ = (inc), _x_;  \
        _x_ = *_p_ + _inc_;            \
        *_p_ = _x_;                    \
        if (_x_ < _inc_)               \
            while (++(*(++_p_)) == 0); \
    } while (0)

◆ LMMP_SUBCB_

#define LMMP_SUBCB_	(	r,
		x,
		y
	)	((x) < (y))

在文件 lmmpn.h 第 1092 行定义.

函数说明

◆ lmmp_add_()

static mp_limb_t lmmp_add_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

inlinestatic

大数加法静态内联函数 [dst,na]=[numa,na]+[numb,nb]

参数

dst	输出结果缓冲区，存储numa + numb
numa	第一个加数，长度为na
na	第一个加数的 limb 长度
numb	第二个加数，长度为nb
nb	第二个加数的 limb 长度

返回: 进位标志（1表示有进位，0表示无进位）

警告: 0<nb<=na, eqsep(dst,[numa|numb])

在文件 lmmpn.h 第 1050 行定义.

                                                                                                    {
    LMMP_AORS_(lmmp_add_n_, ((dst[nb++] = _x_ + 1) == 0));
}

引用了 lmmp_add_n_(), LMMP_AORS_ , 以及 n.

被这些函数引用 lmmp_add_signed_(), lmmp_invsqrt_newton_(), lmmp_mul_fermat_recombine_(), lmmp_mul_fft_(), lmmp_mul_fft_cache_(), lmmp_mul_mersenne_(), lmmp_mul_mersenne_single_(), lmmp_mul_toom22_(), lmmp_mul_toom32_(), lmmp_mul_toom33_(), lmmp_mul_toom42_(), lmmp_mul_toom42_cache_(), lmmp_mul_toom42_cache_init_(), lmmp_mul_toom43_(), lmmp_mul_toom52_(), lmmp_mul_toom53_(), lmmp_mul_toom62_(), lmmp_mul_toom62_cache_init_(), lmmp_mullo_fft_(), lmmp_sqr_toom2_(), lmmp_sqr_toom3_(), lmmp_toom_eval_dgr3_pm1_(), lmmp_toom_eval_dgr3_pm2_() , 以及 lmmp_toom_eval_pm1_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_add_1_()

static mp_limb_t lmmp_add_1_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_limb_t	x
	)

inlinestatic

大数加单精度数静态内联函数 [dst,na]=[numa,na]+x

参数

dst	输出结果缓冲区，存储numa + x
numa	被加数，长度为na
na	被加数的 limb 长度
x	加数（单个 limb ）

返回: 进位标志（1表示有进位，0表示无进位）

警告: na>0, eqsep(dst,numa)

在文件 lmmpn.h 第 1103 行定义.

1103{ LMMP_AORS_1_(+, LMMP_ADDCB_); }

LMMP_AORS_1_

#define LMMP_AORS_1_(OP, CB)

Definition lmmpn.h:1071

LMMP_ADDCB_

#define LMMP_ADDCB_(r, x, y)

Definition lmmpn.h:1090

引用了 LMMP_ADDCB_ , 以及 LMMP_AORS_1_.

被这些函数引用 lmmp_divexact_unbalanced_(), lmmp_from_str_basecase_(), lmmp_inv_prediv_(), lmmp_mul_fermat_recombine_(), lmmp_mul_mersenne_(), lmmp_mul_mersenne_single_(), lmmp_mul_toom32_(), lmmp_mul_toom33_(), lmmp_mul_toom42_(), lmmp_mul_toom42_cache_(), lmmp_mul_toom42_cache_init_(), lmmp_mul_toom43_(), lmmp_sqr_toom3_(), lmmp_sqrt_divide_() , 以及 lmmp_toom_eval_pm2_().

这是这个函数的调用关系图:

◆ lmmp_add_n_()

mp_limb_t lmmp_add_n_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n
	)

无进位的n位加法 [dst,n] = [numa,n] + [numb,n]

参数

dst	结果输出指针
numa	第一个加数指针
numb	第二个加数指针
n	limb长度

警告: n>0, eqsep(dst,[numa|numb])

返回: 运算后的最终进位值 [0|1]

在文件 add_n.c 第 81 行定义.

                                                                               {
    mp_size_t i = 0;
    mp_limb_t cy = 0;
 
    for (; i + 4 <= n; i += 4) {
        mp_limb_t a0, b0, r0;
        mp_limb_t a1, b1, r1;
        mp_limb_t a2, b2, r2;
        mp_limb_t a3, b3, r3;
 
        a0 = numa[i + 0];
        b0 = numb[i + 0];
 
        a1 = numa[i + 1];
        b1 = numb[i + 1];
 
        a2 = numa[i + 2];
        b2 = numb[i + 2];
 
        a3 = numa[i + 3];
        b3 = numb[i + 3];
 
        r0 = a0 + cy;
        cy = (r0 < cy);
        r0 += b0;
        cy += (r0 < b0);
 
        r1 = a1 + cy;
        cy = (r1 < cy);
        r1 += b1;
        cy += (r1 < b1);
 
        r2 = a2 + cy;
        cy = (r2 < cy);
        r2 += b2;
        cy += (r2 < b2);
 
        r3 = a3 + cy;
        cy = (r3 < cy);
        r3 += b3;
        cy += (r3 < b3);
 
        dst[i + 0] = r0;
        dst[i + 1] = r1;
        dst[i + 2] = r2;
        dst[i + 3] = r3;
    }
 
    for (; i < n; i++) {
        mp_limb_t a, b, r;
        a = numa[i];
        b = numb[i];
        r = a + cy;
        cy = (r < cy);
        r += b;
        cy += (r < b);
        dst[i] = r;
    }
 
    return cy;
}

引用了 a0, a1, a2, a3, b0, b1, b2, b3, n, numb, r0, r1, r2 , 以及 r3.

被这些函数引用 lmmp_add_(), lmmp_binvert_n_dc_(), lmmp_binvert_unbalanced_(), lmmp_div_(), lmmp_div_basecase_(), lmmp_div_divide_n_(), lmmp_div_mulinv_(), lmmp_div_s_(), lmmp_from_str_divide_(), lmmp_invappr_newton_(), lmmp_mul_(), lmmp_mul_fft_unbalance_(), lmmp_mul_toom22_(), lmmp_mul_toom32_(), lmmp_mul_toom33_(), lmmp_mul_toom42_(), lmmp_mul_toom42_cache_(), lmmp_mul_toom42_cache_init_(), lmmp_mul_toom42_unbalance_(), lmmp_mul_toom43_(), lmmp_mul_toom62_(), lmmp_mul_toom62_cache_(), lmmp_mul_toom62_cache_init_(), lmmp_mul_toom62_unbalance_(), lmmp_mullo_dc_(), lmmp_sqr_toom2_(), lmmp_sqrlo_dc_(), lmmp_sqrt_divide_(), lmmp_toom_eval_dgr3_pm1_(), lmmp_toom_eval_dgr3_pm2_(), lmmp_toom_eval_pm1_(), lmmp_toom_interp5_(), lmmp_toom_interp6_() , 以及 lmmp_toom_interp7_().

这是这个函数的调用关系图:

◆ lmmp_add_n_sub_n_()

mp_limb_t lmmp_add_n_sub_n_	(	mp_ptr	dsta,
		mp_ptr	dstb,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n
	)

同时执行n位加法和减法 ([dsta,n],[dstb,n]) = ([numa,n]+[numb,n],[numa,n]-[numb,n])

参数

dsta	加法结果输出指针
dstb	减法结果输出指针
numa	第一个操作数指针（被加数/被减数）
numb	第二个操作数指针（加数/减数）
n	limb长度

警告: n>0, eqsep(dsta,[numa|numb]), eqsep(dstb,[numa|numb])

返回: 组合返回值 cb = 2*c + b (c为加法进位, b为减法借位) 返回值范围: 0(无进位无借位),1(无进位有借位),2(有进位无借位),3(有进位有借位)

同时执行n位加法和减法 ([dsta,n],[dstb,n]) = ([numa,n]+[numb,n],[numa,n]-[numb,n])

This file is part of LAMMP.

LAMMP is free software: you can redistribute it and/or modify it under the terms of the GNU Lesser General Public License (LGPL) as published by the Free Software Foundation; either version 3 of the License, or (at your option) any later version.

This program is distributed WITHOUT ANY WARRANTY.

See https://www.gnu.org/licenses/.

在文件 add_n_sub_n.c 第 20 行定义.

                                                                                                   {
    /*
    这段代码看起来有点奇怪的原因是，对于使用x64汇编时，我们会使用带进位的加法和减法，而x64中
    只能使用同一个进位寄存器，所以我们需要将两条指令分开执行。
    而不使用汇编时，编译器通常不会使用进位寄存器。因此我们可以同时读取两路内存，以减少读写次数。
    */
#ifdef USE_ASM
    mp_limb_t acyo = 0, scyo = 0;
    mp_size_t off, this_n;
 
    if (dsta != numa && dsta != numb) {
        for (off = 0; off < n; off += PART_SIZE) {
            this_n = LMMP_MIN(n - off, PART_SIZE);
            acyo = lmmp_add_nc_(dsta + off, numa + off, numb + off, this_n, acyo);
            scyo = lmmp_sub_nc_(dstb + off, numa + off, numb + off, this_n, scyo);
        }
    } else if (dstb != numa && dstb != numb) {
        for (off = 0; off < n; off += PART_SIZE) {
            this_n = LMMP_MIN(n - off, PART_SIZE);
            scyo = lmmp_sub_nc_(dstb + off, numa + off, numb + off, this_n, scyo);
            acyo = lmmp_add_nc_(dsta + off, numa + off, numb + off, this_n, acyo);
        }
    } else {
        mp_limb_t tp[PART_SIZE];
        for (off = 0; off < n; off += PART_SIZE) {
            this_n = LMMP_MIN(n - off, PART_SIZE);
            acyo = lmmp_add_nc_(tp, numa + off, numb + off, this_n, acyo);
            scyo = lmmp_sub_nc_(dstb + off, numa + off, numb + off, this_n, scyo);
            lmmp_copy(dsta + off, tp, this_n);
        }
    }
    return 2 * acyo + scyo;
#else
    mp_size_t i;
    mp_limb_t acyo, scyo;
 
    for (i = 0, acyo = 0, scyo = 0; i < n; i++) {
        mp_limb_t a, b, r;
        a = numa[i];
        b = numb[i];
        r = a + acyo;
        acyo = (r < acyo);
        r += b;
        acyo += (r < b);
        dsta[i] = r;
 
        b += scyo;
        scyo = (b < scyo);
        scyo += (a < b);
        dstb[i] = a - b;
    }
    return 2 * acyo + scyo;
#endif
}

引用了 lmmp_add_nc_(), lmmp_copy, LMMP_MIN, lmmp_sub_nc_(), n, numb, PART_SIZE , 以及 tp.

被这些函数引用 lmmp_mul_toom32_(), lmmp_mul_toom33_(), lmmp_mul_toom42_(), lmmp_mul_toom42_cache_(), lmmp_mul_toom42_cache_init_(), lmmp_mul_toom43_(), lmmp_mul_toom52_(), lmmp_mul_toom53_(), lmmp_mul_toom62_(), lmmp_mul_toom62_cache_init_(), lmmp_sqr_toom3_(), lmmp_toom_eval_dgr3_pm1_(), lmmp_toom_eval_dgr3_pm2_(), lmmp_toom_eval_pm1_() , 以及 lmmp_toom_eval_pm2_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_add_nc_()

mp_limb_t lmmp_add_nc_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n,
		mp_limb_t	c
	)

带进位的n位加法 [dst,n] = [numa,n] + [numb,n] + c

参数

dst	结果输出指针
numa	第一个加数指针
numb	第二个加数指针
n	limb长度
c	初始进位值 [0\|1]

警告: c=[0|1], n>0, eqsep(dst,[numa|numb])

返回: 运算后的最终进位值 [0|1]

带进位的n位加法 [dst,n] = [numa,n] + [numb,n] + c

This file is part of LAMMP.

LAMMP is free software: you can redistribute it and/or modify it under the terms of the GNU Lesser General Public License (LGPL) as published by the Free Software Foundation; either version 3 of the License, or (at your option) any later version.

This program is distributed WITHOUT ANY WARRANTY.

See https://www.gnu.org/licenses/.

在文件 add_n.c 第 19 行定义.

                                                                                             {
    mp_size_t i = 0;
    mp_limb_t cy = c;
 
    for (; i + 4 <= n; i += 4) {
        mp_limb_t a0, b0, r0;
        mp_limb_t a1, b1, r1;
        mp_limb_t a2, b2, r2;
        mp_limb_t a3, b3, r3;
 
        a0 = numa[i + 0];
        b0 = numb[i + 0];
 
        a1 = numa[i + 1];
        b1 = numb[i + 1];
 
        a2 = numa[i + 2];
        b2 = numb[i + 2];
 
        a3 = numa[i + 3];
        b3 = numb[i + 3];
 
        r0 = a0 + cy;
        cy = (r0 < cy);
        r0 += b0;
        cy += (r0 < b0);
 
        r1 = a1 + cy;
        cy = (r1 < cy);
        r1 += b1;
        cy += (r1 < b1);
 
        r2 = a2 + cy;
        cy = (r2 < cy);
        r2 += b2;
        cy += (r2 < b2);
 
        r3 = a3 + cy;
        cy = (r3 < cy);
        r3 += b3;
        cy += (r3 < b3);
 
        dst[i + 0] = r0;
        dst[i + 1] = r1;
        dst[i + 2] = r2;
        dst[i + 3] = r3;
    }
 
    for (; i < n; i++) {
        mp_limb_t a, b, r;
        a = numa[i];
        b = numb[i];
        r = a + cy;
        cy = (r < cy);
        r += b;
        cy += (r < b);
        dst[i] = r;
    }
 
    return cy;
}

引用了 a0, a1, a2, a3, b0, b1, b2, b3, c, n, numb, r0, r1, r2 , 以及 r3.

被这些函数引用 lmmp_add_n_sub_n_(), lmmp_fft_bfy_(), lmmp_ifft_bfy_() , 以及 lmmp_invappr_newton_().

这是这个函数的调用关系图:

◆ lmmp_addmul_1_()

mp_limb_t lmmp_addmul_1_	(	mp_ptr	numa,
		mp_srcptr	numb,
		mp_size_t	n,
		mp_limb_t	b
	)

大数乘以单limb并累加操作 [numa,n] += [numb,n] * b

参数

numa	被加数指针（结果也存储在此）
numb	乘数指针
n	limb长度
b	乘数

警告: n>0, eqsep(numa,numb))

返回: 运算后的进位limb值

被这些函数引用 lmmp_mul_toom62_(), lmmp_mul_toom62_cache_(), lmmp_mul_toom62_cache_init_(), lmmp_sqrt_() , 以及 lmmp_toom_interp7_().

这是这个函数的调用关系图:

◆ lmmp_addshl1_n_()

mp_limb_t lmmp_addshl1_n_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n
	)

加法结合左移1位操作 [dst,n] = [numa,n] + ([numb,n] << 1)

参数

dst	结果输出指针
numa	被加数指针
numb	加数指针（先左移1位）
n	limb长度

警告: n>0, eqsep(dst,[numa|numb])

返回: 运算后的进位值 [0|1|2]

在文件 shl.c 第 66 行定义.

                                                                                   {
    mp_size_t i, c = 0, mb = 0;
 
    for (i = 0; i < n; i++) {
        mp_limb_t a, b, r;
        a = numa[i];
        b = (numb[i] << 1) + mb;
        mb = numb[i] >> (LIMB_BITS - 1);
        r = a + c;
        c = (r < c);
        r += b;
        c += (r < b);
        dst[i] = r;
    }
    return c + mb;
}

引用了 c, LIMB_BITS, n , 以及 numb.

被这些函数引用 lmmp_mul_toom33_(), lmmp_mul_toom42_(), lmmp_mul_toom42_cache_(), lmmp_mul_toom42_cache_init_(), lmmp_mul_toom44_(), lmmp_mul_toom53_(), lmmp_mul_toom62_(), lmmp_mul_toom62_cache_(), lmmp_mul_toom62_cache_init_(), lmmp_sqr_toom3_(), lmmp_sqr_toom4_(), lmmp_sqrlo_dc_() , 以及 lmmp_sqrt_divide_().

这是这个函数的调用关系图:

◆ lmmp_bninv_()

void lmmp_bninv_	(	mp_ptr	dstq,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_size_t	ni
	)

精确逆元计算 [dstq,na+ni+2] = B^(2*(na+ni)) / ([numa,na] * B^ni)

参数

dstq	输出商的缓冲区，长度至少为na+ni+2
numa	输入被除数（长度na）
na	被除数的 limb 长度
ni	精度因子

警告: na>0, sep(dstq,numa), dstq!=NULL, numa[na-1]!=0

注解: 也就是计算 B^(2*na+ni) div ([numa,na]

◆ lmmp_cmp_()

static int lmmp_cmp_	(	mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n
	)

inlinestatic

大数比较函数（内联）

参数

numa	第一个大数，长度为n
numb	第二个大数，长度为n
n	大数的单精度数(limb)长度

返回: 1(numa>numb) / 0(numa==numb) / -1(numa<numb)

警告: n>0, numa!=NULL, numb!=NULL

注解: 从最高位开始逐位比较，直到找到不同位

在文件 lmmpn.h 第 996 行定义.

                                                                   {
    lmmp_param_assert(n > 0);
    lmmp_param_assert(numa != NULL);
    lmmp_param_assert(numb != NULL);
    mp_ssize_t i = n;
    mp_limb_t x, y;
    while (--i >= 0) {
        x = numa[i];
        y = numb[i];
        if (x != y)
            return (x > y ? 1 : -1);
    }
    return 0;
}

引用了 lmmp_param_assert, n , 以及 numb.

被这些函数引用 lmmp_add_signed_(), lmmp_cbrt_3_(), lmmp_cbrt_6_(), lmmp_div_(), lmmp_div_basecase_(), lmmp_div_mulinv_(), lmmp_div_s_(), lmmp_divexact_unbalanced_(), lmmp_gcd_basecase_(), lmmp_gcd_lehmer_(), lmmp_invappr_newton_(), lmmp_lehmer_mul_(), lmmp_mul_toom22_(), lmmp_mul_toom32_(), lmmp_mul_toom33_(), lmmp_mul_toom42_(), lmmp_mul_toom42_cache_(), lmmp_mul_toom42_cache_init_(), lmmp_mul_toom43_(), lmmp_mul_toom52_(), lmmp_mul_toom53_(), lmmp_mul_toom62_(), lmmp_mul_toom62_cache_init_(), lmmp_sqr_toom2_(), lmmp_sqr_toom3_(), lmmp_toom_eval_dgr3_pm1_(), lmmp_toom_eval_dgr3_pm2_(), lmmp_toom_eval_pm1_(), lmmp_toom_eval_pm2_() , 以及 try_div_().

这是这个函数的调用关系图:

◆ lmmp_div_()

void lmmp_div_	(	mp_ptr	dstq,
		mp_ptr	dstr,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

大数除法和取模操作

注解: 如果dstq不为NULL: [dstq,na-nb+1] = [numa,na] / [numb,nb] (商) 如果dstr不为NULL: [dstr,nb] = [numa,na] mod [numb,nb] (余数)

警告: 0<nb<=na, numb[nb-1]!=0, sep(dstq,[numa|numb]), eqsep(dstr,[numa|numb])) 特殊情况: nb==1时, dstq>=numa-1 是允许的 nb==2时, dstq>=numa 是允许的

参数

dstq	商结果输出指针（NULL表示不计算商）
dstr	余数结果输出指针（NULL表示不计算余数）
numa	被除数指针
na	被除数的 limb 长度
numb	除数指针
nb	除数的 limb 长度

在文件 div.c 第 74 行定义.

                                                                                                     {
    if (nb == 1) {
        mp_limb_t rem = lmmp_div_1_(dstq, numa, na, *numb);
        if (dstr)
            *dstr = rem;
    } else if (nb == 2) {
        mp_limb_t brem[2];
        brem[0] = numb[0];
        brem[1] = numb[1];
        lmmp_div_2_(dstq, numa, na, brem);
        if (dstr) {
            dstr[0] = brem[0];
            dstr[1] = brem[1];
        }
    } else {
        int adjust = numa[na - 1] >= numb[nb - 1];
        int cnt = lmmp_leading_zeros_(numb[nb - 1]);
        mp_size_t nq = na + adjust - nb;
        if (nq == 0) {
            if (dstr && dstr != numa)
                lmmp_copy(dstr, numa, nb);
            if (dstq)
                dstq[0] = 0;
            return;
        }
        TEMP_DECL;
 
        if (!dstq)
            dstq = TALLOC_TYPE(na - nb + 1, mp_limb_t);
        dstq[na - nb] = 0;
 
        if (nq >= nb) {
            mp_ptr restrict numa2 = TALLOC_TYPE(na + 1, mp_limb_t);
            mp_ptr numb2;
            if (cnt) {
                numa2[na] = lmmp_shl_(numa2, numa, na, cnt);
                numb2 = TALLOC_TYPE(nb, mp_limb_t);
                lmmp_shl_(numb2, numb, nb, cnt);
            } else {
                numa2[na] = 0;
                lmmp_copy(numa2, numa, na);
                numb2 = (mp_ptr)numb;
            }
 
            mp_limb_t inv21 = lmmp_inv_2_1_(numb2[nb - 1], numb2[nb - 2]);
            na += adjust;
 
            if (nb < DIV_DIVIDE_THRESHOLD)
                lmmp_div_basecase_(dstq, numa2, na, numb2, nb, inv21);
            else if (nb < DIV_MULINV_L_THRESHOLD || na < 2 * DIV_MULINV_N_THRESHOLD)
                lmmp_div_divide_(dstq, numa2, na, numb2, nb, inv21);
            else {
                mp_limb_t ni = lmmp_div_inv_size_(nq, nb);
                mp_ptr invappr = TALLOC_TYPE(ni, mp_limb_t);
                lmmp_inv_prediv_(invappr, numb2, nb, ni);
                lmmp_div_mulinv_(dstq, numa2, na, numb2, nb, invappr, ni);
            }
 
            if (dstr) {
                if (cnt)
                    lmmp_shr_(dstr, numa2, nb, cnt);
                else
                    lmmp_copy(dstr, numa2, nb);
            }
        } else {
            // nq=na-nb+adj<nb
            //-> na+adj>=2nq+1
            mp_size_t ni = nb - nq;
            mp_ptr numa2, numb2;
            mp_ptr tp = TALLOC_TYPE(nb, mp_limb_t);
            mp_limb_t cy;
 
            numa2 = TALLOC_TYPE(nq * 2 + 1, mp_limb_t);
            if (cnt) {
                numb2 = TALLOC_TYPE(nq, mp_limb_t);
                lmmp_shl_(numb2, numb + ni, nq, cnt);
                numb2[0] |= numb[ni - 1] >> (LIMB_BITS - cnt);
                cy = lmmp_shl_(numa2, numa + na - 2 * nq, 2 * nq, cnt);
                if (adjust) {
                    numa2[2 * nq] = cy;
                    ++numa2;  // numa2[0] is as significant as numa[ni=na-2nq+adjust]
                } else
                    numa2[0] |= numa[na - 2 * nq - 1] >> (LIMB_BITS - cnt);
            } else {
                numb2 = (mp_ptr)numb + ni;
                lmmp_copy(numa2, numa + na - 2 * nq, 2 * nq);
                if (adjust) {
                    numa2[2 * nq] = 0;
                    ++numa2;
                }
            }
 
            // now: 0<=numa2<B^2nq, B^nq/2<=numb2<B^nq, and 0<=numa2/numb2<B^nq
            // ignored bits could be seen as fraction part of numa and numb
            // we can prove:  Q<=Qh<=Q+2
            // where Q=floor(numa/numb) is the real quotient
            // Qh=floor(floor(numa)/floor(numb)) as below
 
            if (nq == 1) {
                lmmp_div_1_s_(dstq, numa2, 2, *numb2);
            } else if (nq == 2) {
                lmmp_div_2_s_(dstq, numa2, 4, numb2);
            } else {
                mp_limb_t inv21 = lmmp_inv_2_1_(numb2[nq - 1], numb2[nq - 2]);
 
                if (nq < DIV_DIVIDE_THRESHOLD)
                    lmmp_div_basecase_(dstq, numa2, 2 * nq, numb2, nq, inv21);
                else if (nq < DIV_MULINV_N_THRESHOLD)
                    lmmp_div_divide_(dstq, numa2, 2 * nq, numb2, nq, inv21);
                else {
                    mp_size_t inv_ni = lmmp_div_inv_size_(nq, nq);
                    mp_ptr invappr = tp;
                    lmmp_inv_prediv_(invappr, numb2, nq, inv_ni);
                    lmmp_div_mulinv_(dstq, numa2, 2 * nq, numb2, nq, invappr, inv_ni);
                }
            }
            /*
            true remainder = partial remainder - quotient * ignored divisor limbs
 
            Multiply the first ignored divisor limb by the most significant
            quotient limb.  If that product is > the partial remainder's
            most significant limb, we know the quotient is too large.  This
            test quickly catches most cases where the quotient is too large;
            it catches all cases where the quotient is 2 too large.*/
 
            mp_limb_t x;
            if (cnt) {
                mp_limb_t dl;
                if (ni < 2)
                    dl = 0;
                else
                    dl = numb[ni - 2];
                x = (numb[ni - 1] << cnt) | (dl >> (LIMB_BITS - cnt));
            } else
                x = numb[ni - 1];
            mp_limb_t h = (x >> LIMB_BITS / 2) * (dstq[nq - 1] >> LIMB_BITS / 2);
            mp_limb_t rnb = 0;  // remainder[nb]
            mp_size_t nr = nq;  // remainder=rnb:[numa2,nr]:[...,ni]
 
            if (h > numa2[nq - 1]) {
                lmmp_dec(dstq);
                rnb = lmmp_add_n_(numa2, numa2, numb2, nq);
            }
 
            // if cnt, recover the shift of partial remainder
            // and remove the effect of the partial-ignored numa[ni-1] and numb[ni-1]
            if (cnt) {
                numa2[nq] = rnb;
                ++nr;
                --ni;
                lmmp_shl_(numa2, numa2, nr, LIMB_BITS - cnt);
                numa2[0] |= numa[ni] & (LIMB_MAX >> cnt);
                cy = lmmp_submul_1_(numa2, dstq, nq, numb[ni] & (LIMB_MAX >> cnt));
                rnb = -(numa2[nq] < cy);
                numa2[nq] -= cy;
            }
 
            if (ni == 0) {
                if (dstr) {
                    if (rnb)
                        lmmp_add_n_(dstr, numa2, numb, nr);
                    else
                        lmmp_copy(dstr, numa2, nr);
                }
            } else {
                tp[nb - 1] = 0;
                if (ni < nq)
                    lmmp_mul_(tp, dstq, nq, numb, ni);
                else
                    lmmp_mul_(tp, numb, ni, dstq, nq);
 
                if (dstr) {
                    mp_ptr remptr = dstr == numb ? tp : dstr;
                    cy = lmmp_sub_n_(remptr, numa, tp, ni);
                    rnb -= lmmp_sub_nc_(remptr + ni, numa2, tp + ni, nr, cy);
                    if (rnb)
                        lmmp_add_n_(dstr, remptr, numb, nb);
                    else if (dstr != remptr)
                        lmmp_copy(dstr, remptr, nb);
                } else {
                    int hcmp = lmmp_cmp_(numa2, tp + ni, nr);
                    if (hcmp < 0)
                        --rnb;
                    else if (hcmp == 0)
                        rnb -= (lmmp_cmp_(numa, tp, ni) < 0);
                }
            }
 
            if (rnb)
                lmmp_dec(dstq);
        }
 
        TEMP_FREE;
    }
}

引用了 DIV_DIVIDE_THRESHOLD, DIV_MULINV_L_THRESHOLD, DIV_MULINV_N_THRESHOLD, LIMB_BITS, LIMB_MAX, lmmp_add_n_(), lmmp_cmp_(), lmmp_copy, lmmp_dec, lmmp_div_1_(), lmmp_div_1_s_(), lmmp_div_2_(), lmmp_div_2_s_(), lmmp_div_basecase_(), lmmp_div_divide_(), lmmp_div_inv_size_(), lmmp_div_mulinv_(), lmmp_inv_2_1_(), lmmp_inv_prediv_(), lmmp_leading_zeros_, lmmp_mul_(), lmmp_shl_(), lmmp_shr_(), lmmp_sub_n_(), lmmp_sub_nc_(), lmmp_submul_1_(), n, numb, TALLOC_TYPE, TEMP_DECL, TEMP_FREE , 以及 tp.

被这些函数引用 lmmp_bninv_(), lmmp_gcd_basecase_(), lmmp_gcd_lehmer_(), lmmp_trialdiv_() , 以及 try_div_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_div_1_()

mp_limb_t lmmp_div_1_	(	mp_ptr	dstq,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_limb_t	x
	)

单精度数除法

参数

dstq	输出商的缓冲区（可为NULL，此时仅计算余数）
numa	输入被除数，长度为na
na	被除数的 limb 长度
x	除数（单个 limb ）

返回: 除法余数（单个 limb ）

警告: na>0, x!=0, eqsep(dstq,numa), dstq>=numa-1 是可以接受的

注解: if (dstq!=NULL) [dstq,na] = [numa,na] div x

在文件 div.c 第 77 行定义.

                                                                              {
    mp_limb_t ah, al;
    if (na == 1) {
        ah = numa[0];
        if (dstq)
            dstq[0] = ah / x;
        return ah % x;
    }
    if (dstq) {
        mp_limb_t t = numa[na - 2], q = 0, r = 0;
        const int shift = lmmp_leading_zeros_(x);
        if (shift > 0) {
            /*
              ah    al
               X|XXXtttX|XXXmmmX|XXXnnnX|XXX----|
                |000XXXX|tttXXXX|mmmXXXX|nnnXXXX|
                            t    numa[na]
 
                     ah    al
               X|XXXtttX|XXXmmmX|XXXnnnX|XXX----|
                |000XXXX|tttXXXX|mmmXXXX|nnnXXXX|
                                    t
                                 numa[na]
            */
            const int rshift = LIMB_BITS - shift;
            ah = numa[na - 1] >> rshift;
            t = numa[na - 2];
            al = (numa[na - 1] << shift) | (t >> rshift);
            x <<= shift;
            const mp_limb_t inv = lmmp_inv_1_(x);
            _udiv_qrnnd_preinv(q, r, ah, al, x, inv);
            dstq[na - 1] = q;
            na -= 2;
            while (na-- > 0) {
                ah = r;
                al = t << shift;
                t = numa[na];
                al |= t >> rshift;
                _udiv_qrnnd_preinv(q, r, ah, al, x, inv);
                dstq[na + 1] = q;
            }
            ah = r;
            al = t << shift;
            _udiv_qrnnd_preinv(q, r, ah, al, x, inv);
            dstq[0] = q;
            return r >> shift;
        } else {
            /*
            ah     al
                |000XXXX|tttXXXX|mmmXXXX|nnnXXXX|
                            t    numa[na]
            */
            ah = 0;
            t = numa[na - 2];
            al = numa[na - 1];
            const mp_limb_t inv = lmmp_inv_1_(x);
            q = al / x;
            r = al % x;
            dstq[na - 1] = q;
            na -= 2;
            while (na-- > 0) {
                ah = r;
                al = t;
                t = numa[na];
                _udiv_qrnnd_preinv(q, r, ah, al, x, inv);
                dstq[na + 1] = q;
            }
            ah = r;
            al = t;
            _udiv_qrnnd_preinv(q, r, ah, al, x, inv);
            dstq[0] = q;
            return r;
        }
    } else {
        return lmmp_mod_1_(numa, na, x);
    }
}

引用了 _udiv_qrnnd_preinv, LIMB_BITS, lmmp_inv_1_(), lmmp_leading_zeros_, lmmp_mod_1_(), n , 以及 t.

被这些函数引用 lmmp_bninv_(), lmmp_cbrtapprox_3_(), lmmp_cbrtapprox_6_(), lmmp_div_() , 以及 lmmp_to_str_basecase_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_div_1_s_()

mp_limb_t lmmp_div_1_s_	(	mp_ptr	dstq,
		mp_ptr	numa,
		mp_size_t	na,
		mp_limb_t	x
	)

单精度数除法（除数为1个limb）

参数

dstq	输出商的缓冲区，长度至少为na-1
numa	输入被除数（长度na），运算后存储余数（长度1）
na	被除数的 limb 长度
x	除数（单个 limb ）

返回: 商的最高位（qh）

警告: na>1, MSB(x)=1, sep(dstq,numa)

注解: qh:[dstq,na-1]=[numa,na] div x, [numa,1]=[numa,na] mod x, return qh

被这些函数引用 lmmp_div_(), lmmp_div_s_(), mont63_R2() , 以及 mont64_R2().

这是这个函数的调用关系图:

◆ lmmp_div_2_()

void lmmp_div_2_	(	mp_ptr	dstq,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_ptr	numb
	)

双精度数除法 (除数为2个limb)

参数

dstq	输出商的缓冲区，长度至少为na-1
numa	输入被除数（长度na）
na	被除数的 limb 长度
numb	输入除数（长度2）[numb,2]=[numa,na] mod [numb,2]

警告: na>=2, numb[1]!=0, eqsep(dstq,numa), dstq>=numa 是可以接受的

注解: if (dstq!=NULL) [dstq,na-1]=[numa,na] div [numb,2]

在文件 div.c 第 234 行定义.

                                                                         {
    mp_limb_t q, r1, r0, a2, a1, a0, b1, b0;
    b1 = numb[1];
    b0 = numb[0];
    if (na == 2) {
        int shift = lmmp_leading_zeros_(b1);
        if (shift > 0) {
            const int rshift = LIMB_BITS - shift;
            b1 = (b1 << shift) | (b0 >> rshift);
            b0 <<= shift;
            a2 = numa[1] >> rshift;
            a1 = (numa[1] << shift) | (numa[0] >> rshift);
            a0 = (numa[0] << shift);
            mp_limb_t inv = lmmp_inv_2_1_(b1, b0);
            _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            if (dstq)
                dstq[0] = q;
            numb[0] = (r0 >> shift) | (r1 << rshift);
            numb[1] = r1 >> shift;
            return;
        } else {
            if (_u128cmp(numa, numb)) {
                numb[0] = numa[0];
                numb[1] = numa[1];
                if (dstq)
                    dstq[0] = 0;
                return;
            } else {
                _u128sub(numb, numa, numb);
                if (dstq)
                    dstq[0] = 1;
                return;
            }
        }
    }
    if (dstq) {
        int shift = lmmp_leading_zeros_(b1);
        if (shift > 0) {
            /*
              a2    a1    a0
               X|XXXtttX|XXXmmmX|XXXnnnX|XXX----|
                |000XXXX|tttXXXX|mmmXXXX|nnnXXXX|
                                 numa[na]
            */
            const int rshift = LIMB_BITS - shift;
            b1 = (b1 << shift) | (b0 >> rshift);
            b0 <<= shift;
            const mp_limb_t inv = lmmp_inv_2_1_(b1, b0);
            a2 = numa[na - 1] >> rshift;
            a1 = (numa[na - 1] << shift) | (numa[na - 2] >> rshift);
            a0 = (numa[na - 2] << shift) | (numa[na - 3] >> rshift);
            _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            dstq[na - 2] = q;
            na -= 2;
            while (na-- > 1) {
                a2 = r1;
                a1 = r0;
                a0 = (numa[na] << shift) | (numa[na - 1] >> rshift);
                _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
                dstq[na] = q;
            }
 
            a2 = r1;
            a1 = r0;
            a0 = (numa[na] << shift);
            _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            dstq[0] = q;
            numb[0] = (r0 >> shift) | (r1 << rshift);
            numb[1] = r1 >> shift;
            return;
        } else {
            /*
              a2    a1    a0
                |000XXXX|tttXXXX|mmmXXXX|nnnXXXX|
                                 numa[na]
            */
            const mp_limb_t inv = lmmp_inv_2_1_(b1, b0);
            a2 = 0;
            a1 = numa[na - 1];
            a0 = numa[na - 2];
            _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            dstq[na - 2] = q;
            na -= 2;
            while (na-- > 1) {
                a2 = r1;
                a1 = r0;
                a0 = numa[na];
                _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
                dstq[na] = q;
            }
            a2 = r1;
            a1 = r0;
            a0 = numa[na];
            _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            dstq[0] = q;
            numb[0] = r0;
            numb[1] = r1;
            return;
        }
    } else {
        int shift = lmmp_leading_zeros_(b1);
        if (shift > 0) {
            const int rshift = LIMB_BITS - shift;
            b1 = (b1 << shift) | (b0 >> rshift);
            b0 <<= shift;
            const mp_limb_t inv = lmmp_inv_2_1_(b1, b0);
            a2 = numa[na - 1] >> rshift;
            a1 = (numa[na - 1] << shift) | (numa[na - 2] >> rshift);
            a0 = (numa[na - 2] << shift) | (numa[na - 3] >> rshift);
            _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            na -= 2;
            while (na-- > 1) {
                a2 = r1;
                a1 = r0;
                a0 = (numa[na] << shift) | (numa[na - 1] >> rshift);
                _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            }
 
            a2 = r1;
            a1 = r0;
            a0 = (numa[na] << shift);
            _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            numb[0] = (r0 >> shift) | (r1 << rshift);
            numb[1] = r1 >> shift;
            return;
        } else {
            const mp_limb_t inv = lmmp_inv_2_1_(b1, b0);
            a2 = 0;
            a1 = numa[na - 1];
            a0 = numa[na - 2];
            _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            na -= 2;
            while (na-- > 1) {
                a2 = r1;
                a1 = r0;
                a0 = numa[na];
                _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            }
            a2 = r1;
            a1 = r0;
            a0 = numa[na];
            _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            numb[0] = r0;
            numb[1] = r1;
            return;
        }
    }
}

引用了 _u128cmp, _u128sub, _udiv_qr_3by2, a0, a1, a2, b0, b1, LIMB_BITS, lmmp_inv_2_1_(), lmmp_leading_zeros_, n, numb, r0 , 以及 r1.

被这些函数引用 lmmp_bninv_() , 以及 lmmp_div_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_div_2_s_()

mp_limb_t lmmp_div_2_s_	(	mp_ptr	dstq,
		mp_ptr	numa,
		mp_size_t	na,
		mp_srcptr	numb
	)

双精度数除法（除数为2个limb）

参数

dstq	输出商的缓冲区，长度至少为na-2
numa	输入被除数（长度na），运算后存储余数（长度2）
na	被除数的 limb 长度
numb	输入除数，长度为2

返回: 商的最高位（qh）

警告: na>2, MSB(numb)=1, sep(dstq,numa,numb)

注解: qh:[dstq,na-2]=[numa,na] div [numb,2], [numa,2]=[numa,na] mod [numb,2], return qh

被这些函数引用 lmmp_div_(), lmmp_div_s_() , 以及 lmmp_inv_basecase_().

这是这个函数的调用关系图:

◆ lmmp_div_3_2_()

mp_limb_t lmmp_div_3_2_	(	mp_ptr	numa,
		mp_srcptr	numb,
		mp_limb_t	inv21
	)

3/2位除法运算 [numa,2]=[numa,3] mod [numb,2]

参数

numa	输入被除数（长度3），运算后存储余数（长度2）
numb	输入除数（长度2）
inv21	除数的2-1阶逆元（提前计算好的inv21([numb,2])）

返回: 商值（单精度数）

警告: [numa,3]<[numb,2]*B, MSB(numb)=1, inv21=inv21([numb,2]), eqsep(numa,numb)

被这些函数引用 lmmp_div_basecase_().

这是这个函数的调用关系图:

◆ lmmp_div_basecase_()

mp_limb_t lmmp_div_basecase_	(	mp_ptr	dstq,
		mp_ptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb,
		mp_limb_t	inv21
	)

基础除法运算

参数

dstq	输出商的缓冲区，长度至少为na-nb
numa	输入被除数（长度na），运算后存储余数（长度nb）
na	被除数的单精度数(limb)长度
numb	输入除数，长度为nb
nb	除数的单精度数(limb)长度
inv21	除数的2-1阶逆元（inv21([numb+nb-2,2])）

返回: 商的最高位（qh）

警告: na>=nb>=3, MSB(numb)=1, inv21=inv21([numb+nb-2,2]), sep(dstq,numa,numb)

注解: qh:[dstq,na-nb]=[numa,na] div [numb,nb], [numa,na-nb]=[numa,na] mod [numb,nb], return qh

被这些函数引用 lmmp_bninv_appr_newton_(), lmmp_div_(), lmmp_div_divide_n_(), lmmp_div_s_() , 以及 lmmp_inv_basecase_().

这是这个函数的调用关系图:

◆ lmmp_div_divide_()

mp_limb_t lmmp_div_divide_	(	mp_ptr	dstq,
		mp_ptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb,
		mp_limb_t	inv21
	)

分治除法运算

参数

dstq	输出商的缓冲区，长度至少为na-nb
numa	输入被除数（长度na），运算后存储余数（长度nb）
na	被除数的单精度数(limb)长度
numb	输入除数，长度为nb
nb	除数的单精度数(limb)长度
inv21	除数的2-1阶逆元（inv21([numb+nb-2,2])）

返回: 商的最高位（qh）

警告: na>=2*nb, nb>=6, MSB(numb)=1, inv21=inv21([numb+nb-2,2]), sep(dstq,numa,numb)

注解: qh:[dstq,na-nb]=[numa,na] div [numb,nb], [numa,na-nb]=[numa,na] mod [numb,nb], return qh

被这些函数引用 lmmp_div_(), lmmp_div_s_() , 以及 lmmp_inv_basecase_().

这是这个函数的调用关系图:

◆ lmmp_div_inv_size_()

static mp_size_t lmmp_div_inv_size_	(	mp_size_t	nq,
		mp_size_t	nb
	)

inlinestatic

计算预计算逆元的尺寸

参数

nq	商的 limb 长度
nb	除数的 limb 长度

返回: 计算需要预计算逆元尺寸ni（ni<=nb）

注解: 用于已归一化除法([nq+nb]/[nb]=[nq])的逆元 ni 尺寸

在文件 lmmpn.h 第 804 行定义.

                                                                 {
    mp_size_t ni, b;
    if (nq > nb) {
        b = (nq - 1) / nb + 1;  // ceil(nq/nb), number of blocks
        ni = (nq - 1) / b + 1;  // ceil(nq/b)
    } else if (3 * nq > nb) {
        ni = (nq - 1) / 2 + 1;  // b=2
    } else {
        ni = (nq - 1) / 1 + 1;  // b=1
    }
    return ni;
}

引用了 n.

被这些函数引用 lmmp_div_(), lmmp_div_s_() , 以及 lmmp_to_str_().

这是这个函数的调用关系图:

◆ lmmp_div_mulinv_()

mp_limb_t lmmp_div_mulinv_	(	mp_ptr	dstq,
		mp_ptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb,
		mp_srcptr	invappr,
		mp_size_t	ni
	)

乘法逆元除法

参数

dstq	输出商的缓冲区，长度至少为na-nb
numa	输入被除数（长度na），运算后存储余数（长度nb）
na	被除数的 limb 长度
numb	输入除数，长度为nb
nb	除数的 limb 长度
invappr	预计算的近似逆元，长度为ni
ni	预计算逆元的 limb 长度

返回: 商的最高位（qh）

警告: na>=nb>=ni>0, MSB(numb)=1, [invappr,ni]=inv_prediv([numb,nb]), sep(dstq,numa,numb,invappr))

注解: qh:[dstq,na-1]=[numa,na] div x, [numa,1]=[numa,na] mod x, return qh

被这些函数引用 lmmp_div_(), lmmp_div_s_() , 以及 lmmp_to_str_divide_().

这是这个函数的调用关系图:

◆ lmmp_div_s_()

mp_limb_t lmmp_div_s_	(	mp_ptr	dstq,
		mp_ptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

除法运算

参数

dstq	输出商的缓冲区，长度至少为na-nb
numa	输入被除数（长度na），运算后存储余数（长度nb）
na	被除数的 limb 长度
numb	输入除数，长度为nb
nb	除数的 limb 长度

返回: 商的最高位（qh）

警告: na>=nb>0, MSB(numb)=1, sep(dstq,numa,numb)

注解: qh:[dstq,na-nb]=[numa,na] div [numb,nb], [numa,nb]=[numa,na] mod [numb,nb], return qh

被这些函数引用 lmmp_div_divide_(), lmmp_invsqrt_newton_(), lmmp_sqrt_divide_() , 以及 lmmp_to_str_divide_().

这是这个函数的调用关系图:

◆ lmmp_endian()

static bool lmmp_endian ( void )

inlinestatic

运行时判断端序

返回: true 表示小端序，false 表示大端序

在文件 lmmpn.h 第 65 行定义.

                               {
    int num = 1;
    return (*(char*)&num) == 0;
}

引用了 n.

◆ lmmp_extract_bits_()

mp_bitcnt_t lmmp_extract_bits_	(	mp_srcptr	num,
		mp_size_t	n,
		mp_limb_t *	ext,
		int	bits
	)

提取高位指定位数，并返回低位bits位数

参数

num	待提取的大数指针
n	num的 limb 长度
bits	待提取的位数(1-64)
ext	提取结果输出指针

警告: n>0, 1<=bits<=64, ext!=NULL

注解: 如果bits大于num的实际位数，则不会保证ext有效位数为bits位；如果bits小于等于num的实际位数，则ext将会有bits位有效位数。

返回: 剩余的低位bits数量

◆ lmmp_fft_next_size_()

mp_size_t lmmp_fft_next_size_ ( mp_size_t n )

计算满足 >=n 的最小费马/梅森乘法可行尺寸

参数

n 输入的目标尺寸

返回: 满足条件的SSA乘法最小尺寸

计算满足 >=n 的最小费马/梅森乘法可行尺寸

参数

n - 原始长度

返回: 规整后的长度（为2^k的倍数）

在文件 mul_fft.c 第 95 行定义.

                                           {
    mp_size_t k = lmmp_fft_best_k_(n);
    lmmp_debug_assert(k >= LOG2_LIMB_BITS);
    k -= LOG2_LIMB_BITS;
    n = (((n - 1) >> k) + 1) << k;
    return n;
}

引用了 k, lmmp_debug_assert, lmmp_fft_best_k_(), LOG2_LIMB_BITS , 以及 n.

被这些函数引用 binvert_mulhi_(), lmmp_div_mulinv_(), lmmp_invappr_newton_(), lmmp_invsqrt_newton_(), lmmp_mul_fft_(), lmmp_mul_fft_unbalance_(), lmmp_mulhi_n_() , 以及 lmmp_mullo_fft_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_from_str_()

mp_size_t lmmp_from_str_	(	mp_ptr	dst,
		const mp_byte_t *	src,
		mp_size_t	len,
		int	base
	)

字符串转大数操作 [src,len,base] to [dst,return value,B]

警告: len>=0, 2<=base<=256

参数

dst	大数结果输出指针
src	字符串源指针
len	字符串长度
base	字符串的进制基数

返回: 转换后的大数 limb 长度

在文件 from_str.c 第 154 行定义.

                                                                                    {
    lmmp_param_assert(base >= 2 && base <= 256);
    do {
        if (len == 0)
            return 0;
    } while (src[--len] == 0);
    ++len;
 
    mp_size_t limbs;
    if (LMMP_POW2_Q(base)) {
        mp_limb_t curlimb = 0;
        const mp_byte_t* srcend = src + len;
        int bitspd = lmmp_bases_table[base - 2].large_base;
        int bitpos = 0;
        limbs = 0;
 
        do {
            mp_limb_t curdigit = *src;
            curlimb |= curdigit << bitpos;
            bitpos += bitspd;
            if (bitpos >= LIMB_BITS) {
                dst[limbs] = curlimb;
                ++limbs;
                bitpos -= LIMB_BITS;
                curlimb = curdigit >> (bitspd - bitpos);
            }
        } while (++src != srcend);
        if (curlimb) {
            dst[limbs] = curlimb;
            ++limbs;
        }
    } else if (lmmp_from_str_len_(0, len, base) < FROM_STR_BASEPOW_THRESHOLD) {
        limbs = lmmp_from_str_basecase_(dst, src, len, base);
    } else {
        TEMP_DECL;
        mp_basepow_t powers[LIMB_BITS];
        mp_limb_t lbase = lmmp_bases_table[base - 2].large_base;
        mp_size_t digitspl = lmmp_bases_table[base - 2].digits_in_limb;
        mp_size_t bexp, lexp = (len - 1) / digitspl + 1;
        mp_size_t tzbit = lmmp_tailing_zeros_(lbase);
        // need 1 extra limb to store result
        mp_size_t alloc_size = lmmp_from_str_len_(0, len, base) + 1;
        mp_limb_t cy;
        mp_ptr tp;
 
        int cpow = lmmp_limb_bits_(lexp - 1);
 
        for (int i = cpow; i > 0; --i) {
            // we will calculate lbase^bexp
            bexp = ((lexp - 1) >> i) + 1;
            // we will calculate lbase^(bexp-1) first, and trim it s. t.
            // it contains at most 2 tailing 0 limb, then multiply it by lbase,
            // so we need npow limbs to store lbase^bexp
            mp_size_t npow = lmmp_from_str_len_(0, (bexp - 1) * digitspl + 1, base) + 1;
 
            if (tzbit) {
                mp_size_t tzlimb = tzbit * (bexp - 1) / LIMB_BITS;
                if (tzlimb >= 2)
                    npow -= tzlimb - 2;
            }
 
            // space needed for a trimmed npow-limb lbase^bexp
            alloc_size += npow;
        }
 
        tp = BALLOC_TYPE(alloc_size, mp_limb_t);
 
        for (int i = 0; i < 2; ++i) {
            tp[0] = lbase;
            powers[i].p = tp;
            powers[i].np = 1;
            tp += i + 1;
            powers[i].zeros = 0;
            powers[i].digits = digitspl * (i + 1);
            powers[i].base = base;
        }
 
        mp_ptr p = powers[1].p;
        mp_size_t zeros = 0, np = 1;
        for (int i = 2; i < cpow; ++i) {
            lmmp_sqr_(tp, p, np);
            np *= 2;
            np -= tp[np - 1] == 0;
            bexp = (lexp - 1) >> (cpow - i);
            if (bexp & 1) {
                cy = lmmp_mul_1_(tp, tp, np, lbase);
                tp[np] = cy;
                np += cy != 0;
            }
            zeros *= 2;
            while (tp[0] == 0) {
                // at most 2 tailing 0 limb here
                ++zeros;
                ++tp;
                --np;
            }
            p = tp;
            powers[i].p = p;
            powers[i].np = np;
            powers[i].zeros = zeros;
            powers[i].digits = digitspl * (bexp + 1);
            powers[i].base = base;
            tp += np + 1;
        }
 
        for (int i = 1; i < cpow; ++i) {
            p = powers[i].p;
            np = powers[i].np;
            cy = lmmp_mul_1_(p, p, np, lbase);
            p[np] = cy;
            np += cy != 0;
            if (p[0] == 0) {
                ++powers[i].zeros;
                ++p;
                --np;
            }
 
            powers[i].p = p;
            powers[i].np = np;
        }
 
        limbs = lmmp_from_str_divide_(tp, src, len, powers + cpow - 1, dst);
        lmmp_copy(dst, tp, limbs);
 
        TEMP_FREE;
    }
    return limbs;
}

引用了 BALLOC_TYPE, mp_base_t::digits_in_limb, FROM_STR_BASEPOW_THRESHOLD, mp_base_t::large_base, LIMB_BITS, lmmp_bases_table, lmmp_copy, lmmp_from_str_basecase_(), lmmp_from_str_divide_(), lmmp_from_str_len_(), lmmp_limb_bits_, lmmp_mul_1_(), lmmp_param_assert, LMMP_POW2_Q, lmmp_sqr_, lmmp_tailing_zeros_, n, TEMP_DECL, TEMP_FREE , 以及 tp.

函数调用图:

◆ lmmp_from_str_len_()

mp_size_t lmmp_from_str_len_	(	const mp_byte_t *	src,
		mp_size_t	len,
		int	base
	)

计算字符串转大数所需的 limb 缓冲区长度

参数

src	输入字符串指针
len	字符串长度
base	字符串的基数（2~256）

返回: 存储该字符串数值所需的 limb 缓冲区长度

警告: len>=0, 2<=base<=256

注解

将会忽略前导零，

if (src!=NULL) 返回的长度可能会多分配一个 limb 空间
if (src==NULL) 返回len位base进制数的最大可能 limb 长度（最坏情况）

计算字符串转大数所需的 limb 缓冲区长度

This file is part of LAMMP.

LAMMP is free software: you can redistribute it and/or modify it under the terms of the GNU Lesser General Public License (LGPL) as published by the Free Software Foundation; either version 3 of the License, or (at your option) any later version.

This program is distributed WITHOUT ANY WARRANTY.

See https://www.gnu.org/licenses/.

在文件 from_str.c 第 23 行定义.

                                                                            {
    lmmp_param_assert(base >= 2 && base <= 256);
    if (src) {
        do {
            if (len == 0)
                return 1;
        } while (src[--len] == 0);
        ++len;
    }
    return lmmp_mulh_(len, lmmp_bases_table[base - 2].lg_base) + 1;
}

引用了 lmmp_bases_table, lmmp_mulh_, lmmp_param_assert , 以及 n.

被这些函数引用 lmmp_from_str_(), lmmp_from_str_divide_() , 以及 lmmp_to_str_().

这是这个函数的调用关系图:

◆ lmmp_inv_()

void lmmp_inv_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_size_t	nf
	)

大数求逆操作 [dst,na+nf+1] = (B^(2*(na+nf)) - 1) / ([numa,na]*B^nf) + [0|-1]

参数

dst	逆元结果输出指针
numa	源操作数指针
na	操作数的 limb 长度
nf	精度因子

警告: na>0, numa[na-1]!=0, eqsep(dst,numa)

在文件 inv.c 第 163 行定义.

                                                                       {
    lmmp_param_assert(na > 0);
    lmmp_param_assert(numa[na - 1] != 0);
    mp_limb_t high = numa[na - 1];
    int nsh = lmmp_leading_zeros_(high);
    TEMP_DECL;
    if (dst == numa || nsh || nf) {
        nf += nsh != 0;
        mp_ptr restrict numa2 = TALLOC_TYPE(na + nf, mp_limb_t);
        lmmp_zero(numa2, nf);
        if (nsh)
            lmmp_shl_(numa2 + nf, numa, na, nsh);
        else
            lmmp_copy(numa2 + nf, numa, na);
        numa = numa2;
    }
    lmmp_invappr_(dst, numa, na + nf);
    if (nsh)
        lmmp_shr_c_(dst, dst, na + nf, LIMB_BITS - nsh, (mp_limb_t)1 << nsh);
    else
        dst[na + nf] = 1;
    TEMP_FREE;
}

引用了 LIMB_BITS, lmmp_copy, lmmp_invappr_(), lmmp_leading_zeros_, lmmp_param_assert, lmmp_shl_(), lmmp_shr_c_(), lmmp_zero, n, TALLOC_TYPE, TEMP_DECL , 以及 TEMP_FREE.

函数调用图:

◆ lmmp_inv_1_()

mp_limb_t lmmp_inv_1_ ( mp_limb_t x )

1阶逆元计算 (inv1)

参数

x	输入的64位无符号整数，最高位为1(MSB(x)=1)

返回: 计算结果：(B^2-1)/x - B

警告: MSB(x)=1, 即x>=2^63

在文件 inv.c 第 117 行定义.

                                   {
    mp_limb_t r, m;
    {
        mp_limb_t p, ql;
        unsigned ul, uh, qh;
 
        ul = x & LLIMB_MASK;
        uh = x >> (LIMB_BITS / 2);
        qh = (x ^ LIMB_MAX) / uh;
 
        r = ((~x - (mp_limb_t)qh * uh) << (LIMB_BITS / 2)) | LLIMB_MASK;
        p = (mp_limb_t)qh * ul;
        if (r < p) {
            qh--;
            r += x;
            if (r >= x)
                if (r < p) {
                    qh--;
                    r += x;
                }
        }
        r -= p;
        p = (r >> (LIMB_BITS / 2)) * qh + r;
        ql = (p >> (LIMB_BITS / 2)) + 1;
        r = (r << (LIMB_BITS / 2)) + LLIMB_MASK - ql * x;
        if (r >= (LIMB_MAX & (p << (LIMB_BITS / 2)))) {
            ql--;
            r += x;
        }
        m = ((mp_limb_t)qh << (LIMB_BITS / 2)) + ql;
        if (r >= x) {
            m++;
            r -= x;
        }
    }
    return m;
}

引用了 LIMB_BITS, LIMB_MAX, LLIMB_MASK , 以及 n.

被这些函数引用 lmmp_div_1_(), lmmp_div_1_s_(), lmmp_inv_basecase_(), lmmp_mod_1_() , 以及 lmmp_mulmod_ulong_().

这是这个函数的调用关系图:

◆ lmmp_inv_2_1_()

mp_limb_t lmmp_inv_2_1_	(	mp_limb_t	xh,
		mp_limb_t	xl
	)

2-1阶逆元计算 (inv21)

参数

xh	输入数的高64位部分
xl	输入数的低64位部分

返回: 计算结果：(B^3-1)/(xh*B+xl) - B

警告: MSB(xh)=1, 即xh>=2^63

2-1阶逆元计算 (inv21)

This file is part of LAMMP.

LAMMP is free software: you can redistribute it and/or modify it under the terms of the GNU Lesser General Public License (LGPL) as published by the Free Software Foundation; either version 3 of the License, or (at your option) any later version.

This program is distributed WITHOUT ANY WARRANTY.

See https://www.gnu.org/licenses/.

在文件 inv.c 第 20 行定义.

                                                    {
    mp_limb_t r, m;
    {
        mp_limb_t p, ql;
        unsigned ul, uh, qh;
 
        /* For notation, let b denote the half-limb base, so that B = b^2.
           Split u1 = b uh + ul. */
        ul = xh & LLIMB_MASK;
        uh = xh >> (LIMB_BITS / 2);
 
        /* Approximation of the high half of quotient. Differs from the 2/1
           inverse of the half limb uh, since we have already subtracted
           u0. */
        qh = (xh ^ LIMB_MAX) / uh;
 
        /* Adjust to get a half-limb 3/2 inverse, i.e., we want
 
           qh' = floor( (b^3 - 1) / u) - b = floor ((b^3 - b u - 1) / u
        = floor( (b (~u) + b-1) / u),
 
           and the remainder
 
           r = b (~u) + b-1 - qh (b uh + ul)
           = b (~u - qh uh) + b-1 - qh ul
 
           Subtraction of qh ul may underflow, which implies adjustments.
           But by normalization, 2 u >= B > qh ul, so we need to adjust by
           at most 2.
        */
 
        r = ((~xh - (mp_limb_t)qh * uh) << (LIMB_BITS / 2)) | LLIMB_MASK;
 
        p = (mp_limb_t)qh * ul;
        /* Adjustment steps taken from udiv_qrnnd_c */
        if (r < p) {
            qh--;
            r += xh;
            if (r >= xh) /* i.e. we didn't get carry when adding to r */
                if (r < p) {
                    qh--;
                    r += xh;
                }
        }
        r -= p;
 
        /* Low half of the quotient is
 
           ql = floor ( (b r + b-1) / u1).
 
           This is a 3/2 division (on half-limbs), for which qh is a
           suitable inverse. */
 
        p = (r >> (LIMB_BITS / 2)) * qh + r;
        /* Unlike full-limb 3/2, we can add 1 without overflow. For this to
           work, it is essential that ql is a full mp_limb_t. */
        ql = (p >> (LIMB_BITS / 2)) + 1;
 
        /* By the 3/2 trick, we don't need the high half limb. */
        r = (r << (LIMB_BITS / 2)) + LLIMB_MASK - ql * xh;
 
        if (r >= (LIMB_MAX & (p << (LIMB_BITS / 2)))) {
            ql--;
            r += xh;
        }
        m = ((mp_limb_t)qh << (LIMB_BITS / 2)) + ql;
        if (r >= xh) {
            m++;
            r -= xh;
        }
    }
 
    /* Now m is the 2/1 inverse of u1. If u0 > 0, adjust it to become a
       3/2 inverse. */
    if (xl > 0) {
        mp_limb_t th, tl;
        r = ~r;
        r += xl;
        if (r < xl) {
            m--;
            if (r >= xh) {
                m--;
                r -= xh;
            }
            r -= xh;
        }
        _umul64to128_(xl, m, &tl, &th);
        r += th;
        if (r < th) {
            m--;
            m -= ((r > xh) | ((r == xh) & (tl > xl)));
        }
    }
 
    return m;
}

引用了 _umul64to128_(), LIMB_BITS, LIMB_MAX, LLIMB_MASK , 以及 n.

被这些函数引用 lmmp_bninv_appr_newton_(), lmmp_div_(), lmmp_div_2_(), lmmp_div_2_s_(), lmmp_div_s_(), lmmp_inv_basecase_() , 以及 lmmp_mod_2_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_inv_basecase_()

void lmmp_inv_basecase_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na
	)

近似逆元计算

参数

dst	输出结果缓冲区，长度为na
numa	输入操作数，长度为na
na	输入操作数的 limb 长度

警告: na>0, MSB(numa)=1, sep(dst,numa)

返回: 无返回值，结果存储在dst中，[dst,na]=(B^(2*na)-1)/[numa,na] - B^na

◆ lmmp_inv_prediv_()

void lmmp_inv_prediv_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_size_t	ni
	)

除法前的逆元预计算，[dst,ni] = invappr( (ni+1 MSLs of numa) + 1 ) / B

参数

dst	输出预计算逆元的缓冲区，长度为ni
numa	输入操作数，长度为na
na	输入操作数的 limb 长度
ni	预计算逆元的目标尺寸

警告: na>=ni>0, MSB(numa)=1, eqsep(dst,numa)

注解: if (ni=na) [dst,na] = (B^(2*na)-1) / [numa,na] - B^na

除法前的逆元预计算，[dst,ni] = invappr( (ni+1 MSLs of numa) + 1 ) / B

This file is part of LAMMP.

LAMMP is free software: you can redistribute it and/or modify it under the terms of the GNU Lesser General Public License (LGPL) as published by the Free Software Foundation; either version 3 of the License, or (at your option) any later version.

This program is distributed WITHOUT ANY WARRANTY.

See https://www.gnu.org/licenses/.

在文件 div_mulinv.c 第 22 行定义.

                                                                              {
    lmmp_param_assert(na >= ni);
    lmmp_param_assert(ni > 0);
    lmmp_param_assert(numa[na - 1] >= LIMB_B_2);
    TEMP_DECL;
    mp_limb_t cy;
    mp_ptr restrict tp = TALLOC_TYPE(ni + 1, mp_limb_t);
 
    if (na == ni) {
        lmmp_copy(tp + 1, numa, ni);
        tp[0] = 1;
        cy = 0;
    } else {
        cy = lmmp_add_1_(tp, numa + na - (ni + 1), ni + 1, 1);
    }
    if (cy)
        lmmp_zero(dst, ni);
    else {
        mp_ptr restrict invappr = TALLOC_TYPE(ni + 1, mp_limb_t);
        lmmp_invappr_(invappr, tp, ni + 1);
        lmmp_copy(dst, invappr + 1, ni);
    }
    TEMP_FREE;
}

引用了 LIMB_B_2, lmmp_add_1_(), lmmp_copy, lmmp_invappr_(), lmmp_param_assert, lmmp_zero, n, TALLOC_TYPE, TEMP_DECL, TEMP_FREE , 以及 tp.

被这些函数引用 lmmp_div_(), lmmp_div_s_() , 以及 lmmp_to_str_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_invappr_()

void lmmp_invappr_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na
	)

近似逆元计算 (invappr)

参数

dst	输出结果缓冲区，长度为na
numa	输入操作数，长度为na
na	输入操作数的 limb 长度

警告: na>0, MSB(numa)=1, sep(dst,numa)

返回: 无返回值，结果存储在dst中，[dst,na] = (B^(2*na)-1)/[numa,na] - B^na + [0|-1]

被这些函数引用 lmmp_inv_prediv_().

这是这个函数的调用关系图:

◆ lmmp_invappr_newton_()

void lmmp_invappr_newton_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na
	)

近似逆元计算（牛顿迭代法）

参数

dst	输出结果缓冲区，长度为na
numa	输入操作数，长度为na
na	输入操作数的 limb 长度

警告: na>4, MSB(numa)=1, sep(dst,numa)

返回: 无返回值，结果存储在dst中，[dst,na]=(B^(2*na)-1)/[numa,na]-B^na+[0|-1]

◆ lmmp_leading_zeros_()

int lmmp_leading_zeros_ ( mp_limb_t x )

计算一个单精度数(limb)中前导零的个数

参数

x	输入的64位无符号整数

返回: 前导零的位数（范围：0~64）

在文件 tiny.c 第 51 行定义.

                                     {
    if (x == 0) return 64;
#ifdef __GNUC__
    return __builtin_clzll(x);
#elif defined(_MSC_VER) && (defined(_M_X64) || defined(_M_ARM64))
    unsigned long index;
    _BitScanReverse64(&index, x);  
    return 63 - (int)index;
#else
    int n = 0;
    if (x <= 0x00000000FFFFFFFF) { n += 32; x <<= 32; }
    if (x <= 0x0000FFFFFFFFFFFF) { n += 16; x <<= 16; }
    if (x <= 0x00FFFFFFFFFFFFFF) { n += 8;  x <<= 8; }
    if (x <= 0x0FFFFFFFFFFFFFFF) { n += 4;  x <<= 4; }
    if (x <= 0x3FFFFFFFFFFFFFFF) { n += 2;  x <<= 2; }
    if (x <= 0x7FFFFFFFFFFFFFFF) { n += 1;  x <<= 1; }
    return n;
#endif
}

引用了 n.

◆ lmmp_limb_bits_()

int lmmp_limb_bits_ ( mp_limb_t x )

计算满足 2^k > x 的最小自然数k

参数

x	输入的64位无符号整数

返回: 满足条件的最小自然数k

计算满足 2^k > x 的最小自然数k

This file is part of LAMMP.

LAMMP is free software: you can redistribute it and/or modify it under the terms of the GNU Lesser General Public License (LGPL) as published by the Free Software Foundation; either version 3 of the License, or (at your option) any later version.

This program is distributed WITHOUT ANY WARRANTY.

See https://www.gnu.org/licenses/.

在文件 tiny.c 第 21 行定义.

                                 {
    int k = 0;
    while (x) {
        x >>= 1;
        k++;
    }
    return k;
}

引用了 k , 以及 n.

◆ lmmp_limb_popcnt_()

int lmmp_limb_popcnt_ ( mp_limb_t x )

计算一个64位无符号整数中1的个数

参数

x	输入的64位无符号整数

返回: 1的个数

在文件 tiny.c 第 30 行定义.

                                   {
#if defined(__GNUC__) || defined(__clang__)
    mp_limb_t count;
#if defined(__x86_64__) && defined(USE_ASM)
    __asm__ volatile("popcnt %1, %0" : "=r"(count) : "r"(x) : "cc");
#else
    count = __builtin_popcountll(x);
#endif
    return count;
#elif defined(_MSC_VER) && (defined(_M_X64) || defined(_M_ARM64))
    return (int)__popcnt64(x);
#else
    int k = 0;
    while (x) {
        k += x & 1;
        x >>= 1;
    }
    return k;
#endif
}

引用了 k , 以及 n.

◆ lmmp_mod_1_()

mp_limb_t lmmp_mod_1_	(	mp_srcptr	numa,
		mp_size_t	na,
		mp_limb_t	x
	)

单精度数取余

参数

numa	输入被除数，长度为na
na	被除数的 limb 长度
x	除数（单个 limb ）

返回: 除法余数（单个 limb ）

警告: na>0, x!=0, numa!=NULL

在文件 div.c 第 31 行定义.

                                                                 {
    mp_limb_t ah, al;
    // q: assigned for macro reuse, unused in this logic (known warning)
    mp_limb_t t = numa[na - 2], q = 0, r = 0;
    const int shift = lmmp_leading_zeros_(x);
    if (shift > 0) {
        const int rshift = LIMB_BITS - shift;
        ah = numa[na - 1] >> rshift;
        t = numa[na - 2];
        al = (numa[na - 1] << shift) | (t >> rshift);
        x <<= shift;
        const mp_limb_t inv = lmmp_inv_1_(x);
        _udiv_qrnnd_preinv(q, r, ah, al, x, inv);
        na -= 2;
        while (na-- > 0) {
            ah = r;
            al = t << shift;
            t = numa[na];
            al |= t >> rshift;
            _udiv_qrnnd_preinv(q, r, ah, al, x, inv);
        }
        ah = r;
        al = t << shift;
        _udiv_qrnnd_preinv(q, r, ah, al, x, inv);
        return r >> shift;
    } else {
        ah = 0;
        t = numa[na - 2];
        al = numa[na - 1];
        const mp_limb_t inv = lmmp_inv_1_(x);
        q = al / x;
        r = al % x;
        na -= 2;
        while (na-- > 0) {
            ah = r;
            al = t;
            t = numa[na];
            _udiv_qrnnd_preinv(q, r, ah, al, x, inv);
        }
        ah = r;
        al = t;
        _udiv_qrnnd_preinv(q, r, ah, al, x, inv);
        return r;
    }
}

引用了 _udiv_qrnnd_preinv, LIMB_BITS, lmmp_inv_1_(), lmmp_leading_zeros_, n , 以及 t.

被这些函数引用 lmmp_div_1_(), lmmp_gcd_1_() , 以及 lmmp_trialdiv_short_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_mod_2_()

void lmmp_mod_2_	(	mp_srcptr	numa,
		mp_size_t	na,
		mp_ptr	numb
	)

双精度数取余 (除数为2个limb)

参数

numa	输入被除数（长度na）
na	被除数的 limb 长度
numb	输入除数（长度2）[numb,2]=[numa,na] mod [numb,2]

警告: na>=2, numb[1]!=0, numb!=NULL, numa!=NULL

在文件 div.c 第 155 行定义.

                                                            {
    mp_limb_t q, r1, r0, a2, a1, a0, b1, b0;
    b1 = numb[1];
    b0 = numb[0];
    if (na == 2) {
        int shift = lmmp_leading_zeros_(b1);
        if (shift > 0) {
            const int rshift = LIMB_BITS - shift;
            b1 = (b1 << shift) | (b0 >> rshift);
            b0 <<= shift;
            a2 = numa[1] >> rshift;
            a1 = (numa[1] << shift) | (numa[0] >> rshift);
            a0 = (numa[0] << shift);
            mp_limb_t inv = lmmp_inv_2_1_(b1, b0);
            _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            numb[0] = (r0 >> shift) | (r1 << rshift);
            numb[1] = r1 >> shift;
            return;
        } else {
            if (_u128cmp(numa, numb)) {
                numb[0] = numa[0];
                numb[1] = numa[1];
                return;
            } else {
                _u128sub(numb, numa, numb);
                return;
            }
        }
    } else {
        int shift = lmmp_leading_zeros_(b1);
        if (shift > 0) {
            const int rshift = LIMB_BITS - shift;
            b1 = (b1 << shift) | (b0 >> rshift);
            b0 <<= shift;
            const mp_limb_t inv = lmmp_inv_2_1_(b1, b0);
            a2 = numa[na - 1] >> rshift;
            a1 = (numa[na - 1] << shift) | (numa[na - 2] >> rshift);
            a0 = (numa[na - 2] << shift) | (numa[na - 3] >> rshift);
            _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            na -= 2;
            while (na-- > 1) {
                a2 = r1;
                a1 = r0;
                a0 = (numa[na] << shift) | (numa[na - 1] >> rshift);
                _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            }
 
            a2 = r1;
            a1 = r0;
            a0 = (numa[na] << shift);
            _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            numb[0] = (r0 >> shift) | (r1 << rshift);
            numb[1] = r1 >> shift;
            return;
        } else {
            const mp_limb_t inv = lmmp_inv_2_1_(b1, b0);
            a2 = 0;
            a1 = numa[na - 1];
            a0 = numa[na - 2];
            _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            na -= 2;
            while (na-- > 1) {
                a2 = r1;
                a1 = r0;
                a0 = numa[na];
                _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            }
            a2 = r1;
            a1 = r0;
            a0 = numa[na];
            _udiv_qr_3by2(q, r1, r0, a2, a1, a0, b1, b0, inv);
            numb[0] = r0;
            numb[1] = r1;
            return;
        }
    }
}

引用了 _u128cmp, _u128sub, _udiv_qr_3by2, a0, a1, a2, b0, b1, LIMB_BITS, lmmp_inv_2_1_(), lmmp_leading_zeros_, n, numb, r0 , 以及 r1.

被这些函数引用 lmmp_gcd_2_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_mul_()

void lmmp_mul_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

不等长大数乘法操作 [dst,na+nb] = [numa,na] * [numb,nb]

警告: 0<nb<=na, sep(dst,[numa|numb])

参数

dst	乘积结果输出指针（需要 na+nb 的 limb 长度）
numa	第一个乘数指针（较长的操作数）
na	第一个操作数的 limb 长度
numb	第二个乘数指针（较短的操作数）
nb	第二个操作数的 limb 长度

被这些函数引用 lmmp_bninv_appr_newton_(), lmmp_cube_(), lmmp_div_(), lmmp_div_divide_n_(), lmmp_div_mulinv_(), lmmp_div_s_(), lmmp_divexact_divide_(), lmmp_elem_mul_ulong_(), lmmp_from_str_divide_(), lmmp_huff_tree_mul_(), lmmp_invappr_newton_(), lmmp_invsqrt_newton_(), lmmp_mul_fft_unbalance_(), lmmp_mul_signed_(), lmmp_mul_toom22_(), lmmp_mul_toom32_(), lmmp_mul_toom33_(), lmmp_mul_toom42_(), lmmp_mul_toom42_cache_(), lmmp_mul_toom42_cache_init_(), lmmp_mul_toom42_unbalance_(), lmmp_mul_toom43_(), lmmp_mul_toom44_(), lmmp_mul_toom52_(), lmmp_mul_toom53_(), lmmp_mul_toom62_(), lmmp_mul_toom62_cache_(), lmmp_mul_toom62_cache_init_(), lmmp_mul_toom62_unbalance_(), lmmp_pow_win2_(), lmmp_sqrt_newton_() , 以及 pow_nPr_().

这是这个函数的调用关系图:

◆ lmmp_mul_1_()

mp_limb_t lmmp_mul_1_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_limb_t	x
	)

大数乘以单limb操作 [dst,na] = [numa,na] * x

参数

dst	结果输出指针
numa	被乘数指针
na	操作数的位数（limb数量）
x	单个limb乘数

警告: na>0, eqsep(dst,numa) 支持 dst<=numa+1 的内存布局

返回: 运算后的进位limb值

被这些函数引用 lmmp_3pow_1_(), lmmp_elem_mul_ulong_(), lmmp_from_str_(), lmmp_from_str_basecase_(), lmmp_lehmer_mul_(), lmmp_mullo_dc_(), lmmp_pow_(), lmmp_sqrlo_dc_(), lmmp_to_str_(), lmmp_u32_pow_1_(), lmmp_u64_pow_1_() , 以及 lmmp_u8_pow_1_().

这是这个函数的调用关系图:

◆ lmmp_mul_basecase_()

void lmmp_mul_basecase_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

基础乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

参数

dst	输出结果缓冲区，长度至少为 na+nb
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: 0<nb<=na, sep(dst,[numa|numb])

返回: 无返回值，结果存储在dst中

被这些函数引用 __lmmp_mul_n_(), lmmp_mul_(), lmmp_mul_n_() , 以及 lmmp_u16_pow_1_().

这是这个函数的调用关系图:

◆ lmmp_mul_fermat_()

void lmmp_mul_fermat_	(	mp_ptr	dst,
		mp_size_t	rn,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

费马数模乘法 [dst,rn+1]=[numa,na]*[numb,nb] mod B^rn+1

参数

dst	输出结果缓冲区，长度至少为 rn+1
rn	模运算的阶数参数，rn = lmmp_fft_next_size_((na + nb + 1) >> 1)
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: eqsep(dst,[numa|numb]), 0<=[numa,na]<2*B^rn, 0<=[numb,nb]<2*B^rn, rn = lmmp_fft_next_size_((na+nb+1)>>1)

返回: 无返回值，结果存储在dst中

在文件 mul_fft.c 第 687 行定义.

                                                                                                            {
    int nsqr = numa != numb || na != nb;  // 判断是否为平方运算
    mp_size_t N = rn * LIMB_BITS;         // 结果总比特数
    mp_size_t k = lmmp_fft_best_k_(rn);
    mp_size_t K = ((mp_size_t)1) << k;    // FFT块数（2^k）
    lmmp_debug_assert(!(N & (K - 1)));
    mp_size_t M = N >> k;         // 每个块的比特数
    mp_size_t n = 2 * M + k + 2;  // 扩展系数长度
 
    n = (n + LIMB_BITS - 1) & (-LIMB_BITS);
    n = (((n - 1) >> k) + 1) << k;
 
    // 初始化内存栈
    fft_memstack msr;
    msr.maxdepth = -1;
    msr.tempdepth = -1;
    msr.lenw = n / LIMB_BITS;
    mp_size_t nlen = msr.lenw + 1;
 
    msr.temp_coef = (mp_ptr)lmmp_fft_memstack_(&msr, (((nlen + 1) << (k + nsqr)) + nlen) * LIMB_BYTES);
 
    mp_ptr *pfca = (mp_ptr*)(msr.temp_coef + nlen), *pfcb = pfca;
    mp_size_t narest = na * LIMB_BITS, nbrest = nb * LIMB_BITS;
 
    for (mp_size_t i = 0; i < K; ++i) {
        mp_size_t coeflen;
        pfca[i] = (mp_ptr)(pfca + K) + i * nlen;
        if (narest > 0) {
            coeflen = M + (i == K - 1);
            coeflen = LMMP_MIN(narest, coeflen);
            narest -= coeflen;
            lmmp_fft_extract_coef_(pfca[i], numa, M * i, coeflen, msr.lenw);
            if (i > 0)
                lmmp_fft_shl_coef_(&msr, pfca + i, i * n >> k);
        } else {
            lmmp_zero(pfca[i], nlen);
        }
    }
    lmmp_fft_(&msr, pfca, k, n >> (k - 1));
 
    if (nsqr) {
        pfcb += (nlen + 1) << k;
        for (mp_size_t i = 0; i < K; ++i) {
            mp_size_t coeflen;
            pfcb[i] = (mp_ptr)(pfcb + K) + i * nlen;
            if (nbrest > 0) {
                coeflen = M + (i == K - 1);
                coeflen = LMMP_MIN(nbrest, coeflen);
                nbrest -= coeflen;
                lmmp_fft_extract_coef_(pfcb[i], numb, M * i, coeflen, msr.lenw);
                if (i > 0)
                    lmmp_fft_shl_coef_(&msr, pfcb + i, i * n >> k);
            } else {
                lmmp_zero(pfcb[i], nlen);
            }
        }
        lmmp_fft_(&msr, pfcb, k, n >> (k - 1));
    }
 
    lmmp_mul_fermat_recurse_(&msr, pfca, pfcb, K);
 
    lmmp_ifft_(&msr, pfca, k, n >> (k - 1));
 
    lmmp_mul_fermat_recombine_(&msr, dst, pfca, K, k, n, M, rn);
 
    // 处理模 B^rn+1 的溢出
    if (dst[rn] && !lmmp_zero_q_(dst, rn)) {
        dst[rn] = 0;
        lmmp_dec(dst);
    }
 
    lmmp_fft_memstack_(&msr, 0);
}

引用了 k, LIMB_BITS, LIMB_BYTES, lmmp_debug_assert, lmmp_dec, lmmp_fft_(), lmmp_fft_best_k_(), lmmp_fft_extract_coef_(), lmmp_fft_memstack_(), lmmp_fft_shl_coef_(), lmmp_ifft_(), LMMP_MIN, lmmp_mul_fermat_recombine_(), lmmp_mul_fermat_recurse_(), lmmp_zero, lmmp_zero_q_(), fft_memstack::maxdepth, n , 以及 numb.

被这些函数引用 lmmp_mul_fft_() , 以及 lmmp_mullo_fft_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_mul_fft_()

void lmmp_mul_fft_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

FFT乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

参数

dst	输出结果缓冲区，长度至少为 na+nb
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: ???<=nb<=na, sep(dst,[numa|numb])

返回: 无返回值，结果存储在dst中

在文件 mul_fft.c 第 1095 行定义.

                                                                                           {
    lmmp_param_assert(na > 0 && nb > 0);
    lmmp_param_assert(na >= nb);
    mp_size_t hn = lmmp_fft_next_size_((na + nb + 1) >> 1);
    lmmp_assert(na + nb > hn);
    mp_ptr tp = ALLOC_TYPE(hn + 1, mp_limb_t);
 
    mp_srcptr amodm = numa;
    mp_size_t nam = na;
    if (na > hn) {
        /*
          Z = B^hb - 1
          amodm = a mod Z
         */
        if (lmmp_add_(dst, numa, hn, numa + hn, na - hn))
            lmmp_inc(dst);
        amodm = dst;
        nam = hn;
    }
    lmmp_mul_mersenne_(dst, hn, amodm, nam, numb, nb);
 
    mp_srcptr amodp = numa;
    mp_size_t nap = na;
    if (na > hn) {
        /*
          Z = B^hp - 1
          amodp = a mod Z
         */
        tp[hn] = 0;
        if (lmmp_sub_(tp, numa, hn, numa + hn, na - hn))
            lmmp_inc(tp);
        amodp = tp;
        nap = hn + 1;
    }
    lmmp_mul_fermat_(tp, hn, amodp, nap, numb, nb);
 
    mp_limb_t cy = lmmp_shr1add_nc_(dst, dst, tp, hn, tp[hn]);
    cy <<= LIMB_BITS - 1;
    dst[hn - 1] += cy;
    if (dst[hn - 1] < cy)
        lmmp_inc(dst);
 
    if (na + nb == 2 * hn) {
        cy = tp[hn] + lmmp_sub_n_(dst + hn, dst, tp, hn);
        // cy==1 means [tp,hn+1]!=0, then [dst,hn]!=0
        // cy==2 is impossible since [tp,hn+1] is normalized.
        // so the following dec won't overflow.
        lmmp_dec_1(dst, cy);
    } else {
        cy = lmmp_sub_n_(dst + hn, dst, tp, na + nb - hn);
        cy = tp[hn] + lmmp_sub_nc_(tp + na + nb - hn, dst + na + nb - hn, tp + na + nb - hn, 2 * hn - (na + nb), cy);
        cy = lmmp_sub_1_(dst, dst, na + nb, cy);
    }
    lmmp_free(tp);
}

引用了 ALLOC_TYPE, LIMB_BITS, lmmp_add_(), lmmp_assert, lmmp_dec_1, lmmp_fft_next_size_(), lmmp_free(), lmmp_inc, lmmp_mul_fermat_(), lmmp_mul_mersenne_(), lmmp_param_assert, lmmp_shr1add_nc_(), lmmp_sub_(), lmmp_sub_1_(), lmmp_sub_n_(), lmmp_sub_nc_(), n, numb , 以及 tp.

被这些函数引用 __lmmp_mul_n_(), __lmmp_sqr_(), lmmp_mul_(), lmmp_mul_n_() , 以及 lmmp_sqr_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_mul_fft_unbalance_()

void lmmp_mul_fft_unbalance_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

FFT不平衡乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

参数

dst	输出结果缓冲区，长度至少为 na+nb
hn	FFT模域参数
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: ???<=nb<=na, na>=3*nb, sep(dst,[numa|numb])

返回: 无返回值，结果存储在dst中

被这些函数引用 lmmp_mul_().

这是这个函数的调用关系图:

◆ lmmp_mul_mersenne_()

void lmmp_mul_mersenne_	(	mp_ptr	dst,
		mp_size_t	rn,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

梅森数模乘法 [dst,rn] = [numa,na]*[numb,nb] mod B^rn-1

参数

dst	输出结果缓冲区，长度至少为 rn
rn	模运算的阶数参数，rn = lmmp_fft_next_size_((na + nb + 1) >> 1)
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: eqsep(dst,[numa|numb]), 0<=[numa,na]<B^rn, 0<=[numb,nb]<B^rn, rn = lmmp_fft_next_size_((na+nb+1)>>1)

返回: 无返回值，结果存储在dst中，

在文件 mul_fft.c 第 761 行定义.

                                                                                                              {
    int nsqr = numa != numb || na != nb;  // 判断是否为平方运算
    mp_size_t N = rn * LIMB_BITS;         // 结果总比特数
    mp_size_t k = lmmp_fft_best_k_(rn);   // 最优FFT层数
    mp_size_t K = ((mp_size_t)1) << k;    // FFT块数（2^k）
    // 断言：N必须是K的整数倍
    lmmp_debug_assert(!(N & (K - 1)));
    mp_size_t M = N >> k;     // 每个块的比特数
    mp_size_t n = 2 * M + k;  // 扩展系数长度（梅森数比费马数少2）
 
    // 规整n：必须是LIMB_BITS和K/2的整数倍
    n = (n + LIMB_BITS - 1) & (-LIMB_BITS);
    n = (((n - 1) >> (k - 1)) + 1) << (k - 1);
 
    // 初始化内存栈
    fft_memstack msr;
    msr.maxdepth = -1;
    msr.tempdepth = -1;
    msr.lenw = n / LIMB_BITS;
    mp_size_t nlen = msr.lenw + 1;
 
    msr.temp_coef = (mp_ptr)lmmp_fft_memstack_(&msr, (((nlen + 1) << (k + nsqr)) + nlen) * LIMB_BYTES);
 
    mp_ptr *pfca = (mp_ptr*)(msr.temp_coef + nlen), *pfcb = pfca;
    mp_size_t narest = na * LIMB_BITS, nbrest = nb * LIMB_BITS;
 
    for (mp_size_t i = 0; i < K; ++i) {
        mp_size_t coeflen;
        pfca[i] = (mp_ptr)(pfca + K) + i * nlen;
        if (narest > 0) {
            coeflen = LMMP_MIN(narest, M);
            narest -= coeflen;
            lmmp_fft_extract_coef_(pfca[i], numa, M * i, coeflen, msr.lenw);
        } else {
            lmmp_zero(pfca[i], nlen);
        }
    }
    lmmp_fft_(&msr, pfca, k, n >> (k - 1));
 
    if (nsqr) {
        pfcb += (nlen + 1) << k;
        for (mp_size_t i = 0; i < K; ++i) {
            mp_size_t coeflen;
            pfcb[i] = (mp_ptr)(pfcb + K) + i * nlen;
            if (nbrest > 0) {
                coeflen = LMMP_MIN(nbrest, M);
                nbrest -= coeflen;
                lmmp_fft_extract_coef_(pfcb[i], numb, M * i, coeflen, msr.lenw);
            } else {
                lmmp_zero(pfcb[i], nlen);
            }
        }
        lmmp_fft_(&msr, pfcb, k, n >> (k - 1));
    }
 
    lmmp_mul_fermat_recurse_(&msr, pfca, pfcb, K);
 
    lmmp_ifft_(&msr, pfca, k, n >> (k - 1));
 
    mp_size_t rhead = 0, maxc = 0;
    for (mp_size_t i = 0; i < K; ++i) {
        lmmp_fft_shr_coef_(&msr, pfca + i, k);
        mp_ptr nums = pfca[i];
 
        if (nums[nlen - 1]) {
            lmmp_dec(nums);
            lmmp_debug_assert(nums[nlen - 1] == 1);
            nums[nlen - 1] = 0;
        }
 
        mp_size_t roffset = i * M;
        mp_size_t shl = roffset & (LIMB_BITS - 1);
        roffset /= LIMB_BITS;
 
        if (shl)
            lmmp_shl_(nums, nums, nlen, shl);
 
        if (i == 0) {
            lmmp_copy(dst, nums, nlen);
            rhead = nlen;
        } else if (roffset + nlen <= rn) {
            lmmp_add_(dst + roffset, nums, nlen, dst + roffset, rhead - roffset);
            rhead = roffset + nlen;
        } else {
            maxc += lmmp_add_(dst + roffset, nums, rn - roffset, dst + roffset, rhead - roffset);
            maxc += lmmp_add_(dst, dst, rn, nums + rn - roffset, nlen + roffset - rn);
            rhead = rn;
        }
    }
 
    if (!lmmp_add_1_(dst, dst, rn, 1 + maxc))
        lmmp_dec(dst);
 
    lmmp_fft_memstack_(&msr, 0);
}

引用了 k, LIMB_BITS, LIMB_BYTES, lmmp_add_(), lmmp_add_1_(), lmmp_copy, lmmp_debug_assert, lmmp_dec, lmmp_fft_(), lmmp_fft_best_k_(), lmmp_fft_extract_coef_(), lmmp_fft_memstack_(), lmmp_fft_shr_coef_(), lmmp_ifft_(), LMMP_MIN, lmmp_mul_fermat_recurse_(), lmmp_shl_(), lmmp_zero, fft_memstack::maxdepth, n , 以及 numb.

被这些函数引用 binvert_mulhi_(), lmmp_div_mulinv_(), lmmp_invappr_newton_(), lmmp_invsqrt_newton_(), lmmp_mul_fft_(), lmmp_mulhi_n_() , 以及 lmmp_mullo_fft_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_mul_n_()

void lmmp_mul_n_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n
	)

等长大数乘法操作 [dst,2*n] = [numa,n] * [numb,n]

警告: n>0, sep(dst,[numa|numb])

参数

dst	乘积结果输出指针（需要 2*n 的 limb 长度）
numa	第一个乘数指针
numb	第二个乘数指针
n	limb长度

◆ lmmp_mul_toom22_()

void lmmp_mul_toom22_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

Toom-22乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

参数

dst	输出结果缓冲区，长度至少为 na+nb
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: 4/5<=nb/na<=1, nb>=5, sep(dst,[numa|numb])

返回: 无返回值，结果存储在dst中

被这些函数引用 __lmmp_mul_n_(), lmmp_mul_() , 以及 lmmp_mul_n_().

这是这个函数的调用关系图:

◆ lmmp_mul_toom32_()

void lmmp_mul_toom32_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

Toom-32乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

参数

dst	输出结果缓冲区，长度至少为 na+nb
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: 5/9<=nb/na<=4/5, nb>=12, sep(dst,[numa|numb])

返回: 无返回值，结果存储在dst中

被这些函数引用 lmmp_mul_().

这是这个函数的调用关系图:

◆ lmmp_mul_toom33_()

void lmmp_mul_toom33_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

Toom-33乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

参数

dst	输出结果缓冲区，长度至少为 na+nb
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: 4/5<=nb/na<=1, nb>=26, sep(dst,[numa|numb])

返回: 无返回值，结果存储在dst中

被这些函数引用 __lmmp_mul_n_(), lmmp_mul_() , 以及 lmmp_mul_n_().

这是这个函数的调用关系图:

◆ lmmp_mul_toom42_()

void lmmp_mul_toom42_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

Toom-42乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

参数

dst	输出结果缓冲区，长度至少为 na+nb
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: 1/3<=nb/na<=5/9, nb>=20, sep(dst,[numa|numb])

返回: 无返回值，结果存储在dst中

被这些函数引用 lmmp_mul_().

这是这个函数的调用关系图:

◆ lmmp_mul_toom42_unbalance_()

void lmmp_mul_toom42_unbalance_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

Toom-42不平衡乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

参数

dst	输出结果缓冲区，长度至少为 na+nb
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: na>=3*nb, nb>=20, sep(dst,[numa|numb])

返回: 无返回值，结果存储在dst中

被这些函数引用 lmmp_mul_().

这是这个函数的调用关系图:

◆ lmmp_mul_toom43_()

void lmmp_mul_toom43_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

Toom-43乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

参数

dst	输出结果缓冲区，长度至少为 na+nb
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: 3/5<=nb/na<=4/5, nb>=??, sep(dst,[numa|numb])

返回: 无返回值，结果存储在dst中

被这些函数引用 lmmp_mul_().

这是这个函数的调用关系图:

◆ lmmp_mul_toom44_()

void lmmp_mul_toom44_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

Toom-44乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

参数

dst	输出结果缓冲区，长度至少为 na+nb
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: 4/5<=nb/na<=1, nb>=??, sep(dst,[numa|numb])

返回: 无返回值，结果存储在dst中

被这些函数引用 __lmmp_mul_n_(), lmmp_mul_() , 以及 lmmp_mul_n_().

这是这个函数的调用关系图:

◆ lmmp_mul_toom52_()

void lmmp_mul_toom52_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

Toom-52乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

参数

dst	输出结果缓冲区，长度至少为 na+nb
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: 1/3<=nb/na<=9/20, nb>=??, sep(dst,[numa|numb])

返回: 无返回值，结果存储在dst中

被这些函数引用 lmmp_mul_().

这是这个函数的调用关系图:

◆ lmmp_mul_toom53_()

void lmmp_mul_toom53_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

Toom-53乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

参数

dst	输出结果缓冲区，长度至少为 na+nb
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: 9/20<=nb/na<=3/5, nb>=??, sep(dst,[numa|numb])

返回: 无返回值，结果存储在dst中

被这些函数引用 lmmp_mul_().

这是这个函数的调用关系图:

◆ lmmp_mul_toom62_()

void lmmp_mul_toom62_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

Toom-62乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

参数

dst	输出结果缓冲区，长度至少为 na+nb
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: 1/5<=nb/na<=1/3, nb>=??, sep(dst,[numa|numb])

返回: 无返回值，结果存储在dst中

被这些函数引用 lmmp_mul_().

这是这个函数的调用关系图:

◆ lmmp_mul_toom62_unbalance_()

void lmmp_mul_toom62_unbalance_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

Toom-62不平衡乘法运算 [dst,na+nb] = [numa,na] * [numb,nb]

参数

dst	输出结果缓冲区，长度至少为 na+nb
numa	第一个输入操作数，长度为 na
na	第一个操作数的 limb 长度
numb	第二个输入操作数，长度为 nb
nb	第二个操作数的 limb 长度

警告: na>=5*nb, nb>=??, sep(dst,[numa|numb])

返回: 无返回值，结果存储在dst中

被这些函数引用 lmmp_mul_().

这是这个函数的调用关系图:

◆ lmmp_mulh_()

mp_limb_t lmmp_mulh_	(	mp_limb_t	a,
		mp_limb_t	b
	)

计算两个64位无符号整数相乘的高位结果 (a*b)/B

参数

a	第一个64位无符号整数
b	第二个64位无符号整数

返回: 乘积的高64位结果

在文件 tiny.c 第 91 行定义.

                                               {
#if (defined(__GNUC__) || defined(__clang__)) && defined(__SIZEOF_INT128__)
    __uint128_t t = (__uint128_t)a * (__uint128_t)b;
    return (mp_limb_t)(t >> 64);
#elif defined(_MSC_VER) && (defined(_M_X64) || defined(_M_ARM64))
    return __umulh(a, b);
#else
    uint64_t ah = a >> 32, bh = b >> 32;
    a = (uint32_t)a, b = (uint32_t)b;
    uint64_t r0 = a * b, r1 = a * bh, r2 = ah * b, r3 = ah * bh;
    r3 += (r1 >> 32) + (r2 >> 32);
    r1 = (uint32_t)r1, r2 = (uint32_t)r2;
    r1 += r2;
    r1 += (r0 >> 32);
    return r3 + (r1 >> 32);
#endif
}

引用了 n, r0, r1, r2, r3 , 以及 t.

◆ lmmp_mullh_()

void lmmp_mullh_	(	mp_limb_t	a,
		mp_limb_t	b,
		mp_ptr	dst
	)

计算两个64位无符号整数相乘的128位结果 (a*b)

参数

dst	输出结果缓冲区，存储乘积结果，长度为 2
a	第一个64位无符号整数
b	第二个64位无符号整数

警告: dst 必须指向一个长度为 2 的数组

返回: 无返回值

◆ lmmp_mullo_()

void lmmp_mullo_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n
	)

低位乘法 [dst,n] = [numa,n] * [numb,n] mod B^n

参数

dst	输出结果缓冲区，长度至少为 n
numa	第一个输入操作数，长度为 n
numb	第二个输入操作数，长度为 n
n	limb长度

警告: n>0, sep(dst,[numa|numb]) 特殊情况：当 n >= MULLO_DC_THRESHOLD 时，eqsep(dst,[numa|numb])是允许的

返回: 无返回值，结果存储在dst中，[dst,n]=[numa,n] * [numb,n] mod B^n

◆ lmmp_mullo_dc_()

void lmmp_mullo_dc_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_ptr	tp,
		mp_size_t	n
	)

低位乘法 [dst,n] = [numa,n] * [numb,n] mod B^n

参数

dst	输出结果缓冲区，长度至少为 n
numa	第一个输入操作数，长度为 n
numb	第二个输入操作数，长度为 n
tp	临时缓冲区，长度至少为 2*n
n	limb长度

警告: n>0, sep(dst,[numa|numb],tp)

返回: 无返回值，结果存储在dst中，[dst,n]=[numa,n] * [numb,n] mod B^n

被这些函数引用 lmmp_mullo_n_() , 以及 lmmp_mullo_n_().

这是这个函数的调用关系图:

◆ lmmp_mullo_fft_()

void lmmp_mullo_fft_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n,
		mp_ptr	scratch
	)

低位FFT乘法 [dst,n] = [numa,n] * [numb,n] mod B^n

参数

dst	输出结果缓冲区，长度至少为 n
numa	第一个输入操作数，长度为 n
numb	第二个输入操作数，长度为 n
scratch	临时缓冲区，长度至少为 2*n
n	缓冲区 limb 长度

警告: ???<n, sep(scratch,[numa|numb]), eqsep(dst,scratch)

返回: 无返回值，结果存储在dst中，[dst,n]=[numa,n] * [numb,n] mod B^n

低位FFT乘法 [dst,n] = [numa,n] * [numb,n] mod B^n

This file is part of LAMMP.

LAMMP is free software: you can redistribute it and/or modify it under the terms of the GNU Lesser General Public License (LGPL) as published by the Free Software Foundation; either version 3 of the License, or (at your option) any later version.

This program is distributed WITHOUT ANY WARRANTY.

See https://www.gnu.org/licenses/.

在文件 mullo.c 第 22 行定义.

                                                                                              {
    lmmp_param_assert(n > 0);
    mp_size_t hn = lmmp_fft_next_size_((n + n + 1) >> 1);
    lmmp_assert(n + n > hn);
    mp_ptr tp = ALLOC_TYPE(hn + 1, mp_limb_t);
 
    mp_srcptr amodm = numa;
    mp_size_t nam = n;
    if (n > hn) {
        /*
          Z = B^hb - 1
          amodm = a mod Z
         */
        if (lmmp_add_(scratch, numa, hn, numa + hn, n - hn))
            lmmp_inc(scratch);
        amodm = scratch;
        nam = hn;
    }
    lmmp_mul_mersenne_(scratch, hn, amodm, nam, numb, n);
 
    mp_srcptr amodp = numa;
    mp_size_t nap = n;
    if (n > hn) {
        /*
          Z = B^hp - 1
          amodp = a mod Z
         */
        tp[hn] = 0;
        if (lmmp_sub_(tp, numa, hn, numa + hn, n - hn))
            lmmp_inc(tp);
        amodp = tp;
        nap = hn + 1;
    }
    lmmp_mul_fermat_(tp, hn, amodp, nap, numb, n);
 
    mp_limb_t cy = lmmp_shr1add_nc_(scratch, scratch, tp, hn, tp[hn]);
    cy <<= LIMB_BITS - 1;
    scratch[hn - 1] += cy;
    if (scratch[hn - 1] < cy)
        lmmp_inc(scratch);
 
    if (n == hn) {
        cy = tp[hn] + lmmp_sub_n_(scratch + hn, scratch, tp, hn);
        // cy==1 means [tp,hn+1]!=0, then [dst,hn]!=0
        // cy==2 is impossible since [tp,hn+1] is normalized.
        // so the following dec won't overflow.
        lmmp_dec_1(scratch, cy);
    } else {
        mp_size_t n2 = 2 * n;
        cy = lmmp_sub_n_(scratch + hn, scratch, tp, n2 - hn);
        cy = tp[hn] + lmmp_sub_nc_(tp + n2 - hn, scratch + n2 - hn, tp + n2 - hn, 2 * hn - n2, cy);
        cy = lmmp_sub_1_(scratch, scratch, n2, cy);
    }
    lmmp_free(tp);
    lmmp_copy(dst, scratch, n);
}

引用了 ALLOC_TYPE, LIMB_BITS, lmmp_add_(), lmmp_assert, lmmp_copy, lmmp_dec_1, lmmp_fft_next_size_(), lmmp_free(), lmmp_inc, lmmp_mul_fermat_(), lmmp_mul_mersenne_(), lmmp_param_assert, lmmp_shr1add_nc_(), lmmp_sub_(), lmmp_sub_1_(), lmmp_sub_n_(), lmmp_sub_nc_(), n, numb, scratch , 以及 tp.

被这些函数引用 lmmp_mullo_(), lmmp_mullo_n_(), lmmp_mullo_n_() , 以及 lmmp_sqrlo_n_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_not_()

void lmmp_not_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na
	)

大数按位取反操作 [dst,na] = ~[numa,na] (对每个limb执行按位非操作)

参数

dst	结果输出指针
numa	源操作数指针
na	limb长度

警告: na>0, eqsep(dst,numa)

被这些函数引用 lmmp_binvert_n_dc_(), lmmp_binvert_unbalanced_(), lmmp_fft_shl_coef_(), lmmp_inv_basecase_(), lmmp_invappr_newton_() , 以及 lmmp_invsqrt_newton_().

这是这个函数的调用关系图:

◆ lmmp_shl_()

mp_limb_t lmmp_shl_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_size_t	shr
	)

大数左移操作 [dst,na] = [numa,na]<<shl，dst的低shl位填充0

参数

dst	结果输出指针
numa	源操作数指针
na	limb长度
shl	左移的位数 (0~63)

警告: na>0, 0<=shl<64, eqsep(dst,numa) 允许dst指针地址大于numa（即支持原地长移位操作）

返回: 其最低shl个比特位填充[numa,na]被移出的shl个最高位，其余比特位为0

大数左移操作 [dst,na] = [numa,na]<<shl，dst的低shl位填充0

This file is part of LAMMP.

LAMMP is free software: you can redistribute it and/or modify it under the terms of the GNU Lesser General Public License (LGPL) as published by the Free Software Foundation; either version 3 of the License, or (at your option) any later version.

This program is distributed WITHOUT ANY WARRANTY.

See https://www.gnu.org/licenses/.

在文件 shl.c 第 19 行定义.

                                                                             {
    if (shr == 0) {
        lmmp_copy(dst, numa, na);
        return 0;
    } else {
        const mp_limb_t rshr = LIMB_BITS - shr;
        mp_limb_t high_limb, low_limb;
        mp_limb_t retval;
        numa += na;
        dst += na;
        low_limb = *--numa;
        retval = low_limb >> rshr;
        high_limb = (low_limb << shr);
        while (--na != 0) {
            low_limb = *--numa;
            *--dst = high_limb | (low_limb >> rshr);
            high_limb = (low_limb << shr);
        }
        *--dst = high_limb;
        return retval;
    }
}

引用了 LIMB_BITS, lmmp_copy , 以及 n.

被这些函数引用 lmmp_10pow_1_(), lmmp_12pow_1_(), lmmp_14pow_1_(), lmmp_2factorial_(), lmmp_6pow_1_(), lmmp_arith_seqprod_(), lmmp_bninv_(), lmmp_bninv_appr_newton_(), lmmp_div_(), lmmp_factorial_(), lmmp_fft_shl_coef_(), lmmp_hyperfac_(), lmmp_inv_(), lmmp_mul_fermat_recombine_(), lmmp_mul_mersenne_(), lmmp_mul_mersenne_single_(), lmmp_mul_toom43_(), lmmp_mul_toom44_(), lmmp_mul_toom53_(), lmmp_mul_toom62_(), lmmp_mul_toom62_cache_(), lmmp_mul_toom62_cache_init_(), lmmp_multinomial_(), lmmp_nCr_(), lmmp_nPr_(), lmmp_pow_1_(), lmmp_sqr_toom4_(), lmmp_sqrt_(), lmmp_sqrt_newton_(), lmmp_superfac_(), lmmp_to_str_(), lmmp_to_str_divide_(), lmmp_toom_eval_dgr3_pm2_(), lmmp_toom_eval_pm2_(), lmmp_toom_interp5_(), lmmp_toom_interp6_(), lmmp_toom_interp7_() , 以及 pow_nPr_().

这是这个函数的调用关系图:

◆ lmmp_shl_c_()

mp_limb_t lmmp_shl_c_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_size_t	shl,
		mp_limb_t	c
	)

带进位的大数左移操作 [dst,na] = [numa,na]<<shl，dst的低shl位填充c的低shl位

参数

dst	结果输出指针
numa	源操作数指针
na	limb长度
shl	左移的位数 (0~63)
c	进位值（其高(64-shl)位必须为0）

警告: na>0, 0<=shl<64, eqsep(dst,numa) c的高(64-shl)位必须为0 允许dst指针地址大于numa（即支持原地长移位操作）

返回: 其最低shl个比特位填充[numa,na]被移出的shl个最高位，其余比特位为0

在文件 shl.c 第 42 行定义.

                                                                                            {
    if (shr == 0) {
        lmmp_copy(dst, numa, na);
        return 0;
    } else {
        const mp_limb_t rshr = LIMB_BITS - shr;
        mp_limb_t high_limb, low_limb;
        mp_limb_t retval;
        numa += na;
        dst += na;
        low_limb = *--numa;
        retval = low_limb >> rshr;
        high_limb = (low_limb << shr);
        while (--na != 0) {
            low_limb = *--numa;
            *--dst = high_limb | (low_limb >> rshr);
            high_limb = (low_limb << shr);
        }
        c &= ((mp_limb_t)1 << shr) - 1;
        *--dst = high_limb | c;
        return retval;
    }
}

引用了 c, LIMB_BITS, lmmp_copy , 以及 n.

被这些函数引用 lmmp_fft_bfy_().

这是这个函数的调用关系图:

◆ lmmp_shlnot_()

mp_limb_t lmmp_shlnot_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_size_t	shl
	)

左移后按位取反操作 [dst,na] = ~([numa,na] << shl)，dst的低shl位填充1

参数

dst	结果输出指针
numa	源操作数指针
na	limb长度
shl	左移的位数 (0~63)

警告: na>0, 0<=shl<64, eqsep(dst,numa)

返回: 其最低shl个比特位填充[numa,na]被移出的shl个最高位，其余比特位为0

被这些函数引用 lmmp_fft_shl_coef_() , 以及 lmmp_invsqrt_newton_().

这是这个函数的调用关系图:

◆ lmmp_shr1add_n_()

mp_limb_t lmmp_shr1add_n_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n
	)

加法后右移1位 [dst,n] = ([numa,n] + [numb,n]) >> 1

参数

dst	结果输出指针
numa	第一个加数指针
numb	第二个加数指针
n	limb长度

警告: n>0, eqsep(dst,[numa|numb])

返回: 右移操作产生的进位值 [0|1]

在文件 shr.c 第 62 行定义.

                                                                                   {
    mp_size_t i = 0, c = 0, l = 0;
    mp_limb_t a, b, r;
 
    a = numa[i];
    b = numb[i];
    r = a + c;
    c = (r < c);
    r += b;
    c += (r < b);
    dst[i] = r >> 1;
    l = r & 1;
 
    for (i = 1; i < n; i++) {
        a = numa[i];
        b = numb[i];
        r = a + c;
        c = (r < c);
        r += b;
        c += (r < b);
        dst[i - 1] |= r << (LIMB_BITS - 1);
        dst[i] = r >> 1;
    }
    dst[n - 1] |= c << (LIMB_BITS - 1);
    return l;
}

引用了 c, l, LIMB_BITS, n , 以及 numb.

被这些函数引用 lmmp_mul_toom32_(), lmmp_toom_interp5_(), lmmp_toom_interp6_() , 以及 lmmp_toom_interp7_().

这是这个函数的调用关系图:

◆ lmmp_shr1add_nc_()

mp_limb_t lmmp_shr1add_nc_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n,
		mp_limb_t	c
	)

带进位加法后右移1位 [dst,n] = ([numa,n] + [numb,n] + c) >> 1

参数

dst	结果输出指针
numa	第一个加数指针
numb	第二个加数指针
n	limb长度
c	初始进位值 [0\|1]

警告: n>0, c=[0|1], eqsep(dst,[numa|numb])

返回: 右移操作产生的进位值 [0|1]

在文件 shr.c 第 89 行定义.

                                                                                                 {
    mp_size_t i = 0, l = 0;
    mp_limb_t a, b, r;
 
    a = numa[i];
    b = numb[i];
    r = a + c;
    c = (r < c);
    r += b;
    c += (r < b);
    dst[i] = r >> 1;
    l = r & 1;
 
    for (i = 1; i < n; i++) {
        a = numa[i];
        b = numb[i];
        r = a + c;
        c = (r < c);
        r += b;
        c += (r < b);
        dst[i - 1] |= r << (LIMB_BITS - 1);
        dst[i] = r >> 1;
    }
    dst[n - 1] |= c << (LIMB_BITS - 1);
    return l;
}

引用了 c, l, LIMB_BITS, n , 以及 numb.

被这些函数引用 lmmp_mul_fft_(), lmmp_mul_fft_cache_() , 以及 lmmp_mullo_fft_().

这是这个函数的调用关系图:

◆ lmmp_shr1sub_n_()

mp_limb_t lmmp_shr1sub_n_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n
	)

减法后右移1位 [dst,n] = ([numa,n] - [numb,n]) >> 1

参数

dst	结果输出指针
numa	被减数指针
numb	减数指针
n	操作数的位数（limb数量）

警告: n>0, eqsep(dst,[numa|numb])

返回: 右移操作产生的进位值 (0或1)

在文件 shr.c 第 116 行定义.

                                                                                   {
    mp_size_t i = 0, c = 0, l = 0;
    mp_limb_t a, b, r;
 
    a = numa[i];
    b = numb[i];
    b += c;
    c = (b < c);
    c += (a < b);
    r = a - b;
    dst[i] = r >> 1;
    l = r & 1;
 
    for (i = 1; i < n; i++) {
        a = numa[i];
        b = numb[i];
        b += c;
        c = (b < c);
        c += (a < b);
        r = a - b;
        dst[i - 1] |= r << (LIMB_BITS - 1);
        dst[i] = r >> 1;
    }
    dst[n - 1] |= c << (LIMB_BITS - 1);
    return l;
}

引用了 c, l, LIMB_BITS, n , 以及 numb.

被这些函数引用 lmmp_mul_toom32_(), lmmp_toom_interp5_(), lmmp_toom_interp6_() , 以及 lmmp_toom_interp7_().

这是这个函数的调用关系图:

◆ lmmp_shr1sub_nc_()

mp_limb_t lmmp_shr1sub_nc_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n,
		mp_limb_t	c
	)

带借位减法后右移1位 [dst,n] = ([numa,n] - [numb,n] - c) >> 1

参数

dst	结果输出指针
numa	被减数指针
numb	减数指针
n	limb长度
c	初始借位值 [0\|1]

警告: n>0, c=[0|1], eqsep(dst,[numa|numb])

返回: 右移操作产生的进位值 [0|1]

在文件 shr.c 第 143 行定义.

                                                                                                 {
    mp_size_t i = 0, l = 0;
    mp_limb_t a, b, r;
 
    a = numa[i];
    b = numb[i];
    b += c;
    c = (b < c);
    c += (a < b);
    r = a - b;
    dst[i] = r >> 1;
    l = r & 1;
 
    for (i = 1; i < n; i++) {
        a = numa[i];
        b = numb[i];
        b += c;
        c = (b < c);
        c += (a < b);
        r = a - b;
        dst[i - 1] |= r << (LIMB_BITS - 1);
        dst[i] = r >> 1;
    }
    dst[n - 1] |= c << (LIMB_BITS - 1);
    return l;
}

引用了 c, l, LIMB_BITS, n , 以及 numb.

◆ lmmp_shr_()

mp_limb_t lmmp_shr_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_size_t	shr
	)

大数右移操作 [dst,na] = [numa,na]>>shr，dst的高shr位填充0

参数

dst	结果输出指针
numa	源操作数指针
na	limb长度
shr	右移的位数 (0~63)

警告: na>0, 0<=shr<64, eqsep(dst,numa) 允许dst指针地址小于numa（即支持原地长移位操作）

返回: 其最高shr个比特位填充[numa,na]被移出的shr个最低位，其余比特位为0

大数右移操作 [dst,na] = [numa,na]>>shr，dst的高shr位填充0

This file is part of LAMMP.

LAMMP is free software: you can redistribute it and/or modify it under the terms of the GNU Lesser General Public License (LGPL) as published by the Free Software Foundation; either version 3 of the License, or (at your option) any later version.

This program is distributed WITHOUT ANY WARRANTY.

See https://www.gnu.org/licenses/.

在文件 shr.c 第 19 行定义.

                                                                             {
    if (shr == 0) {
        lmmp_copy(dst, numa, na);
        return 0;
    } else {
        mp_limb_t high_limb, low_limb;
        const mp_size_t rshr = LIMB_BITS - shr;
        mp_limb_t retval;
        high_limb = *numa++;
        retval = (high_limb << rshr);
        low_limb = high_limb >> shr;
        while (--na != 0) {
            high_limb = *numa++;
            *dst++ = low_limb | (high_limb << rshr);
            low_limb = high_limb >> shr;
        }
        *dst = low_limb;
        return retval;
    }
}

引用了 LIMB_BITS, lmmp_copy , 以及 n.

被这些函数引用 lmmp_bninv_(), lmmp_div_(), lmmp_fft_extract_coef_(), lmmp_invsqrt_newton_(), lmmp_sqrt_(), lmmp_sqrt_newton_(), lmmp_to_str_divide_(), lmmp_toom_interp6_() , 以及 lmmp_toom_interp7_().

这是这个函数的调用关系图:

◆ lmmp_shr_c_()

mp_limb_t lmmp_shr_c_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_size_t	shr,
		mp_limb_t	c
	)

带进位的大数右移操作 [dst,na] = [numa,na]>>shr，dst的高shr位填充c的高shr位

参数

dst	结果输出指针
numa	源操作数指针
na	limb长度
shr	右移的位数 (0~63)
c	进位值（其低(64-shr)位必须为0）

警告: na>0, 0<=shr<64, eqsep(dst,numa) c的低(64-shr)位必须为0 允许dst指针地址小于numa（即支持原地长移位操作）

返回: 其最高shr个比特位填充[numa,na]被移出的shr个最低位，其余比特位为0

在文件 shr.c 第 40 行定义.

                                                                                            {
    if (shr == 0) {
        lmmp_copy(dst, numa, na);
        return 0;
    } else {
        mp_limb_t high_limb, low_limb;
        const mp_size_t rshr = LIMB_BITS - shr;
        mp_limb_t retval;
        high_limb = *numa++;
        retval = (high_limb << rshr);
        low_limb = high_limb >> shr;
        while (--na != 0) {
            high_limb = *numa++;
            *dst++ = low_limb | (high_limb << rshr);
            low_limb = high_limb >> shr;
        }
        c &= ~(((mp_limb_t)1 << rshr) - 1);
        *dst = low_limb | c;
        return retval;
    }
}

引用了 c, LIMB_BITS, lmmp_copy , 以及 n.

被这些函数引用 lmmp_ifft_bfy_(), lmmp_inv_() , 以及 lmmp_sqrt_divide_().

这是这个函数的调用关系图:

◆ lmmp_sqr_()

void lmmp_sqr_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na
	)

大数平方操作 [dst,2*na] = [numa,na]^2

警告: na>0, sep(dst,numa)

参数

dst	平方结果输出指针（需要2*na的limb长度）
numa	源操作数指针
na	limb长度

◆ lmmp_sqr_basecase_()

void lmmp_sqr_basecase_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na
	)

基础平方运算 [dst,2*na] = [numa,na]^2

参数

dst	输出结果缓冲区，长度至少为2*na
numa	输入操作数，长度为na
na	输入操作数的 limb 长度

警告: 0<na, sep(dst,numa)

返回: 无返回值，结果存储在dst中

被这些函数引用 __lmmp_sqr_(), lmmp_sqr_(), lmmp_u32_pow_1_() , 以及 lmmp_u64_pow_1_().

这是这个函数的调用关系图:

◆ lmmp_sqr_toom2_()

void lmmp_sqr_toom2_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na
	)

Toom-2平方运算 [dst,2*na] = [numa,na]^2

参数

dst	输出结果缓冲区，长度至少为 2*na
numa	输入操作数，长度为na
na	输入操作数的 limb 长度

警告: ??<na, sep(dst,numa)

返回: 无返回值，结果存储在dst中

被这些函数引用 __lmmp_sqr_() , 以及 lmmp_sqr_().

这是这个函数的调用关系图:

◆ lmmp_sqr_toom3_()

void lmmp_sqr_toom3_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na
	)

Toom-3平方运算 [dst,2*na] = [numa,na]^2

参数

dst	输出结果缓冲区，长度至少为2*na
numa	输入操作数，长度为na
na	输入操作数的单精度数(limb)长度

警告: ??<na, sep(dst,numa)

返回: 无返回值，结果存储在dst中

被这些函数引用 __lmmp_sqr_() , 以及 lmmp_sqr_().

这是这个函数的调用关系图:

◆ lmmp_sqr_toom4_()

void lmmp_sqr_toom4_	(	mp_ptr	pp,
		mp_srcptr	ap,
		mp_size_t	an
	)

Toom-4平方运算 [dst,2*na] = [numa,na]^2

参数

dst	输出结果缓冲区，长度至少为2*na
numa	输入操作数，长度为na
na	输入操作数的单精度数(limb)长度

警告: ??<na, sep(dst,numa)

返回: 无返回值，结果存储在dst中

被这些函数引用 __lmmp_sqr_() , 以及 lmmp_sqr_().

这是这个函数的调用关系图:

◆ lmmp_sqrlo_dc_()

void lmmp_sqrlo_dc_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_ptr	tp,
		mp_size_t	n
	)

低位平方 [dst,n] = [numa,n]^2 mod B^n

参数

dst	输出结果缓冲区，长度至少为 n
numa	第一个输入操作数，长度为 n
tp	临时缓冲区，长度至少为 2*n
n	limb长度

警告: n>0, sep(dst,numa,tp)

返回: 无返回值，结果存储在dst中，[dst,n]=[numa,n]^2 mod B^n

被这些函数引用 lmmp_sqrlo_n_().

这是这个函数的调用关系图:

◆ lmmp_sqrt_()

void lmmp_sqrt_	(	mp_ptr	dsts,
		mp_ptr	dstr,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_size_t	nf
	)

大数平方根和取余操作

注解: 如果dstr不为NULL: [dsts,nf+na/2+1], [dstr,nf+na/2+1] = sqrtrem([numa,na]*B^(2*nf)) 也即 [numa,na] × B^(2×nf) = [dsts,nf+na/2+1]^2 + [dstr,nf+na/2+1] 且 0 <= [dstr,nf+na/2+1] < 2 * [dsts,nf+na/2+1] + 1 如果dstr为NULL: [dsts,nf+na/2+1] = [round|floor](sqrt([numa,na]*B^(2*nf)))

警告: na>0, numa[na-1]!=0, eqsep(dsts,numa), eqsep(dstr,numa)

参数

dsts	平方根结果输出指针
dstr	余数结果输出指针（NULL表示不计算余数）
numa	源操作数指针
na	操作数的 limb 长度
nf	精度因子

在文件 sqrt.c 第 333 行定义.

                                                                                      {
    lmmp_debug_assert(na > 0);
    lmmp_debug_assert(numa[na - 1] > 0);
    mp_limb_t high = numa[na - 1];
    int nsh = lmmp_leading_zeros_(high) / 2;
    mp_size_t nl = na + 2 * nf;
    if (nl == 1) {
        mp_limb_t srt;
        lmmp_sqrt_1_(&srt, high << nsh * 2);
        srt >>= nsh;
        dsts[0] = srt;
        if (dstr)
            dstr[0] = high - srt * srt;
    } else if (!dstr && nf >= 10 * na + SQRT_NEWTON_THRESHOLD) {
        lmmp_sqrt_newton_(dsts, numa, na, nf);
    } else {
        TEMP_DECL;
        mp_limb_t ns = (nl + 1) / 2;
        mp_ptr numa2 = TALLOC_TYPE(2 * ns, mp_limb_t);
        if (nf)
            lmmp_zero(numa2, 2 * nf);
        if (nsh)
            lmmp_shl_(numa2 + 2 * ns - na, numa, na, nsh * 2);
        else
            lmmp_copy(numa2 + 2 * ns - na, numa, na);
        if (nl & 1) {
            numa2[2 * nf] = 0;
            nsh += LIMB_BITS / 2;
        } else {
            dsts[ns] = 0;
        }
        mp_limb_t rh = lmmp_sqrt_divide_(dsts, numa2, ns, dstr ? 0 : nsh);
        if (nsh) {
            if (dstr) {
                mp_limb_t ds = dsts[0] & (((mp_limb_t)1 << nsh) - 1);
                rh += lmmp_addmul_1_(numa2, dsts, ns, 2 * ds);
                mp_limb_t b = lmmp_submul_1_(numa2, &ds, 1, ds);
                if (ns == 1)
                    rh -= b;
                else
                    rh -= lmmp_sub_1_(numa2 + 1, numa2 + 1, ns - 1, b);
            }
            lmmp_shr_(dsts, dsts, ns, nsh);
        }
        if (dstr) {
            numa2[ns] = rh;
            nsh *= 2;
            if (nsh >= LIMB_BITS) {
                nsh -= LIMB_BITS;
                ++numa2;
            } else
                ++ns;
            if (nsh)
                lmmp_shr_(dstr, numa2, ns, nsh);
            else
                lmmp_copy(dstr, numa2, ns);
        }
 
        TEMP_FREE;
    }
}

引用了 LIMB_BITS, lmmp_addmul_1_(), lmmp_copy, lmmp_debug_assert, lmmp_leading_zeros_, lmmp_shl_(), lmmp_shr_(), lmmp_sqrt_1_(), lmmp_sqrt_divide_(), lmmp_sqrt_newton_(), lmmp_sub_1_(), lmmp_submul_1_(), lmmp_zero, n, SQRT_NEWTON_THRESHOLD, TALLOC_TYPE, TEMP_DECL , 以及 TEMP_FREE.

函数调用图:

◆ lmmp_sub_()

static mp_limb_t lmmp_sub_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_srcptr	numb,
		mp_size_t	nb
	)

inlinestatic

大数减法静态内联函数 [dst,na]=[numa,na]-[numb,nb]

参数

dst	输出结果缓冲区，存储numa - numb
numa	被减数，长度为na
na	被减数的 limb 长度
numb	减数，长度为nb
nb	减数的 limb 长度

返回: 借位标志（1表示有借位，0表示无借位）

警告: 0<nb<=na, eqsep(dst,[numa|numb])

在文件 lmmpn.h 第 1064 行定义.

                                                                                                    {
    LMMP_AORS_(lmmp_sub_n_, ((dst[nb++] = _x_ - 1), _x_ == 0));
}

引用了 LMMP_AORS_, lmmp_sub_n_() , 以及 n.

被这些函数引用 lmmp_add_signed_(), lmmp_lehmer_mul_(), lmmp_mul_fermat_recombine_(), lmmp_mul_fft_(), lmmp_mul_fft_cache_(), lmmp_mul_toom22_(), lmmp_mul_toom32_(), lmmp_mul_toom52_(), lmmp_mul_toom62_(), lmmp_mul_toom62_cache_init_(), lmmp_mulhi_n_(), lmmp_mullo_fft_() , 以及 lmmp_toom_interp7_().

函数调用图:

这是这个函数的调用关系图:

◆ lmmp_sub_1_()

static mp_limb_t lmmp_sub_1_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		mp_limb_t	x
	)

inlinestatic

大数减单精度数静态内联函数 [dst,na]=[numa,na]-x

参数

dst	输出结果缓冲区，存储numa - x
numa	被减数，长度为na
na	被减数的 limb 长度
x	减数（单个 limb ）

返回: 借位标志（1表示有借位，0表示无借位）

警告: na>0, eqsep(dst,numa)

在文件 lmmpn.h 第 1114 行定义.

1114{ LMMP_AORS_1_(-, LMMP_SUBCB_); }

LMMP_SUBCB_

#define LMMP_SUBCB_(r, x, y)

Definition lmmpn.h:1092

引用了 LMMP_AORS_1_ , 以及 LMMP_SUBCB_.

被这些函数引用 lmmp_div_divide_n_(), lmmp_div_mulinv_(), lmmp_div_s_(), lmmp_mul_fft_(), lmmp_mul_fft_cache_(), lmmp_mul_toom32_(), lmmp_mul_toom42_(), lmmp_mul_toom42_cache_init_(), lmmp_mullo_fft_(), lmmp_sqrt_() , 以及 lmmp_sqrt_divide_().

这是这个函数的调用关系图:

◆ lmmp_sub_n_()

mp_limb_t lmmp_sub_n_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n
	)

无借位的n位减法 [dst,n] = [numa,n] - [numb,n]

参数

dst	结果输出指针
numa	被减数指针
numb	减数指针
n	limb长度

警告: n>0, eqsep(dst,[numa|numb])

返回: 运算后的最终借位值 [0|1]

在文件 sub_n.c 第 80 行定义.

                                                                               {
    mp_size_t i = 0;
    mp_limb_t cy = 0;
 
    for (; i + 4 <= n; i += 4) {
        mp_limb_t a0, b0, r0;
        mp_limb_t a1, b1, r1;
        mp_limb_t a2, b2, r2;
        mp_limb_t a3, b3, r3;
 
        a0 = numa[i + 0];
        b0 = numb[i + 0];
 
        a1 = numa[i + 1];
        b1 = numb[i + 1];
 
        a2 = numa[i + 2];
        b2 = numb[i + 2];
 
        a3 = numa[i + 3];
        b3 = numb[i + 3];
 
        b0 += cy;
        cy = (b0 < cy);
        cy += (a0 < b0);
        r0 = a0 - b0;
 
        b1 += cy;
        cy = (b1 < cy);
        cy += (a1 < b1);
        r1 = a1 - b1;
 
        b2 += cy;
        cy = (b2 < cy);
        cy += (a2 < b2);
        r2 = a2 - b2;
 
        b3 += cy;
        cy = (b3 < cy);
        cy += (a3 < b3);
        r3 = a3 - b3;
 
        dst[i + 0] = r0;
        dst[i + 1] = r1;
        dst[i + 2] = r2;
        dst[i + 3] = r3;
    }
 
    for (; i < n; i++) {
        mp_limb_t a, b;
        a = numa[i];
        b = numb[i];
        b += cy;
        cy = (b < cy);
        cy += (a < b);
        dst[i] = a - b;
    }
 
    return cy;
}

引用了 a0, a1, a2, a3, b0, b1, b2, b3, n, numb, r0, r1, r2 , 以及 r3.

被这些函数引用 lmmp_bninv_appr_newton_(), lmmp_div_(), lmmp_div_basecase_(), lmmp_div_divide_n_(), lmmp_div_mulinv_(), lmmp_div_s_(), lmmp_divexact_divide_(), lmmp_divexact_unbalanced_(), lmmp_invappr_newton_(), lmmp_mul_fermat_recurse_(), lmmp_mul_fft_(), lmmp_mul_fft_cache_(), lmmp_mul_toom22_(), lmmp_mul_toom32_(), lmmp_mul_toom52_(), lmmp_mul_toom62_(), lmmp_mul_toom62_cache_init_(), lmmp_mullo_fft_(), lmmp_sqr_toom2_(), lmmp_sqrt_divide_(), lmmp_sub_(), lmmp_toom_interp5_(), lmmp_toom_interp6_() , 以及 lmmp_toom_interp7_().

这是这个函数的调用关系图:

◆ lmmp_sub_nc_()

mp_limb_t lmmp_sub_nc_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n,
		mp_limb_t	c
	)

带借位的n位减法 [dst,n] = [numa,n] - [numb,n] - c

参数

dst	结果输出指针
numa	被减数指针
numb	减数指针
n	limb长度
c	初始借位值 [0\|1]

警告: c=[0|1], n>0, eqsep(dst,[numa|numb])

返回: 运算后的最终借位值 [0|1]

带借位的n位减法 [dst,n] = [numa,n] - [numb,n] - c

This file is part of LAMMP.

LAMMP is free software: you can redistribute it and/or modify it under the terms of the GNU Lesser General Public License (LGPL) as published by the Free Software Foundation; either version 3 of the License, or (at your option) any later version.

This program is distributed WITHOUT ANY WARRANTY.

See https://www.gnu.org/licenses/.

在文件 sub_n.c 第 19 行定义.

                                                                                             {
    mp_size_t i = 0;
    mp_limb_t cy = c;
 
    for (; i + 4 <= n; i += 4) {
        mp_limb_t a0, b0, r0;
        mp_limb_t a1, b1, r1;
        mp_limb_t a2, b2, r2;
        mp_limb_t a3, b3, r3;
 
        a0 = numa[i + 0];
        b0 = numb[i + 0];
 
        a1 = numa[i + 1];
        b1 = numb[i + 1];
 
        a2 = numa[i + 2];
        b2 = numb[i + 2];
 
        a3 = numa[i + 3];
        b3 = numb[i + 3];
 
        b0 += cy;
        cy = (b0 < cy);
        cy += (a0 < b0);
        r0 = a0 - b0;
 
        b1 += cy;
        cy = (b1 < cy);
        cy += (a1 < b1);
        r1 = a1 - b1;
 
        b2 += cy;
        cy = (b2 < cy);
        cy += (a2 < b2);
        r2 = a2 - b2;
 
        b3 += cy;
        cy = (b3 < cy);
        cy += (a3 < b3);
        r3 = a3 - b3;
 
        dst[i + 0] = r0;
        dst[i + 1] = r1;
        dst[i + 2] = r2;
        dst[i + 3] = r3;
    }
 
    for (; i < n; i++) {
        mp_limb_t a, b;
        a = numa[i];
        b = numb[i];
        b += cy;
        cy = (b < cy);
        cy += (a < b);
        dst[i] = a - b;
    }
 
    return cy;
}

引用了 a0, a1, a2, a3, b0, b1, b2, b3, c, n, numb, r0, r1, r2 , 以及 r3.

被这些函数引用 lmmp_add_n_sub_n_(), lmmp_div_(), lmmp_div_mulinv_(), lmmp_fft_bfy_(), lmmp_ifft_bfy_(), lmmp_invappr_newton_(), lmmp_mul_fft_(), lmmp_mul_fft_cache_() , 以及 lmmp_mullo_fft_().

这是这个函数的调用关系图:

◆ lmmp_submul_1_()

mp_limb_t lmmp_submul_1_	(	mp_ptr	numa,
		mp_srcptr	numb,
		mp_size_t	n,
		mp_limb_t	b
	)

大数乘以单limb并累减操作 [numa,n] -= [numb,n] * b

参数

numa	被减数指针（结果也存储在此）
numb	乘数指针
n	limb长度
b	乘数

警告: n>0, eqsep(numa,numb))

返回: 运算后的借位limb值

被这些函数引用 lmmp_div_(), lmmp_div_basecase_(), lmmp_divexact_basecase_(), lmmp_sqrt_() , 以及 lmmp_toom_interp7_().

这是这个函数的调用关系图:

◆ lmmp_subshl1_n_()

mp_limb_t lmmp_subshl1_n_	(	mp_ptr	dst,
		mp_srcptr	numa,
		mp_srcptr	numb,
		mp_size_t	n
	)

减法结合左移1位操作 [dst,n] = [numa,n] - ([numb,n] << 1)

参数

dst	结果输出指针
numa	被减数指针
numb	减数指针（先左移1位）
n	limb长度

警告: n>0, eqsep(dst,[numa|numb])

返回: 运算后的借位值 [0|1|2]

在文件 shl.c 第 83 行定义.

                                                                                   {
    mp_size_t i, c = 0, mb = 0;
 
    for (i = 0; i < n; i++) {
        mp_limb_t a, b;
        a = numa[i];
        b = (numb[i] << 1) + mb;
        mb = numb[i] >> (LIMB_BITS - 1);
        b += c;
        c = (b < c);
        c += (a < b);
        dst[i] = a - b;
    }
    return c + mb;
}

引用了 c, LIMB_BITS, n , 以及 numb.

◆ lmmp_tailing_zeros_()

int lmmp_tailing_zeros_ ( mp_limb_t x )

计算一个单精度数(limb)中末尾零的个数

参数

x	输入的64位无符号整数

返回: 末尾零的位数（范围：0~64）

在文件 tiny.c 第 71 行定义.

                                     {
    if (x == 0) return 64;
#ifdef __GNUC__
    return __builtin_ctzll(x);
#elif defined(_MSC_VER) && (defined(_M_X64) || defined(_M_ARM64))
    unsigned long index;
    _BitScanForward64(&index, x);
    return (int)index;
#else
    int n = 0;
    if ((x & 0x00000000FFFFFFFF) == 0) { n += 32; x >>= 32; }
    if ((x & 0x000000000000FFFF) == 0) { n += 16; x >>= 16; }
    if ((x & 0x00000000000000FF) == 0) { n += 8;  x >>= 8; }
    if ((x & 0x000000000000000F) == 0) { n += 4;  x >>= 4; }
    if ((x & 0x0000000000000003) == 0) { n += 2;  x >>= 2; }
    if ((x & 0x0000000000000001) == 0) { n += 1;  x >>= 1; }
    return n;
#endif
}

引用了 n.

◆ lmmp_to_str_()

mp_size_t lmmp_to_str_	(	mp_byte_t *	dst,
		mp_srcptr	numa,
		mp_size_t	na,
		int	base
	)

大数转字符串操作 [numa,na,B] to [dst,return value,base]

警告: na>=0, 2<=base<=256

参数

dst	字符串结果输出指针
numa	大数源指针
na	大数的 limb 长度
base	目标字符串的进制基数

返回: 转换后的字符串长度

在文件 to_str.c 第 175 行定义.

                                                                               {
    lmmp_param_assert(base >= 2 && base <= 256);
    do {
        if (na == 0)
            return 0;
    } while (numa[--na] == 0);
    ++na;
 
    mp_size_t digits;
    if (LMMP_POW2_Q(base)) {
        mp_limb_t curlimb = numa[na - 1];
        int cnt = lmmp_bases_table[base - 2].large_base;
        int bitsh = lmmp_limb_bits_(curlimb);
        int mask = (1 << cnt) - 1;
        mp_size_t bits = bitsh + LIMB_BITS * (na - 1);
        digits = (bits - 1) / cnt + 1;
        dst += digits;
        int bitpos = digits * cnt - LIMB_BITS * (na - 1);
 
        do {
            while ((bitpos -= cnt) >= 0) {
                *--dst = curlimb >> bitpos & mask;
            }
            if (--na == 0)
                break;
            mp_limb_t prevlimb = curlimb << -bitpos;
            curlimb = numa[na - 1];
            bitpos += LIMB_BITS;
            *--dst = (prevlimb | curlimb >> bitpos) & mask;
        } while (1);
    } else if (na < TO_STR_BASEPOW_THRESHOLD) {
        digits = lmmp_to_str_basecase_(dst, numa, na, base);
    } else {
        TEMP_DECL;
        mp_basepow_t powers[LIMB_BITS];
        mp_size_t exps[LIMB_BITS];
        mp_limb_t lbase = lmmp_bases_table[base - 2].large_base;
        mp_size_t digitspl = lmmp_bases_table[base - 2].digits_in_limb;
        mp_size_t bexp = (lmmp_to_str_len_(numa, na, base) - 1) / digitspl + 1;
        mp_size_t tzbit = lmmp_tailing_zeros_(lbase);
        // numa 的拷贝空间，多一个 limb 预留规整化移位所需
        mp_size_t alloc_size = na + 1;
        mp_limb_t cy;
        mp_ptr tp;
 
        int cpow = 0;
 
        do {
            bexp = (bexp + 1) >> 1;
            exps[cpow] = bexp;
            ++cpow;
 
            // we will calculate lbase^(bexp-1) first, and trim it s. t.
            // it contains at most 2 tailing 0 limb, then multiply it by lbase,
            // so we need npow limbs to store lbase^bexp
            mp_size_t npow = lmmp_from_str_len_(0, (bexp - 1) * digitspl + 1, base) + 1;
 
            // space needed for quotients in recursive calls,
            // quotients are smaller than lbase^bexp
            alloc_size += npow + 1;
 
            if (tzbit) {
                mp_size_t tzlimb = tzbit * (bexp - 1) / LIMB_BITS;
                if (tzlimb >= 2)
                    npow -= tzlimb - 2;
            }
 
            // space needed for a trimmed npow-limb lbase^bexp and its inverse
            alloc_size += npow * 2;
        } while (bexp > 1);
 
        tp = BALLOC_TYPE(alloc_size, mp_limb_t);
 
        for (int i = 0; i < 2; ++i) {
            tp[0] = lbase;
            powers[i].p = tp;
            powers[i].np = 1;
            tp += i + 1;
            powers[i].zeros = 0;
            powers[i].digits = digitspl * (i + 1);
            powers[i].base = base;
        }
 
        mp_ptr p = powers[1].p;
        mp_size_t zeros = 0, np = 1;
        bexp = 1;
        for (int i = 2; i < cpow; ++i) {
            lmmp_sqr_(tp, p, np);
            bexp *= 2;
            np *= 2;
            np -= tp[np - 1] == 0;
            if (bexp + 1 < exps[cpow - 1 - i]) {
                cy = lmmp_mul_1_(tp, tp, np, lbase);
                tp[np] = cy;
                np += cy != 0;
                ++bexp;
            }
            zeros *= 2;
            while (tp[0] == 0) {
                // at most 2 tailing 0 limb here
                ++zeros;
                ++tp;
                --np;
            }
            p = tp;
            powers[i].p = p;
            powers[i].np = np;
            powers[i].zeros = zeros;
            powers[i].digits = digitspl * (bexp + 1);
            powers[i].base = base;
            tp += np + 1;
        }
 
        for (int i = 1; i < cpow; ++i) {
            p = powers[i].p;
            np = powers[i].np;
            cy = lmmp_mul_1_(p, p, np, lbase);
            p[np] = cy;
            np += cy != 0;
            if (p[0] == 0) {
                ++powers[i].zeros;
                ++p;
                --np;
            }
 
            powers[i].p = p;
            powers[i].np = np;
 
            // Note: all powers except powers[0] are normalized
            // ASSERT: powers[0] will be never used in lmmp_to_str_divide_
            // i.e. TO_STR_DIVIDE_THRESHOLD >= 3
            int cnt = lmmp_leading_zeros_(p[np - 1]);
            if ((powers[i].norm_cnt = cnt))
                lmmp_shl_(p, p, np, cnt);
 
            if (np < DIV_MULINV_L_THRESHOLD) {
                // use divs, no need to compute inv
                powers[i].invp = 0;
                powers[i].ni = 0;
            } else {
                // pre-compute inverse
                mp_size_t ni = lmmp_div_inv_size_(np + powers[i].zeros, np);
                lmmp_inv_prediv_(tp, p, np, ni);
                powers[i].invp = tp;
                powers[i].ni = ni;
                tp += ni;
            }
        }
 
        lmmp_copy(tp, numa, na);
        digits = lmmp_to_str_divide_(dst, tp, na, powers + cpow - 1, tp + na + 1);
 
        TEMP_FREE;
    }
 
    return digits;
}

引用了 BALLOC_TYPE, mp_base_t::digits_in_limb, DIV_MULINV_L_THRESHOLD, mp_base_t::large_base, LIMB_BITS, lmmp_bases_table, lmmp_copy, lmmp_div_inv_size_(), lmmp_from_str_len_(), lmmp_inv_prediv_(), lmmp_leading_zeros_, lmmp_limb_bits_, lmmp_mul_1_(), lmmp_param_assert, LMMP_POW2_Q, lmmp_shl_(), lmmp_sqr_, lmmp_tailing_zeros_, lmmp_to_str_basecase_(), lmmp_to_str_divide_(), lmmp_to_str_len_(), n, TEMP_DECL, TEMP_FREE, TO_STR_BASEPOW_THRESHOLD , 以及 tp.

函数调用图:

◆ lmmp_to_str_len_()

mp_size_t lmmp_to_str_len_	(	mp_srcptr	numa,
		mp_size_t	na,
		int	base
	)

计算大数转换为字符串，字符串需要的缓冲区长度

参数

numa	输入大数，长度为na
na	大数的 limb 长度
base	目标基数（2~256）

返回: 大数在指定基数下的位数

警告: na>=0, 2<=base<=256

注解

将会忽略numa的前导零，

if (numa!=NULL) 返回的长度可能会多分配一个字符空间
if (numa==NULL) 返回na个limb长度的数的最大可能字符长度（最坏情况）

计算大数转换为字符串，字符串需要的缓冲区长度

This file is part of LAMMP.

LAMMP is free software: you can redistribute it and/or modify it under the terms of the GNU Lesser General Public License (LGPL) as published by the Free Software Foundation; either version 3 of the License, or (at your option) any later version.

This program is distributed WITHOUT ANY WARRANTY.

See https://www.gnu.org/licenses/.

在文件 to_str.c 第 23 行定义.

                                                                   {
    lmmp_param_assert(base >= 2 && base <= 256);
    int mslbits = 0;
    if (numa) {
        do {
            if (na == 0)
                return 1;
        } while (numa[--na] == 0);
        mslbits = lmmp_limb_bits_(numa[na]);
    }
    return lmmp_mulh_(na * LIMB_BITS + mslbits, lmmp_bases_table[base - 2].inv_lg_base) + 1;
}

引用了 LIMB_BITS, lmmp_bases_table, lmmp_limb_bits_, lmmp_mulh_, lmmp_param_assert , 以及 n.

被这些函数引用 lmmp_to_str_().

这是这个函数的调用关系图:

◆ lmmp_zero_q_()

static int lmmp_zero_q_	(	mp_srcptr	p,
		mp_size_t	n
	)

inlinestatic

大数判零函数（内联）

参数

p	指向大数起始位置的指针
n	大数的单精度数(limb)长度

返回: 1(全零) / 0(非零)

警告: n>0

注解: 从最高位开始检查，只要有非零位则返回0

在文件 lmmpn.h 第 1019 行定义.

                                                   {
    do {
        if (p[--n] != 0)
            return 0;
    } while (n != 0);
    return 1;
}

引用了 n.

被这些函数引用 lmmp_invsqrt_newton_(), lmmp_mul_fermat_(), lmmp_mul_fermat_single_(), lmmp_mul_toom22_(), lmmp_mul_toom32_(), lmmp_mul_toom42_(), lmmp_mul_toom42_cache_init_(), lmmp_mul_toom52_(), lmmp_mul_toom62_(), lmmp_mul_toom62_cache_init_() , 以及 try_div_().

这是这个函数的调用关系图: