d3/d50/mul__toom__interp7_8c_source.html

/**

 *  Copyright (C) 2026 HJimmyK(Jericho Knox)

 *

 *  This file is part of LAMMP.

 *

 *  LAMMP is free software: you can redistribute it and/or modify it under

 *  the terms of the GNU Lesser General Public License (LGPL) as published

 *   by the Free Software Foundation; either version 3 of the License, or

 *  (at your option) any later version.

 *

 *  This program is distributed WITHOUT ANY WARRANTY.

 *

 *  See <https://www.gnu.org/licenses/>.

 */


#include "../../../include/lammp/impl/divexact.h"

#include "../../../include/lammp/impl/toom_interp.h"


/*

    syms x integer

    a = 12*x^3 + 22*x^2 + 32*x + 42;

    b = 56*x^3 + 62*x^2 + 7*x + 82;

    c_true = a*b;


    w0 = subs(a,0)*subs(b,0);

    w1 = subs(a,-2)*subs(b,-2);

    w2 = subs(a,1)*subs(b,1);

    w3 = subs(a,-1)*subs(b,-1);

    w4 = subs(a,2)*subs(b,2);

    w5 = 64*subs(a,1/2)*subs(b,1/2);

    w6 = 12*56;


    w5 = w5 + w4;

    w1 = (w4 - w1)/2;

    w4 = w4 - w0;

    w4 = (w4 - w1)/4 - w6*16;

    w3 = (w2 - w3)/2;

    w2 = w2 - w3;

    w5 = w5 - 65*w2;

    w2 = w2 - w6 - w0;

    w5 = (w5 + 45*w2)/2;

    w4 = (w4 - w2)/3;

    w2 = w2 - w4;

    w1 = w5 - w1;

    w5 = (w5 - 8*w3)/9;

    w3 = w3 - w5;

    w1 = (w1/15 + w5)/2;

    w5 = w5 - w1;


    c0 = w0; c1 = w1; c2 = w2; c3 = w3; c4 = w4; c5 = w5; c6 = w6;

    c_calc = c6*x^6 + c5*x^5 + c4*x^4 + c3*x^3 + c2*x^2 + c1*x + c0;

*/


void lmmp_toom_interp7_(

              mp_ptr   dst,

           mp_size_t     n,

    enum toom7_flags flags,

              mp_ptr    w1,

              mp_ptr    w3,

              mp_ptr    w4,

              mp_ptr    w5,

           mp_size_t   w6n,

              mp_ptr    tp

) {

    lmmp_param_assert(w6n > 0);

    lmmp_param_assert(w6n <= 2 * n);

    mp_size_t m;

    mp_limb_t cy;


    m = 2 * n + 1;

#define w0 dst

#define w2 (dst + 2 * n)

#define w6 (dst + 6 * n)


    lmmp_add_n_(w5, w5, w4, m);

    if (flags & toom7_w1_neg) {

        lmmp_shr1add_n_(w1, w1, w4, m);

    } else {

        lmmp_shr1sub_n_(w1, w4, w1, m);

    }

    lmmp_sub_(w4, w4, m, w0, 2 * n);

    lmmp_sub_n_(w4, w4, w1, m);


    lmmp_debug_assert(!(w4[0] & 3));


    lmmp_shr_(w4, w4, m, 2); /* w4>=0 */


    tp[w6n] = lmmp_shl_(tp, w6, w6n, 4);

    lmmp_sub_(w4, w4, m, tp, w6n + 1);


    if (flags & toom7_w3_neg) {

        lmmp_shr1add_n_(w3, w3, w2, m);

    } else {

        lmmp_shr1sub_n_(w3, w2, w3, m);

    }


    lmmp_sub_n_(w2, w2, w3, m);


    lmmp_submul_1_(w5, w2, m, 65);

    lmmp_sub_(w2, w2, m, w6, w6n);

    lmmp_sub_(w2, w2, m, w0, 2 * n);


    lmmp_addmul_1_(w5, w2, m, 45);

    lmmp_debug_assert(!(w5[0] & 1));

    lmmp_shr_(w5, w5, m, 1);

    lmmp_sub_n_(w4, w4, w2, m);


    lmmp_divexact_by3_(w4, w4, m);

    lmmp_sub_n_(w2, w2, w4, m);


    lmmp_sub_n_(w1, w5, w1, m);

    lmmp_shl_(tp, w3, m, 3);

    lmmp_sub_n_(w5, w5, tp, m);

    lmmp_divexact_by9_(w5, w5, m);

    lmmp_sub_n_(w3, w3, w5, m);


    lmmp_divexact_by15_(w1, w1, m);

    lmmp_shr1add_n_(w1, w1, w5, m);

    w1[m - 1] &= LIMB_MAX >> 1;


    lmmp_sub_n_(w5, w5, w1, m);


    /* These bounds are valid for the 4x4 polynomial product of toom44,

     * and they are conservative for toom53 and toom62. */

    lmmp_debug_assert(w1[2 * n] < 2);

    lmmp_debug_assert(w2[2 * n] < 3);

    lmmp_debug_assert(w3[2 * n] < 4);

    lmmp_debug_assert(w4[2 * n] < 3);

    lmmp_debug_assert(w5[2 * n] < 2);


    cy = lmmp_add_n_(dst + n, dst + n, w1, m);

    lmmp_inc_1(w2 + n + 1, cy);

    cy = lmmp_add_n_(dst + 3 * n, dst + 3 * n, w3, n);

    lmmp_inc_1(w3 + n, w2[2 * n] + cy);

    cy = lmmp_add_n_(dst + 4 * n, w3 + n, w4, n);

    lmmp_inc_1(w4 + n, w3[2 * n] + cy);

    cy = lmmp_add_n_(dst + 5 * n, w4 + n, w5, n);

    lmmp_inc_1(w5 + n, w4[2 * n] + cy);

    if (w6n > n + 1) {

        cy = lmmp_add_n_(dst + 6 * n, dst + 6 * n, w5 + n, n + 1);

        lmmp_inc_1(dst + 7 * n + 1, cy);

    } else {

        lmmp_assert(lmmp_add_n_(dst + 6 * n, dst + 6 * n, w5 + n, w6n));

    }

}


lmmp_divexact_by15_
static void lmmp_divexact_by15_(mp_ptr dst, mp_srcptr numa, mp_size_t na)
精确除以15（[dst,na] = [numa,na] / 15）
Definition divexact.h:82

lmmp_divexact_by9_
static void lmmp_divexact_by9_(mp_ptr dst, mp_srcptr numa, mp_size_t na)
精确除以9（[dst,na] = [numa,na] / 9）
Definition divexact.h:56

lmmp_divexact_by3_
static void lmmp_divexact_by3_(mp_ptr dst, mp_srcptr numa, mp_size_t na)
精确除以3（[dst,na] = [numa,na] / 3）
Definition divexact.h:30

mp_ptr
mp_limb_t * mp_ptr
Definition lmmp.h:80

mp_size_t
uint64_t mp_size_t
Definition lmmp.h:77

lmmp_debug_assert
#define lmmp_debug_assert(x)
Definition lmmp.h:412

LIMB_MAX
#define LIMB_MAX
Definition lmmp.h:89

mp_limb_t
uint64_t mp_limb_t
Definition lmmp.h:76

lmmp_assert
#define lmmp_assert(x)
Definition lmmp.h:395

lmmp_param_assert
#define lmmp_param_assert(x)
Definition lmmp.h:423

lmmp_shr1add_n_
mp_limb_t lmmp_shr1add_n_(mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
加法后右移1位 [dst,n] = ([numa,n] + [numb,n]) >> 1
Definition shr.c:62

lmmp_shr_
mp_limb_t lmmp_shr_(mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_size_t shr)
大数右移操作 [dst,na] = [numa,na]>>shr，dst的高shr位填充0
Definition shr.c:19

lmmp_shl_
mp_limb_t lmmp_shl_(mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_size_t shl)
大数左移操作 [dst,na] = [numa,na]<<shl，dst的低shl位填充0
Definition shl.c:19

lmmp_sub_
static mp_limb_t lmmp_sub_(mp_ptr dst, mp_srcptr numa, mp_size_t na, mp_srcptr numb, mp_size_t nb)
大数减法静态内联函数 [dst,na]=[numa,na]-[numb,nb]
Definition lmmpn.h:1064

lmmp_addmul_1_
mp_limb_t lmmp_addmul_1_(mp_ptr numa, mp_srcptr numb, mp_size_t n, mp_limb_t b)
大数乘以单limb并累加操作 [numa,n] += [numb,n] * b

lmmp_submul_1_
mp_limb_t lmmp_submul_1_(mp_ptr numa, mp_srcptr numb, mp_size_t n, mp_limb_t b)
大数乘以单limb并累减操作 [numa,n] -= [numb,n] * b

lmmp_sub_n_
mp_limb_t lmmp_sub_n_(mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
无借位的n位减法 [dst,n] = [numa,n] - [numb,n]
Definition sub_n.c:80

lmmp_shr1sub_n_
mp_limb_t lmmp_shr1sub_n_(mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
减法后右移1位 [dst,n] = ([numa,n] - [numb,n]) >> 1
Definition shr.c:116

lmmp_inc_1
#define lmmp_inc_1(p, inc)
大数加指定值宏（预期无进位）
Definition lmmpn.h:950

lmmp_add_n_
mp_limb_t lmmp_add_n_(mp_ptr dst, mp_srcptr numa, mp_srcptr numb, mp_size_t n)
无进位的n位加法 [dst,n] = [numa,n] + [numb,n]
Definition add_n.c:81

tp
#define tp

n
#define n

w3
#define w3

w5
#define w5

w2
#define w2

w0
#define w0

lmmp_toom_interp7_
void lmmp_toom_interp7_(mp_ptr dst, mp_size_t n, enum toom7_flags flags, mp_ptr w1, mp_ptr w3, mp_ptr w4, mp_ptr w5, mp_size_t w6n, mp_ptr tp)
Copyright (C) 2026 HJimmyK(Jericho Knox)
Definition mul_toom_interp7.c:55

w6
#define w6

toom7_flags
toom7_flags
Definition toom_interp.h:24

toom7_w1_neg
@ toom7_w1_neg
Definition toom_interp.h:24

toom7_w3_neg
@ toom7_w3_neg
Definition toom_interp.h:24