dd/df4/matrix_8h_source.html

/*

 * [LAMMP]

 * Copyright (C) [2025-2026] [HJimmyK(Jericho Knox)]

 *

 * This program is free software: you can redistribute it and/or modify

 * it under the terms of the GNU Lesser General Public License as published by

 * the Free Software Foundation, either version 3 of the License, or

 * (at your option) any later version.

 *

 * This program is distributed in the hope that it will be useful,

 * but WITHOUT ANY WARRANTY; without even the implied warranty of

 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the

 * GNU Lesser General Public License for more details.

 *

 * You should have received a copy of the GNU Lesser General Public License

 * along with this program.  If not, see <https://www.gnu.org/licenses/>.

 */


#ifndef LAMMP_MATRIX_H

#define LAMMP_MATRIX_H


/*

 一些约定：

        mat表示矩阵，为matrix简称。umat表示unsigned matrix，u表示unsigned

        smat表示signed matrix，s表示signed。由于我们只对有符号的进行计算，大部分场合

        都使用signed matrix，所以我们用mat表示signed mat。数字字面量或者m,n表示行列数，

        单数字字面量或者n表示为方阵的阶数。


        vec表示向量，vector简称。uvec表示unsigned vector，u表示unsigned。

        svec表示signed vector，s表示signed。由于我们只对有符号的进行计算，大部分场合

        都使用signed vector，所以我们用vec表示signed vec。数字字面量或者n表示向量长度。

        向量参与运算时默认为列向量，等价于矩阵的列。


        我们使用有符号整数类型表示limb长度，符号表明这个数的正负性，指针存储的是绝对值。

        同时需要注意的是，在此处，mp_ptr若为空和limb长度为0，这两个情况均称之为语义0，

        计算行为等价为0。同时，需要注意的是，在无明确要求的情况下，我们不希望指针非空的

        同时limb长度为0，因为这可能导致未定义行为。


        矩阵或向量的各个元素的地址我们并不要求完全分离或相同，当sep或eqsep用于矩阵或向量时，

        语义和意义与sep或eqsep的一般用法相同。sep表示mat和vec指针分离，eqsep表示mat和vec

        指针分离或相同，elemsep表示mat或vec各元素指针分离，eqelemsep表示mat或vec各元素指针

        分离或相同。sep和eqsep用于矩阵或向量时，通常分别隐含了elemsep和eqelemsep。


        nonull()表示矩阵或向量中的各元素指针全部不为NULL


*/


#include "lmmp.h"


#ifndef INLINE_

#define INLINE_ static inline

#endif


#ifdef __cplusplus

extern "C" {

#endif


typedef struct {

    mp_ptr a00;

    mp_ptr a01;

    mp_ptr a10;

    mp_ptr a11;

    mp_ssize_t n00;

    mp_ssize_t n01;

    mp_ssize_t n10;

    mp_ssize_t n11;

} lmmp_mat22_t;


typedef lmmp_mat22_t lmmp_smat22_t;


typedef struct {

    mp_ptr a0;

    mp_ptr a1;

    mp_ssize_t n0;

    mp_ssize_t n1;

} lmmp_mat21_t;


typedef lmmp_mat21_t lmmp_vec2_t;

typedef lmmp_mat21_t lmmp_smat21_t;

typedef lmmp_mat21_t lmmp_svec2_t;


typedef struct {

    mp_ptr* num;

    mp_ssize_t* len;

    size_t n;

} lmmp_svecn_t;


typedef lmmp_svecn_t lmmp_matn1_t;

typedef lmmp_svecn_t lmmp_vecn_t;


/**

 * @brief 计算向量的累乘

 * @param dst 结果向量，将会被覆盖为累乘结果指针，将会自动分配内存

 * @param vec 被累乘向量

 * @warning dst!=NULL, vec!=NULL, nonull(vec), vec->n>0

 * @note 当vec中存在语义0时，*dst将会被置为NULL，并返回0。其余情况，*dst会被置为结果指针，并返回实际长度。

 * @return 结果dst的实际长度（为负数表示此数为负数，绝对值表示实际长度）

 */

LAMMP_API mp_ssize_t lmmp_vec_elem_mul_(mp_ptr* dst, const lmmp_vecn_t* vec);


/**

 * @brief 计算limb向量的累乘

 * @param dst 结果向量，将会被覆盖为累乘结果指针，将会自动分配内存

 * @param limb 被累乘向量

 * @warning dst!=NULL, limb!=NULL, n>0

 * @note 当limb数组存在0值时，*dst将会被置为NULL，并返回0。其余情况，*dst会被置为结果指针，并返回实际长度。

 * @return 结果dst的实际长度

 */

LAMMP_API mp_size_t lmmp_limb_elem_mul_(mp_ptr* dst, const mp_limb_t* limb, mp_size_t n);


/**

 * @brief 计算slimb向量的累乘

 * @param dst 结果向量，将会被覆盖为累乘结果指针，将会自动分配内存

 * @param slimb 被累乘向量

 * @warning dst!=NULL, slimb!=NULL

 * @note 当slimb数组存在0值时，*dst将会被置为NULL，并返回0。其余情况，*dst会被置为结果指针，并返回实际长度。

 * @return 结果dst的实际长度（为负数表示此数为负数，绝对值表示实际长度）

 */

LAMMP_API mp_ssize_t lmmp_slimb_elem_mul_(mp_ptr* dst, const mp_slimb_t* slimb, mp_size_t n);


/**

 * @brief 计算2x2矩阵和2x2矩阵的乘积需要分配的内存

 * @param dst 结果矩阵，dst中的n将会被覆盖为对应位置需要的limb长度，此函数不分配内存。

 * @param matA 矩阵A

 * @param matB 矩阵B

 * @param tn 输出参数，将会被覆盖为缓冲区需要的limb长度，正数

 * @param maxa 如果被覆盖，即matA中最大的元素的limb长度+1，此参数只有当确认使用STRASSEN算法时才需要

 * @warning dst!=NULL, [matA|matB]!=NULL, nonull([matA|matB]), sep(dst,[matA|matB]), tn!=NULL, maxa!=NULL

 * @note 如果你可以确认一定不使用STRASSEN算法，则不需要maxa参数，其可以为NULL。

 * @return 0表示选择basecase算法，1表示选择STRASSEN算法。

 */

LAMMP_API int lmmp_mat22_mul_size_(lmmp_mat22_t* dst,

                                   const lmmp_mat22_t* matA,

                                   const lmmp_mat22_t* matB,

                                   mp_size_t* tn,

                                   mp_size_t* maxa);


/**

 * @brief 计算2x2矩阵和2x2矩阵的乘积

 * @param dst 结果矩阵。

 * @param matA 矩阵A

 * @param matB 矩阵B

 * @param tp 临时缓冲区，用于存储中间结果，需要分配2*tn个limb，若为NULL，则会自动分配。

 * @param tn 缓冲区的limb长度

 * @warning dst!=NULL, nonull(dst), [matA|matB]!=NULL, nonull([matA|matB]), sep(dst,[matA|matB]), tn>0

 */

LAMMP_API void lmmp_mat22_mul_basecase_(lmmp_mat22_t* dst,

                                        const lmmp_mat22_t* matA,

                                        const lmmp_mat22_t* matB,

                                        mp_ptr tp,

                                        mp_size_t tn);


/**

 * @brief 计算2x2矩阵平方

 * @param dst 结果矩阵。

 * @param matA 矩阵A

 * @param tp 临时缓冲区，用于存储中间结果，需要分配2*tn个limb，若为NULL，则会自动分配。

 * @param tn 缓冲区的limb长度

 * @param maxa matA中最大的元素的limb长度+1，建议由lmmp_mat22_mul_size_确定

 * @warning dst!=NULL, nonull(dst), matA!=NULL, nonull(matA), sep(dst,matA), tn>0

 */

LAMMP_API void lmmp_mat22_sqr_basecase_(lmmp_mat22_t* dst, const lmmp_mat22_t* matA, mp_ptr tp, mp_size_t tn);


/**

 * @brief 计算（稠密）2x2矩阵和（稠密）2x2矩阵的乘积（STRASSEN算法）

 * @param dst 结果矩阵。

 * @param matA 矩阵A

 * @param matB 矩阵B

 * @param tp 临时缓冲区，用于存储中间结果，需要分配7*(tn+1)个limb，若为NULL，则会自动分配。

 * @param tn 缓冲区的limb长度

 * @param maxa matA中最大的元素的limb长度+1，建议由lmmp_mat22_mul_size_确定

 * @warning dst!=NULL, nonull(dst), [matA|matB]!=NULL, nonull([matA|matB]), sep(dst,[matA|matB]), tn>0

 */

LAMMP_API void lmmp_mat22_mul_strassen_(lmmp_mat22_t* dst, const lmmp_mat22_t* matA, const lmmp_mat22_t* matB,

                                        mp_ptr tp, mp_size_t tn, mp_size_t maxa);


/**

 * @brief 计算（稠密）2x2矩阵平方（STRASSEN算法）

 * @param dst 结果矩阵。

 * @param matA 矩阵A

 * @param tp 临时缓冲区，用于存储中间结果，需要分配7*(tn+1)个limb，若为NULL，则会自动分配。

 * @param tn 缓冲区的limb长度

 * @warning dst!=NULL, nonull(dst), matA!=NULL, nonull(matA), sep(dst,matA), tn>0

 */

LAMMP_API void lmmp_mat22_sqr_strassen_(lmmp_mat22_t* dst, const lmmp_mat22_t* matA, mp_ptr tp, mp_size_t tn);


/**

 * @brief 计算2x2矩阵和2x2矩阵的乘积

 * @param dst 结果矩阵。

 * @param matA 矩阵A

 * @param matB 矩阵B

 * @param choose 选择算法，0表示basecase算法，1表示STRASSEN算法

 * @param tn 缓冲区的limb长度，建议由lmmp_mat22_mul_size_确定

 * @param maxa matA中最大的元素的limb长度+1，建议由lmmp_mat22_mul_size_确定

 * @warning dst!=NULL, nonull(dst), [matA|matB]!=NULL, nonull([matA|matB]), sep(dst,[matA|matB]), choose==[0|1]

 */

INLINE_ void


lmmp_mat22_mul_(lmmp_mat22_t* dst, const lmmp_mat22_t* matA, const lmmp_mat22_t* matB, int choose, mp_size_t tn,

                mp_size_t maxa) {

    lmmp_param_assert(dst != NULL);

    lmmp_param_assert(matA != NULL);

    lmmp_param_assert(matB != NULL);

    lmmp_param_assert(choose == 0 || choose == 1);

    if (choose == 0) {

        lmmp_mat22_mul_basecase_(dst, matA, matB, NULL, tn);

    } else {

        lmmp_mat22_mul_strassen_(dst, matA, matB, NULL, tn, maxa);

    }

}


/**

 * @brief 计算（稠密）2x2矩阵平方

 * @param dst 结果矩阵。

 * @param matA 矩阵A

 * @param tn 缓冲区的limb长度，建议由lmmp_mat22_mul_size_确定

 * @param choose 选择算法，0表示basecase算法，1表示STRASSEN算法

 * @warning dst!=NULL, nonull(dst), matA!=NULL, nonull(matA), sep(dst,matA), tn>0

 */

INLINE_ void


lmmp_mat22_sqr_(lmmp_mat22_t* dst, const lmmp_mat22_t* mat, int choose, mp_size_t tn) {

    lmmp_param_assert(dst != NULL);

    lmmp_param_assert(mat != NULL);

    lmmp_param_assert(choose == 0 || choose == 1);

    if (choose == 0) {

        lmmp_mat22_sqr_basecase_(dst, mat, NULL, tn);

    } else {

        lmmp_mat22_sqr_strassen_(dst, mat, NULL, tn);

    }

}


#ifdef __cplusplus

}

#endif


#endif // LAMMP_MATRIX_H

lmmp.h

mp_ptr
mp_limb_t * mp_ptr
Definition lmmp.h:215

mp_size_t
uint64_t mp_size_t
Definition lmmp.h:212

mp_slimb_t
int64_t mp_slimb_t
Definition lmmp.h:213

mp_ssize_t
int64_t mp_ssize_t
Definition lmmp.h:214

mp_limb_t
uint64_t mp_limb_t
Definition lmmp.h:211

LAMMP_API
#define LAMMP_API
Definition lmmp.h:64

lmmp_param_assert
#define lmmp_param_assert(x)
Definition lmmp.h:398

lmmp_mat22_t::a01
mp_ptr a01
Definition matrix.h:60

lmmp_mat22_t::n10
mp_ssize_t n10
Definition matrix.h:65

lmmp_svec2_t
lmmp_mat21_t lmmp_svec2_t
Definition matrix.h:78

lmmp_vec2_t
lmmp_mat21_t lmmp_vec2_t
Definition matrix.h:76

lmmp_mat22_t::a11
mp_ptr a11
Definition matrix.h:62

lmmp_mat22_mul_strassen_
void lmmp_mat22_mul_strassen_(lmmp_mat22_t *dst, const lmmp_mat22_t *matA, const lmmp_mat22_t *matB, mp_ptr tp, mp_size_t tn, mp_size_t maxa)
计算（稠密）2x2矩阵和（稠密）2x2矩阵的乘积（STRASSEN算法）
Definition mat22_mul.c:194

lmmp_mat22_mul_size_
int lmmp_mat22_mul_size_(lmmp_mat22_t *dst, const lmmp_mat22_t *matA, const lmmp_mat22_t *matB, mp_size_t *tn, mp_size_t *maxa)
计算2x2矩阵和2x2矩阵的乘积需要分配的内存
Definition mat22_mul.c:13

lmmp_mat22_mul_basecase_
void lmmp_mat22_mul_basecase_(lmmp_mat22_t *dst, const lmmp_mat22_t *matA, const lmmp_mat22_t *matB, mp_ptr tp, mp_size_t tn)
计算2x2矩阵和2x2矩阵的乘积
Definition mat22_mul.c:83

lmmp_mat21_t::a0
mp_ptr a0
Definition matrix.h:71

lmmp_mat22_t::n11
mp_ssize_t n11
Definition matrix.h:66

lmmp_mat21_t::n1
mp_ssize_t n1
Definition matrix.h:74

lmmp_mat22_sqr_strassen_
void lmmp_mat22_sqr_strassen_(lmmp_mat22_t *dst, const lmmp_mat22_t *matA, mp_ptr tp, mp_size_t tn)
计算（稠密）2x2矩阵平方（STRASSEN算法）
Definition mat22_mul.c:346

lmmp_vecn_t
lmmp_svecn_t lmmp_vecn_t
Definition matrix.h:86

INLINE_
#define INLINE_
Definition matrix.h:51

lmmp_mat22_mul_
static void lmmp_mat22_mul_(lmmp_mat22_t *dst, const lmmp_mat22_t *matA, const lmmp_mat22_t *matB, int choose, mp_size_t tn, mp_size_t maxa)
计算2x2矩阵和2x2矩阵的乘积
Definition matrix.h:195

lmmp_vec_elem_mul_
mp_ssize_t lmmp_vec_elem_mul_(mp_ptr *dst, const lmmp_vecn_t *vec)
计算向量的累乘
Definition elem_mul.c:18

lmmp_smat22_t
lmmp_mat22_t lmmp_smat22_t
Definition matrix.h:68

lmmp_mat21_t::n0
mp_ssize_t n0
Definition matrix.h:73

lmmp_svecn_t::num
mp_ptr * num
Definition matrix.h:81

lmmp_limb_elem_mul_
mp_size_t lmmp_limb_elem_mul_(mp_ptr *dst, const mp_limb_t *limb, mp_size_t n)
计算limb向量的累乘

lmmp_slimb_elem_mul_
mp_ssize_t lmmp_slimb_elem_mul_(mp_ptr *dst, const mp_slimb_t *slimb, mp_size_t n)
计算slimb向量的累乘

lmmp_mat22_sqr_
static void lmmp_mat22_sqr_(lmmp_mat22_t *dst, const lmmp_mat22_t *mat, int choose, mp_size_t tn)
计算（稠密）2x2矩阵平方
Definition matrix.h:217

lmmp_mat22_sqr_basecase_
void lmmp_mat22_sqr_basecase_(lmmp_mat22_t *dst, const lmmp_mat22_t *matA, mp_ptr tp, mp_size_t tn)
计算2x2矩阵平方
Definition mat22_mul.c:119

lmmp_mat21_t::a1
mp_ptr a1
Definition matrix.h:72

lmmp_svecn_t::n
size_t n
Definition matrix.h:83

lmmp_smat21_t
lmmp_mat21_t lmmp_smat21_t
Definition matrix.h:77

lmmp_mat22_t::n01
mp_ssize_t n01
Definition matrix.h:64

lmmp_matn1_t
lmmp_svecn_t lmmp_matn1_t
Definition matrix.h:85

lmmp_mat22_t::n00
mp_ssize_t n00
Definition matrix.h:63

lmmp_mat22_t::a00
mp_ptr a00
Definition matrix.h:59

lmmp_mat22_t::a10
mp_ptr a10
Definition matrix.h:61

lmmp_svecn_t::len
mp_ssize_t * len
Definition matrix.h:82

lmmp_svecn_t
Definition matrix.h:80

lmmp_mat21_t
Definition matrix.h:70

lmmp_mat22_t
Definition matrix.h:58

tp
#define tp