在并行计算中经常需要调用scalapack(并行化的lapack)函数库里面的函数进行编程,这里简单介绍在c语言如何调用scalapck中的矩阵向量乘的函数。
注意:scalapack中的函数是用fortran写的,矩阵是按列进行存储的。
scalapack的链接需要用到blas,因此确保本机上安装好了blas、gfortran
下面是一个矩阵向量乘法的例子(为了简单计算,该程序中设定进程数为4):
#include
#include
#include
#include mpi.h
#define aa(i,j) aa[(i)*m+(j)]
int main(int argc, char **argv)
{
int i, j, k;
/************ mpi ***************************/
int myrank_mpi, nprocs_mpi;
mpi_init( &argc, &argv);
mpi_comm_rank(mpi_comm_world, &myrank_mpi);
mpi_comm_size(mpi_comm_world, &nprocs_mpi);
/************ blacs ***************************/
int ictxt, nprow, npcol, myrow, mycol,nb;
int info,itemp;
int zero=0,one=1;
nprow = 2;
npcol = 2;
nb = 1;
cblacs_pinfo( &myrank_mpi, &nprocs_mpi ) ;
cblacs_get( -1, 0, &ictxt );
cblacs_gridinit( &ictxt, row, nprow, npcol );
cblacs_gridinfo( ictxt, &nprow, &npcol, &myrow, &mycol );
int m = 4;
int desca[9],descx[9],descy[9];
int ma = numroc_( &m, &nb, &myrow, &zero, &nprow );
int na = numroc_( &m, &nb, &mycol, &zero, &npcol );
int nx = numroc_( &m, &nb, &myrow, &zero, &nprow );
int my = numroc_( &m, &nb, &myrow, &zero, &nprow );
descinit_(desca, &m, &m, &nb, &nb, &zero, &zero, &ictxt, &ma, &info);
descinit_(descx, &m, &one, &nb, &one, &zero, &zero, &ictxt, &nx, &info);
descinit_(descy, &m, &one,&nb, &one, &zero, &zero, &ictxt, &my, &info);
double *x = (double*) malloc(nx*sizeof(double));
double *y = (double*) calloc(my,sizeof(double));
double *a = (double*) malloc(ma*na*sizeof(double));
int sat,sut;
for(i=0;i
for(j=0;ja[j*ma+i]=1.0;
for(i=0;ix[i] = 1.0;
double alpha = 1.0; double beta = 0.0;
pdgemv_(n, &m, &m, &alpha, a, &one, &one, desca, x, &one, &one,descx, &one, &beta, y, &one, &one, descy, &one);
for(i=0;iprintf(rank=%d ,%f \n, myrank_mpi,y[i]);
mpi_finalize();
return 0;
}
编译生成可执行文件:
mpicc -o pdgemv pdgemv.c -l/opt/scalapack/scalapck-2.0.2/ -lscalapack -lblas -lgfortran
运行:
mpirun -np 4 ./pdgemv
基于SMARS 机器人的3D打印部件设计
手机充电插头大小有什么区别
模拟信号转成数字信号的四个过程
华为正式表态:拥有自动驾驶和电动汽车关键技术
第三代AI处理器的核心优势
Linux系统下C语言如何调用scalapack中的函数
Steam发布2020年1月份玩家软硬件统计数据 最受欢迎显卡依然是GTX 1060
2018年国产品牌手机出货量排行榜公布华为和荣耀位居第一
SKYLAB:介绍两款支持中继模式的双频WiFi模块
树莓派A+的用处
内置MOS,双节锂电池升压输出12V/3A转换器FP5217
S32K344-WB开发板快速入门:官方在线教程&完整设计资源,请查收!
盘点英国在人工智能领域的战略布局及发展前景
机器人和人工智能的进步 带动世界快速变化
开源推动大数据新兴技术不断涌现
你不得不知道的人工智能的六大担忧
比特币减半效应是怎么一回事
CCC和CQC认证是什么?有什么区别?
常规放大电路和差分放大电路设计
如何实现薄膜射频器件的最佳性能?