MPI实现矩阵向量乘法

这篇具有很好参考价值的文章主要介绍了MPI实现矩阵向量乘法。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

(1)问题

MPI实现矩阵向量:Ab的乘积。其中A:100行100列,b为列向量。

(2)思路

将所有进程分为两部分,rank=0的进程为master节点,其余进程为worker节点。

master节点:

(1)对A,b赋值,同时将b广播出去(这里涉及一个对广播这个函数不太熟悉的点)

(2)对A进行划分,使其被划分为worker数量的份数,并将相应数据发送给相应的工人节点

(3)接收工人节点的计算结果,并对收到的结果及进行一定的处理从而得到最终结果

worker节点:

(1)接受来自master的参数

(2)对接收到的数据进行计算

(3)将结果返回给master

(3)代码

main.cpp: 

#include <iostream>
#include "mpi.h"
#include "conf.h"
#include "masterMain.h"
#include "workerMain.h"
#include<string.h>

using namespace std;

MPI_Status status;

int main(int argc, char *argv[]) {
    int size, rank;
    MPI_Init(&argc, &argv);
    char message[20];
    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
    MPI_Comm_size(MPI_COMM_WORLD, &size);

    int a[ROW][COL];
    int b[COL], res[COL]; //A为参加运算的矩阵,B为参加运算的向量,result为结果
    masterMain mastermain;
    workerMain workerMain1;
    if (rank == MASTER) {
        cout<<"进程0"<<endl;
//        cout << "主进程开始对矩阵和向量初始化~" << endl;
        for (int i = 0; i < ROW; ++i) {
            for (int j = 0; j < COL; ++j) {
                a[i][j] = 1;
            }
            b[i] = 2;
        }
    }
    //广播必须在主进程之外吗?(这里不太理解!!!)
    MPI_Bcast(&b, COL, MPI_INT, 0, MPI_COMM_WORLD);
    if(rank==MASTER){
        mastermain.matrixMuliplication(a,b,ROW,COL,size,res,status);
    }else{
        workerMain1.workerRun(a,b,ROW,COL,status);
    }

    MPI_Finalize();

}

 masterMain.cpp

//
// Created by unbuntu-xcr on 22-10-15.
//

#include "masterMain.h"
#include "conf.h"
#include <iostream>

using namespace std;

void masterMain::masterRun() {

}

/**
 *
 * @param a 矩阵A
 * @param b 向量b
 * @param row A的行数
 * @param col A的列数
 * @param size 参与运算的所有进程数
 * @param rank 当前进程号
 */
void masterMain::matrixMuliplication(int a[][100], int *b, int row, int col, int size,int *res,MPI_Status status) {
    //master节点任务:首先是初始化矩阵,再分发矩阵,收集各个从节点返回的结果,并放到指定位置
    //(1)设置当前进程所需的行
    size = size - 1;
    int rowPerWorker;
    rowPerWorker = row / size;
    //master给每个进程传递数据的偏移量
    int offset = 0;
    cout << "主进程开始对数据进行分发~" << endl;
    for (int i = 1; i <= size; ++i) {
        rowPerWorker = (i <= row % size ? rowPerWorker + 1 : rowPerWorker);
        int count = row * rowPerWorker;
        //给从进程传递计算数据
        MPI_Send(&offset,1,MPI_INT,i,FROMMASTER,MPI_COMM_WORLD);
        MPI_Send(&rowPerWorker,1,MPI_INT,i,FROMMASTER,MPI_COMM_WORLD);
        MPI_Send(a[offset], count, MPI_INT, i, FROMMASTER, MPI_COMM_WORLD);
        offset+=rowPerWorker;
    }

    int result[rowPerWorker];
    //MASTER接收从进程发来的消息
    for (int i = 1; i <= size ; ++i) {
        int k=0;
        MPI_Recv(&offset,1,MPI_INT,i,FROMWORKER,MPI_COMM_WORLD,&status);
        MPI_Recv(&rowPerWorker,1,MPI_INT,i,FROMWORKER,MPI_COMM_WORLD,&status);
        MPI_Recv(result,rowPerWorker,MPI_INT,i,FROMWORKER,MPI_COMM_WORLD,&status);
        for (int j = offset; j <= offset+rowPerWorker ; ++j) {
            res[j]=result[k++];
        }
    }

    cout<<"矩阵向量乘结果为:"<<endl;
    for (int i = 0; i < col; ++i) {
        cout<<res[i]<<" ";
    }

}

 workerMain.cpp

//
// Created by unbuntu-xcr on 22-10-15.
//

#include "workerMain.h"
#include "conf.h"

void workerMain::workerRun(int a[][100], int *b, int row, int col,MPI_Status status) {
    //接收主进程传递的向量,相应矩阵,相应数据,并返回相应计算结果
    int offset;
    int rowPerWorker;
    //接收偏移量
    MPI_Recv(&offset,1,MPI_INT,MASTER,FROMMASTER,MPI_COMM_WORLD,&status);
    //接收行数
    MPI_Recv(&rowPerWorker,1,MPI_INT,MASTER,FROMMASTER,MPI_COMM_WORLD,&status);
    //接收矩阵A
    MPI_Recv(a,rowPerWorker*col,MPI_INT,MASTER,FROMMASTER,MPI_COMM_WORLD,&status);

    int result[rowPerWorker];
//    计算
    for (int i = 0; i < rowPerWorker; ++i) {
        result[i]=0;
        for (int j = 0; j < col; ++j) {
            result[i]+=a[i][j]*b[j];
        }
    }

    MPI_Send(&offset,1,MPI_INT,MASTER,FROMWORKER,MPI_COMM_WORLD);
    MPI_Send(&rowPerWorker,1,MPI_INT,MASTER,FROMWORKER,MPI_COMM_WORLD);
    MPI_Send(result,rowPerWorker,MPI_INT,MASTER,FROMWORKER,MPI_COMM_WORLD);
}

(4)总结

1)为什么要分这么多CPP文件来写?因为想熟悉c++在工程结构上的写法,所以要慢慢开始以这种写法来写

2)问题:mpi_bcast()函数放在master判断条件内为什么就不能将值广播出去?

3)注意:写的时候,先写master发送的,然后写worker接收相应的值,在其进行一定处理并发送给master后,再在master中写接受到相应值之后的操作,这样不至于逻辑混乱

4)还要注意:send和recv必须保持顺序一致,send谁在前,那么接收谁就在前,不然就会出错文章来源地址https://www.toymoban.com/news/detail-503394.html

到了这里,关于MPI实现矩阵向量乘法的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • R语言矩阵、向量操作(矩阵乘法,向量内积、外积(叉乘),矩阵转置,矩阵的逆)

    创建两个四维矩阵 A 与 B,A 按列填充,B 按行填充 : 创建两个 n 维向量 x 和 y : 使用 t(矩阵、向量名) 即可: 输出如下: 使用 %*% 符号即可: 输出如下: 在R语言中,两个矩阵、向量的内积并不只是简单的 * 号就完事了,而是有以下两种求法: 或者 其结果如下: (注意区分

    2024年02月12日
    浏览(22)
  • 线性代数 --- 矩阵与向量的乘法

    矩阵x向量(注:可以把列向量看成是nx1的矩阵)         现有如下方程组:  9个系数,3个未知数,等式右边有3个数         上述方程组可用矩阵的方式改写成,一个系数矩阵A与一个未知数向量x的乘积,乘积的结果等于右端向量b: 现在我们分别用两种方法,行乘和

    2024年02月05日
    浏览(61)
  • 矩阵与向量的运算:矩阵的加法、数乘与乘法

    作者:禅与计算机程序设计艺术 \\\"矩阵与向量的运算\\\"是机器学习领域的一个基础课。在实际应用中,许多算法都需要涉及到矩阵运算。理解并掌握这种运算对于解决复杂的问题和优化模型性能至关重要。本文将带您快速了解矩阵的概念,以及如何进行矩阵运算。 \\\"行列式\\\"是指

    2024年02月11日
    浏览(30)
  • 线性代数矩阵乘法中的行向量和列向量

    在矩阵中有两个概念,行向量与列向量,这是从两个不同的角度看待矩阵的组成。这篇文章将从 行向量 和 列向量 两个角度来分解 矩阵的乘法 。 假设有两个矩阵 A 和 B 一般矩阵的乘法分解 简单的理解就是A矩阵的第一行与B矩阵的第一列逐元素相乘,就是 结果矩阵 的左上角

    2024年02月11日
    浏览(34)
  • <3>【深度学习 × PyTorch】必会 线性代数 (含详细分析):点积 | 矩阵-向量积 | Hadamard积 | 矩阵乘法 | 范数/矩阵范数

      拍照的意义在于你按下快门的那一刻,万里山河的一瞬间变成了永恒。   🎯作者主页: 追光者♂🔥          🌸个人简介:   💖[1] 计算机专业硕士研究生💖   🌟[2] 2022年度博客之星人工智能领域TOP4🌟   🏅[3] 阿里云社区特邀专家博主🏅   🏆[4] CSDN-人工智能领域

    2024年02月05日
    浏览(41)
  • 【HNU分布式与云计算系统】MPI实现矩阵乘矩阵运算

    实验环境 操作系统:Ubuntu 20.04 编程语言:C++ 实验原理 什么是MPI MPI是一个跨语言的通讯协议,用于编写并行计算机。支持点对点和广播。MPI是一个信息传递应用程序接口,包括协议和和语义说明,他们指明其如何在各种实现中发挥其特性。MPI的目标是高性能,大规模性,和

    2023年04月08日
    浏览(25)
  • 矩阵最小二乘法问题求解

    超定方程组是指方程个数大于未知量个数的方程组。对于方程组 A x = b Ax=b A x = b , A A A 为n×m矩阵,如果R列满秩,且nm。则方程组没有精确解,此时称方程组为超定方程组。 在实验数据处理和曲线拟合问题中,求解超定方程组非常普遍。比较常用的方法是 最小二乘法 。 如果

    2024年02月05日
    浏览(28)
  • 【矩阵乘法】C++实现外部矩阵乘法

    ​ 使用文件和内存模拟系统缓存,并利用矩阵乘法验证实际和理论情况。 设计一个 Matrix 类,其中 Matrix 是存在磁盘中的一个二进制文件,类通过保存的矩阵属性来读取磁盘。前八个字节为两个 int32 ,保存矩阵的行列数。 Matrix中有一个 buffer 成员为读取到的数据缓存,通过

    2024年02月11日
    浏览(26)
  • 使用cublas实现矩阵乘法

    使用CUDA写一个矩阵乘法 C = A X B (矩阵维度: A: M X K, B: K X N, C: M X N ),当然可以自己写核函数,但效率不如CUDA自带的 cublas 算法效率高。使用 cublas 唯一值得注意的地方是, 在CPU中的矩阵数据存储是行优先存储,而在GPU中是列优先存储 ,这相当于对原矩阵做了一次转置,我

    2024年02月16日
    浏览(30)
  • markdown实现矩阵乘法

    [ x y 1 ] = [ f 0 O x 0 f O y 0 0 1 ] [ x ˉ y ˉ z ] (1) left[ begin{matrix} x \\\\ y \\\\ 1 end{matrix} right] = left[ begin{matrix} f 0 O_x\\\\ 0 f O_y\\\\ 0 0 1 end{matrix} right] left[ begin{matrix} bar{x} \\\\ bar{y} \\\\ z end{matrix} right] tag{1} ​ x y 1 ​ ​ = ​ f 0 0 ​ 0 f 0 ​ O x ​ O y ​ 1 ​ ​ ​ x ˉ y ˉ ​ z ​ ​ ( 1

    2024年02月09日
    浏览(25)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包