并行设计模式(二)-- Master-Worker模式

时间:2023-03-09 03:59:52
并行设计模式(二)-- Master-Worker模式

  Java多线程编程中,常用的多线程设计模式包括:Future模式、Master-Worker模式、Guarded Suspeionsion模式、不变模式和生产者-消费者模式等。这篇文章主要讲述Master-Worker模式,关于其他多线程设计模式的地址如下:
  关于Future模式的详解:并行设计模式(一)-- Future模式
  关于Guarded Suspeionsion模式的详解:并行设计模式(三)-- Guarded Suspeionsion模式
  关于不变模式的详解:并行设计模式(四)-- 不变模式
  关于生产者-消费者模式的详解:并行设计模式(五)-- 生产者-消费者模式

 1. Master-Worker模式

  Master-Worker模式是常用的并行模式之一,它的核心思想是:系统由两类进程协同工作,即Master进程和Worker进程,Master负责接收和分配任务,Wroker负责处理子任务。当各个Worker进程将子任务处理完成后,将结果返回给Master进程,由Master进程进行汇总,从而得到最终的结果,其具体处理过程如下图所示。

并行设计模式(二)-- Master-Worker模式

  Master-Worker 模式的好处,它能够将一个大任务分解成若干个小任务并行执行,从而提高系统的吞吐量。而对于系统请求者 Client 来说,任务一旦提交,Master进程会分配任务并立即返回,并不会等待系统全部处理完成后再返回,其处理过程是异步的。因此,Client 不会出现等待现象。

2. Master-Worker模式结构

  Master-Worker 模式的结构相对比较简单,Master 进程为主要进程,它维护了一个Worker 进程队列、子任务队列和子结果集、Worker 进程队列中的 Worker 进程,不停地从任务队列中提取要处理的子任务,并将子任务的处理结果写入结果集。具体的结构图如下所示:

并行设计模式(二)-- Master-Worker模式

注意:Master-Worker 模式是一种使用多线程进行数据处理的结构。多个 Worker 进程协作处理用户请求,Master 进程负责维护 Worker 进程,并整合最终处理结果。

3. 代码实现

  Master-Worker 主要角色分配如下所示:

角 色 作 用

Worker

用于实际处理一个任务

Master

用于任务的分配和最终结果的合成

           Main

启动系统,调用开启Master

下面是一个简易版的 Master-Worker 框架 Java 代码实现

1. Master 部分源码实现:

 import java.util.HashMap;
import java.util.Map;
import java.util.Queue;
import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.ConcurrentLinkedQueue; public class Master {
// 任务队列
protected Queue<Object> workQueue = new ConcurrentLinkedQueue<Object>();
// Worker进程队列
protected Map<String, Thread> threadMap = new HashMap<String, Thread>();
// 子任务处理结果集
protected Map<String, Object> resultMap = new ConcurrentHashMap<String, Object>();
// 构造函数
public Master(Worker worker, int countWorker) {
worker.setWorkQueue(workQueue); //添加任务队列
worker.setResultMap(resultMap); //添加计算结果集合
for(int i=0; i<countWorker; i++) {
threadMap.put(Integer.toString(i), new Thread(worker, Integer.toString(i))); //循环添加任务进程
}
} //是否所有的子任务都结束了
public boolean isComplete() {
for(Map.Entry<String, Thread> entry : threadMap.entrySet()) {
if(entry.getValue().getState() != Thread.State.TERMINATED)
return false; //存在未完成的任务
}
return true;
} //提交一个子任务
public void submit(Object job) {
workQueue.add(job);
} //返回子任务结果集
public Map<String, Object> getResultMap() {
return resultMap;
} //执行所有Worker进程,进行处理
public void execute() {
for(Map.Entry<String, Thread> entry : threadMap.entrySet()) {
entry.getValue().start();
}
}
}

2. Worker 进程的源代码实现

 import java.util.Map;
import java.util.Queue; public class Worker implements Runnable{
//任务队列,用于取得子任务
protected Queue<Object> workQueue;
//子任务处理结果集
protected Map<String ,Object> resultMap;
public void setWorkQueue(Queue<Object> workQueue){
this.workQueue= workQueue;
}
public void setResultMap(Map<String ,Object> resultMap){
this.resultMap=resultMap;
}
//子任务处理的逻辑,在子类中实现具体逻辑
public Object handle(Object input){
return input;
}

@Override
public void run() {
while(true){
//获取子任务
Object input= workQueue.poll();
if(input==null){
break;
}
//处理子任务
Object re = handle(input);
resultMap.put(Integer.toString(input.hashCode()), re);
}
}
}

  以上两段代码已经展示了 Master-Worker 框架的全貌。应用程序中通过重载Worker.handle()方法实现应用层逻辑。

注意:Master-Worker 模式是一种将串行任务并行化的方法,被分解的子任务在系统中可以被并行处理。同时,如果有需要,Master 进程不需要等待所有子任务都完成计算,就可以根据已有的部分结果集计算最终结果。

  现应用这个 Master-Worker 框架,实现一个计算立方和的应用,并计算 1 ~~ 100 的立方和,即 13 + 23  + 33 + ... + 1003

  计算任务可被分解为 100 个子任务,每个子任务仅用于计算单独的立方和。Master 产生固定个数的 Worker 来处理所有这些子任务。Worker 不断地从任务集合中取得这些计算立方和的子任务,并将计算结果返回给 Master。Master 负责将所有 Worker 的任务结果进行累加,从而产生最终的立方和。在整个计算过程中,Master 与 Worker 的运行也是完全异步的,Master 不必等到所有的 Worker 都执行完成后,就可以进行求和操作。即,Master 在获得部分子任务结果集时,就已经可以开始对最终结果进行计算,从而进一步提高系统的并行度和吞吐量。具体的任务分解如下图所示:

  并行设计模式(二)-- Master-Worker模式

3.子任务 PlusWork 源码实现

  计算任务被划分成100个子任务,每个任务仅仅用于计算单独的立方和,对应的 PlusWork 源码如下:

public class PlusWorker extends Worker { //求立方和
@Override
public Object handle(Object input) {
int i = (Integer)input;
return i * i * i;
}
}

4. 进行计算的 Main 函数

  运行的调用函数如下。在主函数中首先通过Master类创建5个Worker工作进程和Worker工作实例PlusWorker。在提交了100个子任务后,边开始子任务的计算。这些子任务中由这5个进程共同完成。Master不用等待所有Worker计算完成才开始汇总,而是子任务在计算的过程中,Master就开始汇总了。

 import java.util.Map;
import java.util.Set; public class Application {
public static void main(String[] args) {
//固定使用5个Workde
Master master = new Master(new PlusWorker(), 5);
for(int i=1; i<=100; i++) //提交100个子任务
master.submit(i);
master.execute(); //开始计算
int re = 0; //最终计算结果保存在此
Map<String, Object> resultMap = master.getResultMap(); while(true) {//不需要等待所有Worker都执行完成,即可开始计算最终结果
Set<String> keys = resultMap.keySet(); //开始计算最终结果
String key = null;
for(String k : keys) {
key = k;
break;
}
Integer i = null;
if(key != null)
i = (Integer)resultMap.get(key);
if(i != null)
re += i; //最终结果
if(key != null)
resultMap.remove(key); //移除已被计算过的项目
if(master.isComplete() && resultMap.size()==0)
break;
}
System.out.println(re);
}
}

运行结果:

25502500

 总结:

  重要的事情说三遍,Master-Worker 模式是一种将串行任务并行化的方案,被分解的子任务在系统中可以被并行处理,同时,如果有需要,Master进程不需要等待所有子任务都完成计算,就可以根据已有的部分结果集计算最终结果集。