Java工作队列代码详解

时间:2022-12-04 23:25:20

我们写了通过一个命名的队列发送和接收消息,如果你还不了解请点击:rabbitmqjava入门。这篇中我们将会创建一个工作队列用来在工作者(consumer)间分发耗时任务。

工作队列的主要任务是:避免立刻执行资源密集型任务,然后必须等待其完成。相反地,我们进行任务调度:我们把任务封装为消息发送给队列。工作进行在后台运行并不断的从队列中取出任务然后执行。当你运行了多个工作进程时,任务队列中的任务将会被工作进程共享执行。

这样的概念在web应用中极其有用,当在很短的http请求间需要执行复杂的任务。

1、准备

我们使用thread.sleep来模拟耗时的任务。我们在发送到队列的消息的末尾添加一定数量的点,每个点代表在工作线程中需要耗时1秒,例如hello…将会需要等待3秒。

发送端:

newtask.java

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
import java.io.ioexception;
import com.rabbitmq.client.channel;
import com.rabbitmq.client.connection;
import com.rabbitmq.client.connectionfactory;
public class newtask
{
    //队列名称
    private final static string queue_name = "workqueue";
    public static void main(string[] args) throws ioexception
     {
        //创建连接和频道
        connectionfactory factory = new connectionfactory();
        factory.sethost("localhost");
        connection connection = factory.newconnection();
        channel channel = connection.createchannel();
        //声明队列
        channel.queuedeclare(queue_name, false, false, false, null);
        //发送10条消息,依次在消息后面附加1-10个点
        for (int i = 0; i < 10; i++)
          {
            string dots = "";
            for (int j = 0; j <= i; j++)
               {
                dots += ".";
            }
            string message = "helloworld" + dots+dots.length();
            channel.basicpublish("", queue_name, null, message.getbytes());
            system.out.println(" [x] sent '" + message + "'");
        }
        //关闭频道和资源
        channel.close();
        connection.close();
    }
}

接收端:

work.java

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
import com.rabbitmq.client.channel;
import com.rabbitmq.client.connection;
import com.rabbitmq.client.connectionfactory;
import com.rabbitmq.client.queueingconsumer;
public class work
{
    //队列名称
    private final static string queue_name = "workqueue";
    public static void main(string[] argv) throws java.io.ioexception,
       java.lang.interruptedexception
     {
        //区分不同工作进程的输出
        int hashcode = work.class.hashcode();
        //创建连接和频道
        connectionfactory factory = new connectionfactory();
        factory.sethost("localhost");
        connection connection = factory.newconnection();
        channel channel = connection.createchannel();
        //声明队列
        channel.queuedeclare(queue_name, false, false, false, null);
        system.out.println(hashcode
            + " [*] waiting for messages. to exit press ctrl+c");
        queueingconsumer consumer = new queueingconsumer(channel);
        // 指定消费队列
        channel.basicconsume(queue_name, true, consumer);
        while (true)
          {
            queueingconsumer.delivery delivery = consumer.nextdelivery();
            string message = new string(delivery.getbody());
            system.out.println(hashcode + " [x] received '" + message + "'");
            dowork(message);
            system.out.println(hashcode + " [x] done");
        }
    }
    /**
  * 每个点耗时1s
  * @param task
  * @throws interruptedexception
  */
    private static void dowork(string task) throws interruptedexception
     {
        for (char ch : task.tochararray())
          {
            if (ch == '.')
                thread.sleep(1000);
        }
    }
}

round-robin 转发

使用任务队列的好处是能够很容易的并行工作。如果我们积压了很多工作,我们仅仅通过增加更多的工作者就可以解决问题,使系统的伸缩性更加容易。

下面我们先运行3个工作者(work.java)实例,然后运行newtask.java,3个工作者实例都会得到信息。但是如何分配呢?让我们来看输出结果:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
[x] sent 'helloworld.1'
[x] sent 'helloworld..2'
[x] sent 'helloworld...3'
[x] sent 'helloworld....4'
[x] sent 'helloworld.....5'
[x] sent 'helloworld......6'
[x] sent 'helloworld.......7'
[x] sent 'helloworld........8'
[x] sent 'helloworld.........9'
[x] sent 'helloworld..........10'
工作者1
605645 [*] waiting for messages. to exit press ctrl+c
605645 [x] received 'helloworld.1'
605645 [x] done
605645 [x] received 'helloworld....4'
605645 [x] done
605645 [x] received 'helloworld.......7'
605645 [x] done
605645 [x] received 'helloworld..........10'
605645 [x] done
 
工作者2
18019860 [*] waiting for messages. to exit press ctrl+c
18019860 [x] received 'helloworld..2'
18019860 [x] done
18019860 [x] received 'helloworld.....5'
18019860 [x] done
18019860 [x] received 'helloworld........8'
18019860 [x] done
 
工作者3
18019860 [*] waiting for messages. to exit press ctrl+c
18019860 [x] received 'helloworld...3'
18019860 [x] done
18019860 [x] received 'helloworld......6'
18019860 [x] done
18019860 [x] received 'helloworld.........9'
18019860 [x] done

可以看到,默认的,rabbitmq会一个一个的发送信息给下一个消费者(consumer),而不考虑每个任务的时长等等,且是一次性分配,并非一个一个分配。平均的每个消费者将会获得相等数量的消息。这样分发消息的方式叫做round-robin。

2、消息应答(messageacknowledgments)

执行一个任务需要花费几秒钟。你可能会担心当一个工作者在执行任务时发生中断。我们上面的代码,一旦rabbitmq交付了一个信息给消费者,会马上从内存中移除这个信息。在这种情况下,如果杀死正在执行任务的某个工作者,我们会丢失它正在处理的信息。我们也会丢失已经转发给这个工作者且它还未执行的消息。

上面的例子,我们首先开启两个任务,然后执行发送任务的代码(newtask.java),然后立即关闭第二个任务,结果为:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
工作者2
31054905[*]waitingformessages.toexitpressctrl+c
31054905[x]received'helloworld..2'
31054905[x]done
31054905[x]received'helloworld....4'
工作者1
18019860[*]waitingformessages.toexitpressctrl+c
18019860[x]received'helloworld.1'
18019860[x]done
18019860[x]received'helloworld...3'
18019860[x]done
18019860[x]received'helloworld.....5'
18019860[x]done
18019860[x]received'helloworld.......7'
18019860[x]done
18019860[x]received'helloworld.........9'
18019860[x]done

可以看到,第二个工作者至少丢失了6,8,10号任务,且4号任务未完成。

但是,我们不希望丢失任何任务(信息)。当某个工作者(接收者)被杀死时,我们希望将任务传递给另一个工作者。

为了保证消息永远不会丢失,rabbitmq支持消息应答(messageacknowledgments)。消费者发送应答给rabbitmq,告诉它信息已经被接收和处理,然后rabbitmq可以*的进行信息删除。

如果消费者被杀死而没有发送应答,rabbitmq会认为该信息没有被完全的处理,然后将会重新转发给别的消费者。通过这种方式,你可以确认信息不会被丢失,即使消者偶尔被杀死。

这种机制并没有超时时间这么一说,rabbitmq只有在消费者连接断开是重新转发此信息。如果消费者处理一个信息需要耗费特别特别长的时间是允许的。

消息应答默认是打开的。上面的代码中我们通过显示的设置autoask=true关闭了这种机制。下面我们修改代码(work.java):

?
1
2
3
4
boolean ack = false ; //打开应答机制
channel.basicconsume(queue_name, ack, consumer);
//另外需要在每次处理完成一个消息后,手动发送一次应答。
channel.basicack(delivery.getenvelope().getdeliverytag(), false);

完整修改后的work.java

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
import com.rabbitmq.client.channel;
import com.rabbitmq.client.connection;
import com.rabbitmq.client.connectionfactory;
import com.rabbitmq.client.queueingconsumer;
public class work
{
    //队列名称
    private final static string queue_name = "workqueue";
    public static void main(string[] argv) throws java.io.ioexception,
       java.lang.interruptedexception
     {
        //区分不同工作进程的输出
        int hashcode = work.class.hashcode();
        //创建连接和频道
        connectionfactory factory = new connectionfactory();
        factory.sethost("localhost");
        connection connection = factory.newconnection();
        channel channel = connection.createchannel();
        //声明队列
        channel.queuedeclare(queue_name, false, false, false, null);
        system.out.println(hashcode
            + " [*] waiting for messages. to exit press ctrl+c");
        queueingconsumer consumer = new queueingconsumer(channel);
        // 指定消费队列
        boolean ack = false ;
        //打开应答机制
        channel.basicconsume(queue_name, ack, consumer);
        while (true)
          {
            queueingconsumer.delivery delivery = consumer.nextdelivery();
            string message = new string(delivery.getbody());
            system.out.println(hashcode + " [x] received '" + message + "'");
            dowork(message);
            system.out.println(hashcode + " [x] done");
            //发送应答
            channel.basicack(delivery.getenvelope().getdeliverytag(), false);
        }
    }
}

测试:

我们把消息数量改为5,然后先打开两个消费者(work.java),然后发送任务(newtask.java),立即关闭一个消费者,观察输出:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
[x]sent'helloworld.1'
[x]sent'helloworld..2'
[x]sent'helloworld...3'
[x]sent'helloworld....4'
[x]sent'helloworld.....5'
工作者2
18019860[*]waitingformessages.toexitpressctrl+c
18019860[x]received'helloworld..2'
18019860[x]done
18019860[x]received'helloworld....4'
工作者1
31054905[*]waitingformessages.toexitpressctrl+c
31054905[x]received'helloworld.1'
31054905[x]done
31054905[x]received'helloworld...3'
31054905[x]done
31054905[x]received'helloworld.....5'
31054905[x]done
31054905[x]received'helloworld....4'
31054905[x]done

可以看到工作者2没有完成的任务4,重新转发给工作者1进行完成了。

3、消息持久化(messagedurability)

我们已经学习了即使消费者被杀死,消息也不会被丢失。但是如果此时rabbitmq服务被停止,我们的消息仍然会丢失。

当rabbitmq退出或者异常退出,将会丢失所有的队列和信息,除非你告诉它不要丢失。我们需要做两件事来确保信息不会被丢失:我们需要给所有的队列和消息设置持久化的标志。

第一,我们需要确认rabbitmq永远不会丢失我们的队列。为了这样,我们需要声明它为持久化的。

booleandurable=true;

channel.queuedeclare("task_queue",durable,false,false,null);

注:rabbitmq不允许使用不同的参数重新定义一个队列,所以已经存在的队列,我们无法修改其属性。

第二,我们需要标识我们的信息为持久化的。通过设置messageproperties(implementsbasicproperties)值为persistent_text_plain。

channel.basicpublish("","task_queue",messageproperties.persistent_text_plain,message.getbytes());

现在你可以执行一个发送消息的程序,然后关闭服务,再重新启动服务,运行消费者程序做下实验。

4、公平转发(fairdispatch)

或许会发现,目前的消息转发机制(round-robin)并非是我们想要的。例如,这样一种情况,对于两个消费者,有一系列的任务,奇数任务特别耗时,而偶数任务却很轻松,这样造成一个消费者一直繁忙,另一个消费者却很快执行完任务后等待。

造成这样的原因是因为rabbitmq仅仅是当消息到达队列进行转发消息。并不在乎有多少任务消费者并未传递一个应答给rabbitmq。仅仅盲目转发所有的奇数给一个消费者,偶数给另一个消费者。

为了解决这样的问题,我们可以使用basicqos方法,传递参数为prefetchcount=1。这样告诉rabbitmq不要在同一时间给一个消费者超过一条消息。换句话说,只有在消费者空闲的时候会发送下一条信息。

?
1
2
int prefetchcount = 1;
channel.basicqos(prefetchcount);

Java工作队列代码详解

注:如果所有的工作者都处于繁忙状态,你的队列有可能被填充满。你可能会观察队列的使用情况,然后增加工作者,或者使用别的什么策略。

测试:改变发送消息的代码,将消息末尾点数改为6-2个,然后首先开启两个工作者,接着发送消息:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
[x] sent 'helloworld......6'
[x] sent 'helloworld.....5'
[x] sent 'helloworld....4'
[x] sent 'helloworld...3'
[x] sent 'helloworld..2'
工作者1
18019860 [*] waiting for messages. to exit press ctrl+c
18019860 [x] received 'helloworld......6'
18019860 [x] done
18019860 [x] received 'helloworld...3'
18019860 [x] done
工作者2
31054905 [*] waiting for messages. to exit press ctrl+c
31054905 [x] received 'helloworld.....5'
31054905 [x] done
31054905 [x] received 'helloworld....4'
31054905 [x] done
31054905 [x] received 'helloworld..2'
31054905 [x] done

可以看出此时并没有按照之前的round-robin机制进行转发消息,而是当消费者不忙时进行转发。且这种模式下支持动态增加消费者,因为消息并没有发送出去,动态增加了消费者马上投入工作。而默认的转发机制会造成,即使动态增加了消费者,此时的消息已经分配完毕,无法立即加入工作,即使有很多未完成的任务。

5、完整的代码

newtask.java

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
import java.io.ioexception;
import com.rabbitmq.client.channel;
import com.rabbitmq.client.connection;
import com.rabbitmq.client.connectionfactory;
import com.rabbitmq.client.messageproperties;
public class newtask
{
    // 队列名称
    private final static string queue_name = "workqueue_persistence";
    public static void main(string[] args) throws ioexception
     {
        // 创建连接和频道
        connectionfactory factory = new connectionfactory();
        factory.sethost("localhost");
        connection connection = factory.newconnection();
        channel channel = connection.createchannel();
        // 声明队列
        boolean durable = true;
        // 1、设置队列持久化
        channel.queuedeclare(queue_name, durable, false, false, null);
        // 发送10条消息,依次在消息后面附加1-10个点
        for (int i = 5; i > 0; i--)
          {
            string dots = "";
            for (int j = 0; j <= i; j++)
               {
                dots += ".";
            }
            string message = "helloworld" + dots + dots.length();
            // messageproperties 2、设置消息持久化
            channel.basicpublish("", queue_name,
                 messageproperties.persistent_text_plain, message.getbytes());
            system.out.println(" [x] sent '" + message + "'");
        }
        // 关闭频道和资源
        channel.close();
        connection.close();
    }
}

work.java

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
import com.rabbitmq.client.channel;
import com.rabbitmq.client.connection;
import com.rabbitmq.client.connectionfactory;
import com.rabbitmq.client.queueingconsumer;
public class work
{
    // 队列名称
    private final static string queue_name = "workqueue_persistence";
    public static void main(string[] argv) throws java.io.ioexception,
       java.lang.interruptedexception
     {
        // 区分不同工作进程的输出
        int hashcode = work.class.hashcode();
        // 创建连接和频道
        connectionfactory factory = new connectionfactory();
        factory.sethost("localhost");
        connection connection = factory.newconnection();
        channel channel = connection.createchannel();
        // 声明队列
        boolean durable = true;
        channel.queuedeclare(queue_name, durable, false, false, null);
        system.out.println(hashcode
            + " [*] waiting for messages. to exit press ctrl+c");
        //设置最大服务转发消息数量
        int prefetchcount = 1;
        channel.basicqos(prefetchcount);
        queueingconsumer consumer = new queueingconsumer(channel);
        // 指定消费队列
        boolean ack = false;
        // 打开应答机制
        channel.basicconsume(queue_name, ack, consumer);
        while (true)
          {
            queueingconsumer.delivery delivery = consumer.nextdelivery();
            string message = new string(delivery.getbody());
            system.out.println(hashcode + " [x] received '" + message + "'");
            dowork(message);
            system.out.println(hashcode + " [x] done");
            //channel.basicack(delivery.getenvelope().getdeliverytag(), false);
            channel.basicack(delivery.getenvelope().getdeliverytag(), false);
        }
    }
    /**
  * 每个点耗时1s
  *
  * @param task
  * @throws interruptedexception
  */
    private static void dowork(string task) throws interruptedexception
     {
        for (char ch : task.tochararray())
          {
            if (ch == '.')
                thread.sleep(1000);
        }
    }
}

总结

以上就是本文关于java工作队列代码详解的全部内容,希望对大家有所帮助。如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

原文链接:https://www.2cto.com/kf/201608/541697.html