Zookeeper异常ConnectionLossException解决

时间:2022-04-07 22:26:42

今天安装了CentOS虚拟机,然后写了一个Zookeeper测试程序,这个测试程序连接到运行在本机的Zookeeper服务能够正常运行。

但是当连接到远端的CentOS虚拟机上的Zookeeper服务之后,出现了下面异常:

Exception in thread "main" org.apache.zookeeper.KeeperException$ConnectionLossException: KeeperErrorCode = ConnectionLoss for /test
at org.apache.zookeeper.KeeperException.create(KeeperException.java:99)
at org.apache.zookeeper.KeeperException.create(KeeperException.java:51)
at org.apache.zookeeper.ZooKeeper.exists(ZooKeeper.java:1501)
at org.apache.zookeeper.ZooKeeper.exists(ZooKeeper.java:1529)
at com.jiq.test.ZooKeeperTest.main(ZooKeeperTest.java:12)


不用虚拟机,使用真实服务器也一样有这个异常,换成Windows server 2008服务器也有这个异常,看起来好像访问本机Zookeeper服务就可以,但是访问远端就不行。


上网一查,全是说什么到Zookeeper服务的连接未完成,说是加下面这段代码就好了:

private CountDownLatch connectedSemaphore = new CountDownLatch( 1 );  
    /** 
     * 创建ZK连接 
     * @param connectString  ZK服务器地址列表 
     * @param sessionTimeout   Session超时时间 
     */ 
    public void createConnection( String connectString, int sessionTimeout ) 
    {         
    <span style="white-space:pre"> </span>System.out.println( "开始创建连接" ); 
        try { 
            zk = new ZooKeeper( connectString, sessionTimeout, this ); 
            connectedSemaphore.await();
        } catch (Exception e ) { 
            System.out.println( "连接创建失败,发生 IOException" ); 
            e.printStackTrace(); 
        } 
    } 
      * 收到来自Server的Watcher通知后的处理。      */     @Override     public void process( WatchedEvent event ) {         System.out.println( "收到事件通知:" + event.getState() +"\n"  );         if ( KeeperState.SyncConnected == event.getState() ) {             connectedSemaphore.countDown();         }      } 

我觉得我的情况不属于这种,为什么我的本机可以,远端就不行,难道天生本机就一定能够快速建立好连接,远端就要等一等么?

于是我决定自己思考,想了一天才觉得可能是防火墙问题,于是把windwos server 2008防火墙关闭,OK了,把CentOS防火墙关闭,也OK了!

特别注意:

上面的代码对于避免连接建立完成之前就发出ZooKeeper操作命令出现ConnectionLoss是有用的。

因为new出ZooKeeper实例时只是建立了与服务端之间的会话,此时TCP连接可能还未建立完成,如果这时发出ZooKeeper操作命令的确会出现连接丢失异常,虽然这种概率相对较小。

当客户端与服务端连接建立之后客户端会收到一个SyncConnected事件,此时将connectedSemaphore减到零就可以让阻塞的主线程继续运行,再来发出ZooKeeper操作命令就不会出现连接丢失的异常了。


解决方法: 

Zookeeper版本:zookeeper-3.5.0-alpha

CentOS关闭防火墙命令:

CentOS Linux开启和关闭防火墙命令有两种,一种是临时的,重启即复原;另外一种是永久性的,重启不会复原。1) 临时生效,重启后复原开启: service iptables start关闭: service iptables stop2) 永久性生效,重启后不会复原开启: chkconfig iptables on关闭: chkconfig iptables off

我执行的是永久修改的命令,执行完了也可以不重启电脑,重启防火墙服务即可: service iptables restart

CentOS默认使用的防火墙firewall是没有开放对5672端口的访问的,但是直接将防火墙关闭掉是不安全的做法,建议配置防火墙,放开对ZooKeeper端口的访问即可,配置好了记得重启电脑。


附上我的测试程序:

package com.jiq.test;import org.apache.zookeeper.CreateMode;import org.apache.zookeeper.ZooDefs.Ids;import org.apache.zookeeper.ZooKeeper; public class ZooKeeperTest {     public static void main(String[] args) throws Exception{        ZooKeeper zk = new ZooKeeper("192.168.1.108:2181", 3000, null);        System.out.println("=========创建节点===========");        if(zk.exists("/test", false) == null)        {        	zk.create("/test", "znode1".getBytes(), Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);        }        System.out.println("=============查看节点是否安装成功===============");        System.out.println(new String(zk.getData("/test", false, null)));                System.out.println("=========修改节点的数据==========");        zk.setData("/test", "zNode2".getBytes(), -1);        System.out.println("========查看修改的节点是否成功=========");        System.out.println(new String(zk.getData("/test", false, null)));                System.out.println("=======删除节点==========");        zk.delete("/test", -1);        System.out.println("==========查看节点是否被删除============");        System.out.println("节点状态:" + zk.exists("/test", false));        zk.close();    } }


运行结果:

=========创建节点========================查看节点是否安装成功===============znode1=========修改节点的数据==================查看修改的节点是否成功=========zNode2=======删除节点====================查看节点是否被删除============节点状态:null