thinkphp 分布式数据库 详解

时间:2022-09-24 14:33:02

1.分布式数据库是什么:

  tp的分布式数据库主要是通过该配置:

  'DB_DEPLOY_TYPE'        =>  1,// 数据库部署方式:0 集中式(单一服务器),1 分布式(主从服务器)

2.主从服务器的读写分离是什么:

   主从数据库即为一个主数据库会有对应n个从数据库,而从数据库只能有一个对应的从数据库。主从数据库中写的操作需要使用主数据库,而读操作使用从数据库。主数据库与从数据库始终保持数据一致性。其中保持数据库一致的原理即为当主数据库数据发生变化时,会将操作写入到主数据库日志中,而从数据库会不停的读取主数据库的日志保存到自己的日志系统中,然后进行执行,从而保持了主从数据库一致。

3.详解

一、单一数据库的连接

在使用的时候,单一数据库的连接配置非常简单。我们只需要在配置文件中配置一下的信息即可。

[html] view plain copy
  1. 'DB_TYPE' => 'mysql',  
  2. 'DB_HOST' => '192.168.5.102',  
  3. 'DB_NAME' => 'databasename',  
  4. 'DB_USER' => 'user',  
  5. 'DB_PWD' => 'password',  
  6. 'DB_PORT' => '3306',  
  7. 'DB_PREFIX' => 'onmpw_',  


设置完成以后就可以使用了。默认情况下就是单一的数据库连接。

二、分布式数据库的连接

单一数据库的连接很简单,我们着重分析一下分布式数据库的连接。

[html] view plain copy
  1. 'DB_TYPE' => 'mysql',  
  2. 'DB_HOST' => '192.168.5.191,192.168.5.88,192.168.5.103',  
  3. 'DB_NAME' => 'test,test,test',  
  4. 'DB_USER' => 'masteruser,slaveuser,slaveuser',  
  5. 'DB_PWD' => 'masterpass,slavepass,slavepass',  
  6. 'DB_PORT' => '3306',  
  7. 'DB_PREFIX' => '',  
  8. 'DB_DEPLOY_TYPE'        =>  1, // 数据库部署方式:0 集中式(单一服务器),1 分布式(主从服务器)  
  9. 'DB_RW_SEPARATE'        =>  true,       // 数据库读写是否分离 主从式有效  
  10. 'DB_MASTER_NUM'         =>  1, // 读写分离后 主服务器数量  
  11. 'DB_SLAVE_NO'           =>  '', // 指定从服务器序号  


按照以上配置就可以连接分布式数据库了。

下面我们看下面几个选项

‘DB_HOST’

分布式数据库,有几台服务器就要填写几个服务器地址,每个地址之间用逗号隔开。如果是主从式分布的话,前面的地址要是主数据库的地址。

对于下面的用户名和密码还有监听端口之类的,当然是有几个就写几个。如果各个数据库的用户名和密码都一样的话,可以只写一个。

对于这些选项的解析的代码如下

[html] view plain copy
  1. $_config['username']  =   explode(',',$this->config['username']);  
  2. $_config['password']  =   explode(',',$this->config['password']);  
  3. $_config['hostname']  =   explode(',',$this->config['hostname']);  
  4. $_config['hostport']   =   explode(',',$this->config['hostport']);  
  5. $_config['database']  =   explode(',',$this->config['database']);  
  6. $_config['dsn']      =   explode(',',$this->config['dsn']);  
  7. $_config['charset']   =   explode(',',$this->config['charset']);  


‘DB_DEPLOY_TYPE’=>1

1 表示是分布式, 0 表示的是集中式(也就是单一服务器)。

该选项的实现是在类 Think\Db\Dirver中

[html] view plain copy
  1. protected function initConnect($master=true) {  
  2.     if(!empty($this->config['deploy']))  
  3.        // 采用分布式数据库  
  4.        $this->_linkID = $this->multiConnect($master);  
  5.     else  
  6.        // 默认单数据库  
  7.        if ( !$this->_linkID ) $this->_linkID = $this->connect();  
  8. }  


$this->config[‘deploy’]表示的就是’DB_DEPLOY_TYPE’这个配置选项,上面的配置在使用之前都已经经过解析了,配置项都在$this->config数组中。至于是如何解析配置文件的,这里我们不做介绍,感兴趣的可以参考Think\Db类。

$this->multiConnect()函数就是用来进行分布式连接的,如果’DB_DEPLOY_TYPE’选项设置为1,该函数就会执行。否则直接执行$this->connect()函数。

‘DB_RW_SEPARATE’=>true

true 表示读写分离;false表示读写不分离。

这里需要注意的是,读写分离是以主从式数据库系统为前提的。该选项设置为true的时候主数据库写,从数据库读。

[html] view plain copy
  1. if($this->config['rw_separate']){  
  2.       // 主从式采用读写分离  
  3.       if($master)  
  4.           // 主服务器写入  
  5.           $r  =   $m;  
  6.       else{  
  7.           if(is_numeric($this->config['slave_no'])) {// 指定服务器读  
  8.               $r = $this->config['slave_no'];  
  9.           }else{  
  10.                // 读操作连接从服务器  
  11.               $r = floor(mt_rand($this->config['master_num'],count($_config['hostname'])-1));   // 每次随机连接的数据库  
  12.           }  
  13.             }  
  14. }else{  
  15.       // 读写操作不区分服务器  
  16.       $r = floor(mt_rand(0,count($_config['hostname'])-1));   // 每次随机连接的数据库  
  17. }  


$this->config[‘rw_separate’] 为true的时候采用读写分离,为false的时候读写不分离。读写分离为什么必须是主从式的呢?因为从服务器不能写只能读,如果向从服务器写入数据的话,数据是没法同步的。这样就会造成数据不一致的情况。所以说,如果我们的系统是主从式的话,我们必须采用读写分离。也就是说DB_RW_SEPARATE选项必须配置为true。

'DB_MASTER_NUM'=>1

该选项后面的数字表示读写分离后,主服务器的数量。因此该选项也是用于主从式数据库系统。

下面的代码是选择主服务器。

$m  =  floor(mt_rand(0,$this->config['master_num']-1));

主从式数据库读取的时候选择从服务器读的核心代码

$r = floor(mt_rand($this->config['master_num'],count($_config['hostname'])-1));   // 每次随机连接的数据库

其中$this->config[‘master_num’]表示主服务器的数量。

'DB_SLAVE_NO'=> ''

指定从服务器的序号,用于读取数据。如果不设置,则根据主服务器的数量计算书从服务器的数量,然后从中随机选取一台进行读取。

if(is_numeric($this->config['slave_no'])) {// 指定服务器读
   $r = $this->config['slave_no'];
}else{
   // 读操作连接从服务器
   $r = floor(mt_rand($this->config['master_num'],count($_config['hostname'])-1));   // 每次随机连接的数据库
}

以上是对每个选项的作用的实现代码进行了一个简单的说明。

下面我们来看其连接的部分

[html] view plain copy
  1. if($m != $r ){  
  2.    $db_master  =  array(  
  3.       'username' =>  isset($_config['username'][$m])?$_config['username'][$m]:$_config['username'][0],  
  4.       'password'  =>  isset($_config['password'][$m])?$_config['password'][$m]:$_config['password'][0],  
  5.       'hostname'  =>  isset($_config['hostname'][$m])?$_config['hostname'][$m]:$_config['hostname'][0],  
  6.       'hostport'  =>  isset($_config['hostport'][$m])?$_config['hostport'][$m]:$_config['hostport'][0],  
  7.       'database'  =>  isset($_config['database'][$m])?$_config['database'][$m]:$_config['database'][0],  
  8.       'dsn'  =>  isset($_config['dsn'][$m])?$_config['dsn'][$m]:$_config['dsn'][0],  
  9.       'charset'  =>  isset($_config['charset'][$m])?$_config['charset'][$m]:$_config['charset'][0],  
  10.     );  
  11. }  
  12. $db_config = array(  
  13.    'username'  =>  isset($_config['username'][$r])?$_config['username'][$r]:$_config['username'][0],  
  14.     'password'  =>  isset($_config['password'][$r])?$_config['password'][$r]:$_config['password'][0],  
  15.     'hostname'  =>  isset($_config['hostname'][$r])?$_config['hostname'][$r]:$_config['hostname'][0],  
  16.     'hostport'  =>  isset($_config['hostport'][$r])?$_config['hostport'][$r]:$_config['hostport'][0],  
  17.      'database'  =>  isset($_config['database'][$r])?$_config['database'][$r]:$_config['database'][0],  
  18.      'dsn'  =>  isset($_config['dsn'][$r])?$_config['dsn'][$r]:$_config['dsn'][0],  
  19.      'charset'   =>  isset($_config['charset'][$r])?$_config['charset'][$r]:$_config['charset'][0],  
  20. );  
  21. return $this->connect($db_config,$r,$r == $m ? false : $db_master);  


看到这,我觉得大家应该对上面在介绍各个配置选项的代码的时候其中的$r和$m是什么作用了。

现在我们来看 $r == $m ? false : $db_master ,如果数据库读写不分离的情况下,读写是一台服务器的话 传给connect函数的值为false。或者是如果是主从分离的写的情况下传给connect的值也为false。通过上面代码我们看到,如果$r和$m不相等的情况下,会设置$db_master。其实也就是相当于一台备用的,如果选择的$r服务器出现故障不能连接,将会去连接$db_master。

connect()函数的第三个参数其实是表示当$db_config这台服务器连接故障时是否选择备用的连接。false表示不重连,其它值即表示重新连接。

其核心代码如下

[html] view plain copy
  1. try{  
  2.    if(empty($config['dsn'])) {  
  3.       $config['dsn']  =   $this->parseDsn($config);  
  4.    }  
  5.    if(version_compare(PHP_VERSION,'5.3.6','<=')){  
  6.        // 禁用模拟预处理语句  
  7.        $this->options[PDO::ATTR_EMULATE_PREPARES]  =   false;  
  8.    }  
  9.    $this->linkID[$linkNum] = new PDO( $config['dsn'], $config['username'], $config['password'],$this->options);  
  10. }catch (\PDOException $e) {  
  11.    if($autoConnection){ //$autoConnection不为false,而是默认的主服务器  
  12.         trace($e->getMessage(),'','ERR');  
  13.             return $this->connect($autoConnection,$linkNum);  //出现异常,使用递归函数重新连接  
  14.         }elseif($config['debug']){  
  15.             E($e->getMessage());  
  16.     }  
  17. }  


这种方式,对于主从式来说,$r和$m肯定不会相同。因此如果说在读取数据的时候,选择的那台从服务器出现故障的话,那主服务器即是备用的,最后会去主服务器读取。能保证数据读取的时效性。