基于Pgpool-II4.1.0搭建PostgreSQL11集群

Pgpool介绍

pgpool相关介绍不在该文章中,需要者可以参考我的另一篇文章。传送门:pgpool介绍

环境准备

本次使用三台CentOS7.3的服务器来搭建集群,首先在三台服务器上部署PostgreSQL11.6版本的数据库,部署教程大家可以网上自行查找。具体规划如下:

架构图参考官网:

搭建配置

01服务器配置

故障转移、在线恢复时需要ssh到其它服务器执行命令,故需要配置服务器之间无密码ssh登录(如服务器之间已经配置ssh可以跳过该节,但是需要修改failover.sh等脚本)

     [all servers]# cd ~/.ssh
     [all servers]# ssh-keygen -t rsa -f id_rsa_pgpool
     [all servers]# ssh-copy-id -i id_rsa_pgpool.pub postgres@server1
     [all servers]# ssh-copy-id -i id_rsa_pgpool.pub postgres@server2
     [all servers]# ssh-copy-id -i id_rsa_pgpool.pub postgres@server3
     
     [all servers]# su  postgres
     [all servers]$ cd ~/.ssh
     [all servers]$ ssh-keygen -t rsa -f id_rsa_pgpool
     [all servers]$ ssh-copy-id -i id_rsa_pgpool.pub postgres@server1
     [all servers]$ ssh-copy-id -i id_rsa_pgpool.pub postgres@server2
     [all servers]$ ssh-copy-id -i id_rsa_pgpool.pub postgres@server3

02pgpool安装

pgpool安装不在该文章中介绍,需要者可以参考我另一篇文章。传送门:pgpool安装。

03PostgreSQL数据库配置

  • WAL归档,需要WAL归档的可自行配置,该示例暂时未使用WAL归档
    [all servers]# su - postgres
    [all servers]$ mkdir /var/lib/pgsql/archivedir
    ## postgres.conf 配置
    archive_mode = on
    archive_command = 'cp "%p" "/var/lib/pgsql/archivedir/%f"'

这儿有一个归档的脚本,使用该脚本可以自行修改保留多少天归档 pg_archive.sh

  • postgres.conf配置,该配置仅在主节点配置,从节点使用pgpool的在线恢复功能配置
   listen_addresses = '*'
   port = 5432
     max_wal_senders = 10
     max_replication_slots = 10
     wal_level = replica
     hot_standby = on
     wal_log_hints = on
  • 数据库用户以及密码配置

    [server1]# psql -U postgres -p 5432
     postgres=# CREATE ROLE pgpool WITH LOGIN PASSWORD 'pgpool';
     postgres=# CREATE ROLE repl WITH REPLICATION LOGIN PASSWORD 'repl';
     ## 用于SHOW POOL_NODES 展示 "replication_state" and "replication_sync_state" 
     postgres=# GRANT pg_monitor TO pgpool;
  • pg_hba.con配置,添加用户验证配置,将repl复制用户添加到pg_hba中。此文档中所有密码使用md5验证。
  host    all             all             0.0.0.0/0               md5
  host    replication     repl            0.0.0.0/0               md5
  • 配置.pgpass文件用于无密码操作

由于在故障转移、在线恢复时使用脚本进行操作,脚本中使用pg_basebakup、pg_rewind等命令,所以需要配置无密码操作

在postgres用户的home目录下创建.pgpass文件,并且文件权限为600。

   [all servers]# su - postgres
     [all servers]$ vi ~/.pgpass
     ## 格式为:hostname:port:database:username:password
     server1:5432:replication:repl:<repl user password>
     server2:5432:replication:repl:<repl user passowrd>
     server3:5432:replication:repl:<repl user passowrd>
     server1:5432:postgres:postgres:<postgres user passowrd>
     server2:5432:postgres:postgres:<postgres user passowrd>
     server3:5432:postgres:postgres:<postgres user passowrd>
     [all servers]$ chmod 600  ~/.pgpass

04pgpool配置

1、# cp -p /usr/local/pgpool/etc/pgpool.conf.sample-stream /usr/local/pgpool/etc/pgpool.conf

2、配置PostgreSQL数据库信息

    # - Backend Connection Settings -
    
  # 有几台PostgreSQL数据库,配置几个后端信息,使用后缀名0、1、2……
  
    backend_hostname0 = 'server1' # Host name or IP address to connect to for backend 0
    backend_port0 = 5432 # Port number for backend 0
    backend_weight0 = 1 # Weight for backend 0 (only in load balancing mode)
    backend_data_directory0 = '/data/pgsql/sport/' # Data directory for backend 0
    # Controls various backend behavior
    # ALLOW_TO_FAILOVER or DISALLOW_TO_FAILOVER
    backend_flag0 = 'ALLOW_TO_FAILOVER' 
    
    backend_hostname1 = 'server2'
    backend_port1 = 5432
    backend_weight1 = 1
    backend_data_directory1 = '/var/lib/pgsql/11/data'
    backend_flag1 = 'ALLOW_TO_FAILOVER'

    backend_hostname2 = 'server3'
    backend_port2 = 5432
    backend_weight2 = 1
    backend_data_directory2 = '/var/lib/pgsql/11/data'
    backend_flag2 = 'ALLOW_TO_FAILOVER'

3、基础配置

  listen_addresses = '*'
  pid_file_name = '/var/run/pgpool/pgpool.pid'
                                   # PID file name
                                   # Can be specified as relative to the"
                                   # location of pgpool.conf file or
                                   # as an absolute path
                                   # (change requires restart)
  logdir = '/var/run/pgpool'
                                   # Directory of pgPool status file
                                   # (change requires restart)

创建pgpool运行需要目录mkdir -p /var/run/pgpool

4、配置复制延迟检查

 sr_check_user = 'pgpool'
  ## 自从4.0版本后,如果密码设置为的话,pgpool会首先从`pool_passwd`文件中获取密码,然后在使用空密码
    sr_check_password = 'pgpool'

5、配置健康检查

   # Health check period
   # Disabled (0) by default
   health_check_period = 5
   
   # Health check timeout
   # 0 means no timeout
   health_check_timeout = 30

   health_check_user = 'pgpool'
   health_check_password = 'pgpool'

   health_check_max_retries = 3

6、配置故障转移

   failover_command = '/usr/locla/pgpool/etc/failover.sh %d %h %p %D %m %H %M %P %r %R %N %S'
   follow_master_command = '/usr/locla/pgpool/etc/follow_master.sh %d %h %p %D %m %H %M %P %r %R'

关于脚本会在后面给出下载地址以及脚本使用说明

# 给脚本设置执行权限,注意:该脚本需要在三台pgpool服务器中都需要创建
chmod +x /usr/local/pgpoll/etc/{failover.sh,follow_master.sh}

7、配置在线恢复

为了使用Pgpool-II执行在线恢复,我们需要配置PostgreSQL用户名和在线恢复命令recovery_1st_stage。由于执行在线恢复需要PostgreSQL中的超级用户特权,因此我们在recovery_user中指定postgres用户。然后,我们在PostgreSQL主服务器(server1)的数据库目录中创建recovery_1st_stage和pgpool_remote_start,并添加执行权限。

   recovery_user = 'postgres'
   # Online recovery user
   recovery_password = 'postgres'
   # Online recovery password

   recovery_1st_stage_command = 'recovery_1st_stage'
## 该脚本只需要在数据库主节点创建,后续使用在线恢复时会复制过去
   [server1]# su - postgres
   [server1]$ vi /data/pgsql/sport/recovery_1st_stage
   [server1]$ vi /data/pgsql/sport/pgpool_remote_start
   [server1]$ chmod +x /data/pgsql/sport/{recovery_1st_stage,pgpool_remote_start}

数据库创建扩展,该扩展是为了能够执行在线恢复(如果在安装时已经创建该扩展则可以跳过该步骤)

    [server1]# su - postgres
    [server1]$ psql template1 -c "CREATE EXTENSION pgpool_recovery"

8、配置客户端身份验证

## pgpool.conf中
enable_pool_hba = on</code>

身份验证文件为/usr/local/pgpool/etc/pool_hba.conf,配置方式与PostgreSQL基本一样。(scram-sha-256方式可参考pgpool官网)

<code>  host    all         pgpool           0.0.0.0/0          md5
    host    all         postgres         0.0.0.0/0          md5</code>

<code>cd /usr/local/pgpool/etc
../bin/pg_md5 -p -m -u postgres pool_passwd
../bin/pg_md5 -p -m -u pgpool pool_passwd
cat /etc/pgpool-II/pool_passwd 
    # pgpool:AESheq2ZMZjynddMWk5sKP/Rw==
    # postgres:AESHs/pWL5rtXy2IwuzroHfqg==

9、看门狗配置

use_watchdog = on
delegate_IP = '192.168.111.6' ##vip配置
## 网卡名字需要正确配置
if_up_cmd = '/usr/bin/sudo /sbin/ip addr add $_IP_$/24 dev enp0s8 label enp0s8:0'
if_down_cmd = '/usr/bin/sudo /sbin/ip addr del $_IP_$/24 dev enp0s8'
arping_cmd = '/usr/bin/sudo /usr/sbin/arping -U $_IP_$ -w 1 -I enp0s8'

配置其它pgpool信息,注意:该配置在三台服务器不一样,只需要配置另外几台即可
[server1配置如下]
      # - Other pgpool Connection Settings -
      
     other_pgpool_hostname0 = 'server2'
      other_pgpool_port0 = 9999
      other_wd_port0 = 9000
      
      other_pgpool_hostname1 = 'server3'
      other_pgpool_port1 = 9999
      other_wd_port1 = 9000

      heartbeat_destination0 = 'server2'
      heartbeat_destination_port0 = 9694
      heartbeat_device0 = ''

      heartbeat_destination1 = 'server3'
      heartbeat_destination_port1 = 9694
      heartbeat_device1 = ''
[server2配置如下]
      # - Other pgpool Connection Settings -

      other_pgpool_hostname0 = 'server1'
      other_pgpool_port0 = 9999
      other_wd_port0 = 9000
      
      other_pgpool_hostname1 = 'server3'
      other_pgpool_port1 = 9999
      other_wd_port1 = 9000

      heartbeat_destination0 = 'server1'
      heartbeat_destination_port0 = 9694
      heartbeat_device0 = ''

      heartbeat_destination1 = 'server3'
      heartbeat_destination_port1 = 9694
      heartbeat_device1 = ''
  [server3配置如下]
      # - Other pgpool Connection Settings -

      other_pgpool_hostname0 = 'server1'
      other_pgpool_port0 = 9999
      other_wd_port0 = 9000
      
      other_pgpool_hostname1 = 'server2'
      other_pgpool_port1 = 9999
      other_wd_port1 = 9000

      heartbeat_destination0 = 'server1'
      heartbeat_destination_port0 = 9694
      heartbeat_device0 = ''

      heartbeat_destination1 = 'server2'
      heartbeat_destination_port1 = 9694
      heartbeat_device1 = ''

10、pcp命令配置

cd /usr/local/pgpool/bin
echo 'pgpool:'`pg_md5 pgpool` >> /usr/local/pgpool/etc/pcp.conf

以上pgpool相关配置都配置完成,最终会生成pgpool.conf、pool_hba.conf、pool_passwd、pcp.conf,可以配置完一台后,在其它服务器copy配置文件即可。注意:pgpool.conf中看门狗配置需要在其它服务器修改一下。

05相关脚本

此处一共需要四个脚本分别为:

  • failover.sh 目录为: /usr/local/pgpool/etc/下
  • follow_master.sh 目录为: /usr/local/pgpool/etc/下
  • recovery_1st_stage 目录为:PostgreSQL数据库数据目录下
  • pgpool_remote_start目录为:PostgreSQL数据库数据目录下

脚本地址:https://github.com/MrSmallLiu/pgpool

脚本参考于官网,但是稍有改动:

  • 创建与删除复制槽时,如果使用ip地址,则会报错,因为名字不允许有.,修改:${FAILED_NODE_HOST//./_}
  • follow_master.sh脚本中一处bug
# drop replication slot
            ssh -T -o StrictHostKeyChecking=no -o UserKnownHostsFile=/dev/null postgres@${NEW_MASTER_NODE_HOST} -i ~/.ssh/id_rsa_pgpool "
                ${PGHOME}/bin/psql -p ${NEW_MASTER_NODE_PORT} -c \"SELECT pg_drop_replication_slot('${FAILED_NODE_HOST//./_}')\"
            "


注意:

  • 注意所有脚本中 PGHOME变量为PostgreSQL安装路径
  • 注意所有脚本中ARCHIVEDIR,如果未使用,需要将其注释,并且修改相应使用地方
  • 注意所有脚本中PGPOOL_PATH变量为pgpool的bin路径
  • 注意recovery_1st_stage脚本中PRIMARY_NODE_HOST变量,该变量取hostname值,可以先在自己服务器测试一下该命令是否符合预期。不符合者使用hostnamectl set-hostname server1

启动

  • 后台运行   /usr/local/pgpool/bin/pgpool
  • debug运行   /usr/local/pgpool/bin/pgpool -n -d    /usr/local/pgpool/bin/pgpool -n
  • standby 数据库启动
-n 表示在pgpool.conf配置文件中PostgreSQL配置的后面的序号
  /usr/local/pgpool/bin/pcp_recovery_node -h 192.168.111.6 -p 9898 -U pgpool -n 1
  Password: 
    pcp_recovery_node -- Command Successful
    
  /usr/local/pgpool/bin/pcp_recovery_node -h 192.168.111.6 -p 9898 -U pgpool -n 2
  Password: 
    pcp_recovery_node -- Command Successful

停止

/usr/local/pgpool/bin/pgpool -m fast stop

测试

  • 使用客户端连接(navicat、pgAdmin等)psql -h 192.168.111.6 -p 9999 -U passwd:postgres
  • 执行show pool_nodes

负载均衡测试

可以配置PostgreSQL日志打印sql语句,使用vip地址连接上后测试输出即可看到查询会负载到三台服务器(默认根据连接使用负载均衡,需要几次新建查询来测试)

自动故障转移测试

可以使用PostgreSQL命令停掉主节点数据库来测试故障转移

写在最后

  • 以上配置经过我们部署测试是可以正常运行的,但是是后续整理才写的该篇文章,可能存在遗漏不足的地方。小伙伴在配置过程中有疑惑、配置后未能正常启动、有文档意见都可以与我联系。随时欢迎提给我,然后我进行修改文档,以帮助更多人。
  • 后面抽时间整理一个pgpool的部署流程图,方便大家理解部署流程。
  • 关于配置文件的具体讲解以及优化会在后面再写相关文档,欢迎持续关注

关于该文章,欢迎各位批评指正

关于作者

GISer
小刘先森
QQ: 1016817543
邮箱:1016817543@qq.com
github:https://github.com/MrSmallLiu (欢迎star)

刘航,国信司南(北京)地理信息技术有限公司,技术经理。负责过多个基于 PostgreSQL 数据库以及 PostGIS 的大中型项目。公司矢量切片产品(基于 PostgreSQL 数据库)研发核心人员。