Linux 笔记 - 第二十章 配置 Nginx 反向代理和负载均衡

时间:2022-01-06 14:31:21

一、简介

由于 Nginx 的反向代理和负载均衡功能经常被提及,所以将这两个功能单独提出来进行讲解。

Linux 笔记 - 第二十章 配置 Nginx 反向代理和负载均衡

Nginx 其实仅仅是作为 Nginx Proxy 反向代理使用的,因为这个反向代理功能表现的效果是负载均衡集群的效果,所以将其称之为 Nginx 负载均衡。那么,反向代理和负载均衡有什么区别呢?

普通负载均衡软件,例如大名鼎鼎的 LVS,其实功能只是对请求数据包的转发(也可能会改写数据包),传递,其中 DR 模式明显的特征是从负载均衡下面的节点服务器来看,接收到的请求还是来自访问负载均衡器的客户端的真实用户,而反向代理就不一样了,反向代理接收访问用户的请求后,会代理用户重新发起请求代理下的节点服务器,最后把数据返回给客户端用户,在节点服务器看来,访问的节点服务器的客户端用户就是反向代理服务器了,而非真实的网站访问用户。

所以说,LVS 等的负载均衡是转发用户请求的数据包,而 Nginx 反向代理是接收用户的请求然后重新发起请求去请求其后面的节点。

Linux 笔记 - 第二十章 配置 Nginx 反向代理和负载均衡

实现 Nginx 负载均衡的组件主要有两个:

Linux 笔记 - 第二十章 配置 Nginx 反向代理和负载均衡

1)proxy_pass 指令属于 ngx_http_proxy_module 模块,此模块可以将请求转发到另一台服务器,在实际的反向代理工作中,会通过 location 功能匹配指定的 URI,然后把接收到的符合匹配 URI 的请求通过 proxy_pass 抛给定义好的 upstream 节点池。

2)Nginx 的负载均衡功能依赖于 ngx_http_upsteam_module 模块,所支持的代理方式包括 proxy_pass,fastcgi_pass,memcached_pass 等,新版 Nginx 软件支持的方式有所增加。本文主要讲解 proxy_pass 代理方式。
ngx_http_upstream_module 模块允许 Nginx 定义一组或多组节点服务器组,使用时可以通过 proxy_pass 代理方式把网站的请求发送到事先定义好的对应 Upstream 组的名字上,具体写法为 "proxy_pass http://www_server_pools",其中 www_server_pools 就是一个Upstream 节点服务器组名字。

Nginx 反向代理重要参数:

Linux 笔记 - 第二十章 配置 Nginx 反向代理和负载均衡

二、Nginx 反向代理

Nginx 反向代理是指当用户访问 Web 服务器时,网络可能不互通,因为大部分 Web 服务器只有私网 IP,若想访问该 Web 服务器,可以再找一台服务器,让这台服务器不仅能够和 Web 服务器进行互通,而且还能和用户进行互通,这台服务器就是反向代理服务器,因为它代理的是服务器端,而不是客户端。

首先 yum 安装 nginx,然后进入到 /etc/nginx 目录下面,创建虚拟主机目录 vhost,并创建一个新的虚拟主机配置文件 proxy.conf,如下:

[root@masternode nginx]# mkdir /etc/nginx/vhost
[root@masternode nginx]# vim /etc/nginx/vhost/proxy.conf
server {
listen ;
server_name www.baidu.com; location / {
proxy_pass http://14.215.177.39;
proxy_set_header HOST $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
}
}

上面的配置表示代理到 www.baidu.com,proxy_pass 指令属于 ngx_http_proxy_module 模块,此模块可以将请求转发到另一台服务器,在实际的反向代理工作中,会通过 location 功能匹配指定的URI,然后把接收到的符合匹配URI的请求通过 proxy_pass 抛给定义好的upstream 节点池。

然后,修改 nginx 主配置文件 nginx.conf,如下:

[root@masternode nginx]# vi /etc/nginx/nginx.conf

在结束符号 } 上面一行添加:

include vhost/*.conf;

这样就表示 nginx 在启动的时候,会加载 vhost 目录下面所有的 conf 文件。

检查 nginx 配置文件有无错误,如下:

[root@masternode nginx]# nginx -t
nginx: the configuration file /etc/nginx/nginx.conf syntax is ok
nginx: configuration file /etc/nginx/nginx.conf test is successful

启动 nginx,并访问,如下验证:

Linux 笔记 - 第二十章 配置 Nginx 反向代理和负载均衡

可以正常通过 nginx 反向代理访问到 www.baidu.com。

Linux 笔记 - 第二十章 配置 Nginx 反向代理和负载均衡

而访问其他域名时,由于没有代理到其他域名,因此,只能返回 Nginx 的默认首页。

三、Nginx 负载均衡

代理一台服务器称作代理,代理两台或两台以上的服务器称作负载均衡。代理服务器后面可以是多台 Web 服务器,多台 Web 服务器提供服务时即可实现负载均衡的功能。正常情况下,如果不加代理服务,用户访问 Web 服务器只能一台一台地去请求,或者指定 IP,或者把域名解析到多台服务器上,使得用户一访问 A 服务器、用户二访问 B 服务器,以此类推。虽然这样操作也可以,但不太友好,如果 A 服务器宕机了,用户一因解析到了 A 服务器,就不能够访问该网站。

采用 Nginx 负载均衡后,若 A 服务器宕机,代理服务器就不会把请求发给 A 服务器。Nginx 负载均衡借助 upstream 模块,在 proxy_pass 处不能定义多个 IP,但在 upstream 下面可以定义多个 IP。

下面以 www.baidu.com 来验证,使用 dig 命令可以查看域名解析的 IP 地址,如未安装,使用 yum 安装即可,如下:

[root@masternode vhost]# yum install -y bind-utils
[root@masternode vhost]# dig www.baidu.com
......
;; ANSWER SECTION:
www.baidu.com. IN CNAME www.a.shifen.com.
www.a.shifen.com. IN A 14.215.177.38
www.a.shifen.com. IN A 14.215.177.39
......

可以看到在 dns 解析过程中,www.baidu.com 作为 cname 记录(相当于别名),在 dns 服务器中配置了 www.baidu.com 跳转到 www.a.shifen.com 的映射记录。而 www.a.shifen.com 是作为 A(address)记录,映射到了真实的 IP 信息。

创建负载均衡配置文件 load-balance.conf,如下:

[root@masternode vhost]# vim /etc/nginx/vhost/load-balance.conf
upstream baidu_com {
#ip_hash 是nginx的一种负载均衡算法,该算法会让相同的客户端ip请求相同的服务器
ip_hash;
server 14.215.177.38:80;#定义真实server地址
server 14.215.177.39:80;
}
server {
listen ;#监听端口
server_name www.baidu.com;#网站域名 location / {
proxy_pass http://baidu_com;
proxy_set_header HOST $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
}
}

停止 nginx 服务,移除之前的反向代理配置文件 proxy.conf,然后重启 nginx,通常情况下, curl -x127.0.0.1:80 www.baidu.com 会返回 nginx 的默认页面,但是重载完 load-balance.conf 之后,重新访问百度,则会正常显示百度首页,如下:

Linux 笔记 - 第二十章 配置 Nginx 反向代理和负载均衡

Nginx 不支持代理 HTTPS,server 后面如果写 443 端口是不支持的,Nginx 只能代理 HTTP 和 TCP。若想代理 HTTPS,让用户看到 HTTPS,后端服务器必须是 80  端口,在代理服务器上监听 443 端口,用代理服务器的 443 端口返回给用户。