高并發(fā)之負載均衡
發(fā)布日期:2022/9/22 14:21:51 瀏覽量:
面對大量用戶訪問、高并發(fā)請求,海量數(shù)據(jù),可以使用高性能的服務器、大型數(shù)據(jù)庫,存儲設(shè)備,高性能Web服務器,采用高效率的編程語言比如(Java)等,當單機容量達到極限時,我們需要考慮業(yè)務拆分和分布式部署,來解決大型網(wǎng)站訪問量大,并發(fā)量高,海量數(shù)據(jù)的問題。
從單機網(wǎng)站到分布式網(wǎng)站,很重要的區(qū)別是業(yè)務拆分和分布式部署,將應用拆分后,部署到不同的機器上,實現(xiàn)大規(guī)模分布式系統(tǒng)。分布式和業(yè)務拆分解決了,從集中到分布的問題,但是每個部署的獨立業(yè)務還存在單點的問題和訪問統(tǒng)一入口問題,為解決單點故障,我們可以采取冗余的方式。將相同的應用部署到多臺機器上。解決訪問統(tǒng)一入口問題,我們可以在集群前面增加負載均衡設(shè)備,實現(xiàn)流量分發(fā)。
負載均衡(Load Balance),意思是將負載(工作任務,訪問請求)進行平衡、分攤到多個操作單元(服務器,組件)上進行執(zhí)行。是解決高性能,單點故障(高可用),擴展性(水平伸縮)的終極解決方案。
負載均衡原理
系統(tǒng)的擴展可分為縱向(垂直)擴展和橫向(水平)擴展??v向擴展,是從單機的角度通過增加硬件處理能力,比如CPU處理能力,內(nèi)存容量,磁盤等方面,實現(xiàn)服務器處理能力的提升,不能滿足大型分布式系統(tǒng)(網(wǎng)站),大流量,高并發(fā),海量數(shù)據(jù)的問題。因此需要采用橫向擴展的方式,通過添加機器來滿足大型網(wǎng)站服務的處理能力。比如:一臺機器不能滿足,則增加兩臺或者多臺機器,共同承擔訪問壓力。這就是典型的集群和負載均衡架構(gòu):如下圖:
負載均衡的方式
1.應用集群:將同一應用部署到多臺機器上,組成處理集群,接收負載均衡設(shè)備分發(fā)的請求,進行處理,并返回相應數(shù)據(jù)。
2.負載均衡設(shè)備:將用戶訪問的請求,根據(jù)負載均衡算法,分發(fā)到集群中的一臺處理服務器。(一種把網(wǎng)絡(luò)請求分散到一個服務器集群中的可用服務器上去的設(shè)備)
負載均衡的作用(解決的問題)
1.解決并發(fā)壓力,提高應用處理性能(增加吞吐量,加強網(wǎng)絡(luò)處理能力);
2.提供故障轉(zhuǎn)移,實現(xiàn)高可用;
3.通過添加或減少服務器數(shù)量,提供網(wǎng)站伸縮性(擴展性);
4.安全防護;(負載均衡設(shè)備上做一些過濾,黑白名單等處理)
負載均衡分類
根據(jù)實現(xiàn)技術(shù)不同,可分為DNS負載均衡,HTTP負載均衡,IP負載均衡,鏈路層負載均衡等。
DNS負載均衡
最早的負載均衡技術(shù),利用域名解析實現(xiàn)負載均衡,在DNS服務器,配置多個A記錄,這些A記錄對應的服務器構(gòu)成集群。大型網(wǎng)站總是部分使用DNS解析,作為第一級負載均衡。如下圖:
優(yōu)點
使用簡單:負載均衡工作,交給DNS服務器處理,省掉了負載均衡服務器維護的麻煩
提高性能:可以支持基于地址的域名解析,解析成距離用戶最近的服務器地址,可以加快訪問速度,改善性能;
缺點
可用性差:DNS解析是多級解析,新增/修改DNS后,解析時間較長;解析過程中,用戶訪問網(wǎng)站將失??;
擴展性低:DNS負載均衡的控制權(quán)在域名商那里,無法對其做更多的改善和擴展;
維護性差:也不能反映服務器的當前運行狀態(tài);支持的算法少;不能區(qū)分服務器的差異(不能根據(jù)系統(tǒng)與服務的狀態(tài)來判斷負載)
實踐建議
將DNS作為第一級負載均衡,A記錄對應著內(nèi)部負載均衡的IP地址,通過內(nèi)部負載均衡將請求分發(fā)到真實的Web服務器上。一般用于互聯(lián)網(wǎng)公司,復雜的業(yè)務系統(tǒng)不合適使用。如下圖:
IP負載均衡
在網(wǎng)絡(luò)層通過修改請求目標地址進行負載均衡。
用戶請求數(shù)據(jù)包,到達負載均衡服務器后,負載均衡服務器在操作系統(tǒng)內(nèi)核進程獲取網(wǎng)絡(luò)數(shù)據(jù)包,根據(jù)負載均衡算法得到一臺真實服務器地址,然后將請求目的地址修改為,獲得的真實ip地址,不需要經(jīng)過用戶進程處理。
真實服務器處理完成后,響應數(shù)據(jù)包回到負載均衡服務器,負載均衡服務器,再將數(shù)據(jù)包源地址修改為自身的ip地址,發(fā)送給用戶瀏覽器。如下圖:
IP負載均衡,真實物理服務器返回給負載均衡服務器,存在兩種方式:(1)負載均衡服務器在修改目的ip地址的同時修改源地址。將數(shù)據(jù)包源地址設(shè)為自身盤,即源地址轉(zhuǎn)換(snat)。(2)將負載均衡服務器同時作為真實物理服務器集群的網(wǎng)關(guān)服務器。
優(yōu)點 :在內(nèi)核進程完成數(shù)據(jù)分發(fā),比在應用層分發(fā)性能更好;
缺點:所有請求響應都需要經(jīng)過負載均衡服務器,集群最大吞吐量受限于負載均衡服務器網(wǎng)卡帶寬;
鏈路層負載均衡
在通信協(xié)議的數(shù)據(jù)鏈路層修改mac地址,進行負載均衡。
數(shù)據(jù)分發(fā)時,不修改ip地址,指修改目標mac地址,配置真實物理服務器集群所有機器虛擬ip和負載均衡服務器ip地址一致,達到不修改數(shù)據(jù)包的源地址和目標地址,進行數(shù)據(jù)分發(fā)的目的。
實際處理服務器ip和數(shù)據(jù)請求目的ip一致,不需要經(jīng)過負載均衡服務器進行地址轉(zhuǎn)換,可將響應數(shù)據(jù)包直接返回給用戶瀏覽器,避免負載均衡服務器網(wǎng)卡帶寬成為瓶頸。也稱為直接路由模式(DR模式)。如下圖:
優(yōu)點:性能好;
缺點:配置復雜;
實踐建議:DR模式是目前使用最廣泛的一種負載均衡方式
混合型負載均衡
由于多個服務器群內(nèi)硬件設(shè)備、各自的規(guī)模、提供的服務等的差異,可以考慮給每個服務器群采用最合適的負載均衡方式,然后又在這多個服務器群間再一次負載均衡或群集起來以一個整體向外界提供服務(即把這多個服務器群當做一個新的服務器群),從而達到最佳的性能。將這種方式稱之為混合型負載均衡。
此種方式有時也用于單臺均衡設(shè)備的性能不能滿足大量連接請求的情況下。是目前大型互聯(lián)網(wǎng)公司,普遍使用的方式。
方式一,如下圖:
以上模式適合有動靜分離的場景,反向代理服務器(集群)可以起到緩存和動態(tài)請求分發(fā)的作用,當時靜態(tài)資源緩存在代理服務器時,則直接返回到瀏覽器。如果動態(tài)頁面則請求后面的應用負載均衡(應用集群)。
方式二,如下圖:
以上模式,適合動態(tài)請求場景。
因混合模式,可以根據(jù)具體場景,靈活搭配各種方式,以上兩種方式僅供參考。
常見負載均衡服務器
平時我們常用的有四層負載均衡和七層負載均衡,四層的負載均衡是基于IP和端口實現(xiàn)的,七層的負載均衡是在四層的基礎(chǔ)上,基于URL等信息實現(xiàn)。
四層負載均衡
LVS:重量級軟件,本身不支持正則表達式,部署起來比較麻煩,但是性能高,應用范圍廣,一般的大型互聯(lián)網(wǎng)公司都有用到。
HAProxy:輕量級軟件,支持的負載均衡策略非常多,較靈活。
Nginx:輕量級軟件,支持的協(xié)議少(HTTP、HTTPS和Email協(xié)議),對于Session支持不友好。
七層負載均衡
HAProxy:全面支持七層代理,靈活性高,支持Session會話保持。
Nginx:可以針對HTTP應用進行分流,正則規(guī)則靈活,支持高并發(fā),部署簡單。
Apache:性能較差,一般不考慮。
MySQL Proxy:官方的數(shù)據(jù)庫中間件,可以實現(xiàn)讀寫分離,負載均衡等功能,但是對分表分庫支持不完善(可選替代品:Atlas,Cobar,TDDL)。
常見的負載均衡算法
1.輪詢法(Round Robin)
2.加權(quán)輪詢法(Weight Round Robin)
3.平滑加權(quán)輪詢法(Smooth Weight Round Robin)
4.隨機法(Random)
5.加權(quán)隨機法(Weight Random)
6.源地址哈希法(Hash)
7.最小連接數(shù)法(Least Connections)
如若轉(zhuǎn)載,請注明出處:開源字節(jié) https://sourcebyte.cn/article/234.html
馬上咨詢: 如果您有業(yè)務方面的問題或者需求,歡迎您咨詢!我們帶來的不僅僅是技術(shù),還有行業(yè)經(jīng)驗積累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 聯(lián)系人:石先生/雷先生