算力網(wǎng)絡(luò)的現(xiàn)狀及未來
隨著全球數(shù)字化轉(zhuǎn)型的深入,算力作為一種融合信息計算、網(wǎng)絡(luò)傳輸和數(shù)據(jù)存儲的新型生產(chǎn)力,正逐步成為支撐現(xiàn)代產(chǎn)業(yè)發(fā)展的核心力量。算力中心和算力網(wǎng)絡(luò)作為其基礎(chǔ)設(shè)施的關(guān)鍵組成部分,肩負(fù)著將算力資源高效、快速地傳輸?shù)缴鐣餍懈鳂I(yè)的任務(wù)。
然而,當(dāng)前大模型訓(xùn)練、大數(shù)據(jù)處理以及高算力驅(qū)動的新型產(chǎn)業(yè)快速發(fā)展,對算力網(wǎng)絡(luò)提出了更高的要求,傳統(tǒng)網(wǎng)絡(luò)架構(gòu)已難以滿足新時代智算需求。同時,基于IP協(xié)議構(gòu)建的算力網(wǎng)絡(luò)在網(wǎng)絡(luò)和信息安全方面也面臨重大挑戰(zhàn)。
一、嚴(yán)峻的安全挑戰(zhàn)
算力網(wǎng)絡(luò)的高質(zhì)量發(fā)展首先需要具備強大的安全保障能力。算力網(wǎng)絡(luò)的建設(shè)和運行中,大量涉及商業(yè)機密和個人隱私的數(shù)據(jù)在網(wǎng)絡(luò)中傳輸,任何安全漏洞都可能導(dǎo)致數(shù)據(jù)泄露、篡改,不僅會嚴(yán)重影響算力服務(wù)的可靠性與用戶信任,還可能危及國家安全。若國家級算力中心或算力基礎(chǔ)設(shè)施遭遇網(wǎng)絡(luò)安全事件,不僅會損害公民和組織的合法權(quán)益,還可能帶來經(jīng)濟損失和社會不穩(wěn)定。尤其是傳統(tǒng)的邊界防護理念依賴于單一固定的防護手段,缺乏靈活調(diào)度、實時響應(yīng)和統(tǒng)一運營機制,無法適應(yīng)算力網(wǎng)絡(luò)時代中業(yè)務(wù)流與數(shù)據(jù)流的快速融合與變化。這種保護模式在算力網(wǎng)絡(luò)高速發(fā)展的背景下顯得愈發(fā)薄弱,難以有效應(yīng)對新型網(wǎng)絡(luò)攻擊。
此外,隨著數(shù)據(jù)跨網(wǎng)傳輸需求的不斷增加,云、網(wǎng)、端、用戶、數(shù)據(jù)資產(chǎn)之間的界限逐漸模糊,算力網(wǎng)絡(luò)的網(wǎng)絡(luò)安全面臨更多不確定性。每一個環(huán)節(jié)中若存在漏洞,都會成為潛在的安全隱患,危害到整個信息系統(tǒng)的安全。例如,數(shù)據(jù)在跨境交換時可能受到非法截取或篡改的風(fēng)險,國家或組織的敏感信息可能面臨泄露的威脅。因此,為確保國家級算力網(wǎng)絡(luò)的安全性,有必要采取更加嚴(yán)格的安全管控措施,以防止數(shù)據(jù)泄露和惡意篡改的發(fā)生。
目前,我國大量關(guān)鍵信息基礎(chǔ)設(shè)施的通信網(wǎng)絡(luò)基于IP協(xié)議體系構(gòu)建,而該協(xié)議體系存在多個已知與未知的協(xié)議漏洞,且核心網(wǎng)絡(luò)技術(shù)被少數(shù)西方國家掌握。這種技術(shù)依賴使我國算力網(wǎng)絡(luò)在網(wǎng)絡(luò)層難以提供安全可信的數(shù)據(jù)流通環(huán)境,也無法有效防御來自外部的潛在威脅。同時,在復(fù)雜多變的國際局勢下,網(wǎng)絡(luò)安全問題愈加突出,特別是中美戰(zhàn)略博弈背景下,算力網(wǎng)絡(luò)的安全建設(shè)和自主可控顯得尤為重要。通過采用自主可控的底層技術(shù)架構(gòu)與安全體系,我國可以逐步擺脫網(wǎng)絡(luò)核心技術(shù)的“卡脖子”困境,降低外部網(wǎng)絡(luò)攻擊的風(fēng)險。
二、傳統(tǒng)網(wǎng)絡(luò)架構(gòu)的流量瓶頸
當(dāng)前,傳統(tǒng)數(shù)據(jù)中心的網(wǎng)絡(luò)架構(gòu)難以有效支撐算力網(wǎng)絡(luò)高速發(fā)展的需求。傳統(tǒng)的數(shù)據(jù)中心主要面向業(yè)務(wù)場景,以服務(wù)器或虛擬機為資源池化對象,網(wǎng)絡(luò)提供服務(wù)器之間的連接。而智算中心的應(yīng)用場景則更加復(fù)雜,以算力資源(如CPU、GPU和存儲)為池化對象,數(shù)據(jù)傳輸則偏向東西向通信。智算中心網(wǎng)絡(luò)是算力資源高效調(diào)度的重要組成部分,能夠在不同算力資源之間提供高帶寬、低延遲的連接,這使得網(wǎng)絡(luò)性能對整體算力水平的提升具有關(guān)鍵作用。
研究表明,數(shù)據(jù)中心內(nèi)80%的流量都小于10KB,而10%的流量則為大數(shù)據(jù)、長周期。一般而言,10%的大數(shù)據(jù)對時延不敏感,且丟包對整體性能影響較小,但其突發(fā)流量的產(chǎn)生可能導(dǎo)致網(wǎng)絡(luò)擁塞,擠占網(wǎng)絡(luò)交換設(shè)備隊列資源,導(dǎo)致時延敏感的業(yè)務(wù)流量歸零,最終降低算力網(wǎng)絡(luò)的整體效率。傳統(tǒng)網(wǎng)絡(luò)架構(gòu)缺乏對突發(fā)流量的應(yīng)對機制,在大數(shù)據(jù)、大流量的影響下,通信損耗效率高達60%,極大地影響了通信效率與網(wǎng)絡(luò)資源的利用率。
盡管SRv6、RDMA等新型技術(shù)可以提高數(shù)據(jù)讀取和路由效率,但在傳統(tǒng)IP體系下,這些技術(shù)往往依賴特定硬件并存在一定的安全漏洞,難以滿足算力網(wǎng)絡(luò)對于高效、安全的流量管理需求。為此,算力網(wǎng)絡(luò)的建設(shè)需要優(yōu)先采用確定性網(wǎng)絡(luò)技術(shù),通過合理的流量管理策略,在網(wǎng)絡(luò)層級為不同業(yè)務(wù)流量提供差異化的轉(zhuǎn)發(fā)機制。這不僅能夠增強數(shù)據(jù)傳輸?shù)目煽啃?,也能有效處理不同業(yè)務(wù)流量對網(wǎng)絡(luò)資源的占用,使算力網(wǎng)絡(luò)的網(wǎng)絡(luò)性能和穩(wěn)定性得到有效提升。
三、算力網(wǎng)絡(luò)建設(shè)的未來方向
未來,算力網(wǎng)絡(luò)的建設(shè)需在確保安全與提升效率的雙重目標(biāo)上不斷優(yōu)化。為此,應(yīng)當(dāng)采用多層次的安全策略,搭建安全、自主可控的底層網(wǎng)絡(luò)架構(gòu),并對全周期生態(tài)體系的各個環(huán)節(jié)提供精準(zhǔn)的安全保障,構(gòu)建安全、可信的算力網(wǎng)絡(luò)環(huán)境。這其中,逐步推進網(wǎng)絡(luò)協(xié)議、硬件和軟件的自主可控,能夠從根本上解決算力網(wǎng)絡(luò)的安全隱患,支撐我國算力產(chǎn)業(yè)的可持續(xù)發(fā)展。
另一方面,在算力網(wǎng)絡(luò)的網(wǎng)絡(luò)架構(gòu)優(yōu)化方面,應(yīng)當(dāng)采用更具前瞻性的流量控制和網(wǎng)絡(luò)調(diào)度技術(shù)。通過確定性網(wǎng)絡(luò)技術(shù)和新型轉(zhuǎn)發(fā)策略,算力網(wǎng)絡(luò)可以針對不同類型的流量靈活配置網(wǎng)絡(luò)資源,在保證延遲敏感流量優(yōu)先通行的同時,充分利用網(wǎng)絡(luò)帶寬。特別是在算力網(wǎng)絡(luò)面向智算中心的數(shù)據(jù)流量傳輸需求日益增長的背景下,進一步推進自適應(yīng)、靈活的網(wǎng)絡(luò)調(diào)度方式將成為算力網(wǎng)絡(luò)高效運行的關(guān)鍵。
算力網(wǎng)絡(luò)的安全保障與性能優(yōu)化是算力產(chǎn)業(yè)高質(zhì)量發(fā)展的雙引擎。通過自主可控的底層技術(shù)架構(gòu),我們能夠降低對外部網(wǎng)絡(luò)技術(shù)的依賴,減少潛在的安全隱患;而通過先進的流量調(diào)度技術(shù)和確定性網(wǎng)絡(luò)建設(shè),我們可以確保算力網(wǎng)絡(luò)高效穩(wěn)定地運行,以支持各類大模型、大數(shù)據(jù)及新型產(chǎn)業(yè)應(yīng)用的需求。未來,算力網(wǎng)絡(luò)在安全性和效率上的雙重提升將為我國數(shù)字經(jīng)濟的持續(xù)發(fā)展提供強有力的支撐,實現(xiàn)科技自立自強,推動產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化升級,促進算力經(jīng)濟的健康、可持續(xù)發(fā)展。