算力突圍:打造AI浪潮下的堅(jiān)實(shí)底座
北京人工智能公共算力平臺(tái)點(diǎn)亮、京津冀最大綠色算力中心投產(chǎn)運(yùn)營(yíng)、京津冀算力廊道正在謀劃中、上海首個(gè)垂直領(lǐng)域AI千卡集群落地、全國(guó)首個(gè)算力交易平臺(tái)上線……在全國(guó)多地,算力中心布局落地的消息頻傳新進(jìn)展。
所謂算力,就是對(duì)數(shù)據(jù)的處理能力。小到手機(jī)、個(gè)人電腦,大到服務(wù)器、超級(jí)計(jì)算機(jī),算力正走進(jìn)千家萬(wàn)戶、服務(wù)千行百業(yè),成為像水、電、燃?xì)庖粯拥墓不A(chǔ)資源,提供“即取即用”的社會(huì)化服務(wù)。AI浪潮席卷而來(lái),算力需求不斷加大,作為新時(shí)代技術(shù)“底座”的智能算力產(chǎn)業(yè)方興未艾。
智算中心加速崛起
在北京朝陽(yáng)區(qū)酒仙橋核心地帶,北京數(shù)字經(jīng)濟(jì)算力中心正在如火如荼建設(shè)中。該算力中心由北京電子控股有限責(zé)任公司旗下提供規(guī)?;冗M(jìn)智算算力、AI云及AI轉(zhuǎn)型服務(wù)的高科技企業(yè)——北京電子數(shù)智科技有限責(zé)任公司(以下簡(jiǎn)稱“北電數(shù)智”)承建,預(yù)計(jì)2024年完成基礎(chǔ)設(shè)施建設(shè),達(dá)產(chǎn)后實(shí)現(xiàn)多元異構(gòu)的1000P智能算力供給。北京市經(jīng)濟(jì)和信息化局局長(zhǎng)姜廣智近日披露,初步統(tǒng)計(jì),北京已形成1.2萬(wàn)P的總算力供給規(guī)模,下一步將加速算力基礎(chǔ)設(shè)施建設(shè),打造京津冀算力廊道,形成以智能算力為主、通用算力和超級(jí)算力多元協(xié)同的首都地區(qū)算力供給體系。
今年以來(lái),ChatGPT的橫空出世掀起一波席卷全球的大模型浪潮,這種強(qiáng)勁的需求瞬間傳導(dǎo)至上游,支撐大模型訓(xùn)練和推理的算力成為“兵家必爭(zhēng)之地”。作為智能時(shí)代的新型基礎(chǔ)設(shè)施,智能算力中心迎來(lái)飛速增長(zhǎng)的機(jī)遇窗口。2023年10月,工信部等六部門聯(lián)合印發(fā)《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》,其中提出2025年建成50個(gè)智能計(jì)算中心等量化指標(biāo)。而計(jì)算力方面,到2025年規(guī)模將超過(guò)300EFLOPS,智能算力占比達(dá)到35%。
中國(guó)工程院院士、清華大學(xué)計(jì)算機(jī)系教授鄭緯民說(shuō),從整體而言,我國(guó)算力基礎(chǔ)設(shè)施規(guī)模已位居世界前列,但人均算力尚低。在數(shù)字經(jīng)濟(jì)時(shí)代,人工智能的進(jìn)一步發(fā)展需要通過(guò)軟硬件密切協(xié)同,才能進(jìn)一步加速算力提升和使用效率。在未來(lái),新型數(shù)據(jù)中心將是提供多樣性計(jì)算綜合能力的算力集群,以滿足千行百業(yè)智能化的需求。
11月中旬,算力租賃概念股匯納科技宣布,由于算力需求大幅增加,其內(nèi)嵌英偉達(dá)A100芯片的高性能服務(wù)器算力服務(wù)收費(fèi)將上調(diào)100%。匯納科技的動(dòng)向,只是我國(guó)算力市場(chǎng)環(huán)境的縮影。多家券商在10月發(fā)布的研報(bào)提出,隨著行業(yè)需求的攀升,算力租賃行業(yè)將進(jìn)入新一輪漲價(jià)周期。
“我們觀察到,未來(lái)9到12個(gè)月算力需求還是會(huì)非常緊張?!卑俅ㄖ悄芗夹g(shù)聯(lián)合創(chuàng)始人陳煒鵬在今年3個(gè)多月前的一場(chǎng)行業(yè)論壇中說(shuō)道。多家大模型企業(yè)均遇到了不同程度的算力缺口。算力緊缺,已成為影響我國(guó)大模型產(chǎn)業(yè)發(fā)展重要因素。
“大模型是新型基礎(chǔ)設(shè)施的關(guān)鍵底座之一,大模型的競(jìng)爭(zhēng)也是國(guó)家科技戰(zhàn)略的競(jìng)爭(zhēng),中國(guó)一定要布局全棧自主創(chuàng)新的大模型產(chǎn)品,同時(shí)要構(gòu)建國(guó)產(chǎn)化算力。”鄭緯民提醒。
鄭緯民表示,目前一些國(guó)外廠商在芯片生產(chǎn)上有著更多的話語(yǔ)權(quán),國(guó)內(nèi)則因起步較晚,自研的芯片在性能上仍稍顯不足。但性能上的差距可以在生態(tài)上得到彌補(bǔ)。所謂好的生態(tài)就是讓芯片用起來(lái)不費(fèi)勁,建立這樣的生態(tài),并讓市場(chǎng)接受,需要一個(gè)過(guò)程。國(guó)產(chǎn)生態(tài)只要解決好編程框架、并行加速、調(diào)度器、內(nèi)存分配系統(tǒng)、容錯(cuò)系統(tǒng)、存儲(chǔ)系統(tǒng)等問題,即使只有國(guó)外芯片60%的性能,國(guó)產(chǎn)芯片也會(huì)大受歡迎。
鄭緯民提出,除了人均算力水平尚低、算力關(guān)鍵技術(shù)等限制外,隨著數(shù)據(jù)爆發(fā)式增長(zhǎng)與算力單點(diǎn)性能極限之間的矛盾日益突出,我國(guó)算力節(jié)點(diǎn)通過(guò)網(wǎng)絡(luò)靈活高效調(diào)配算力資源的能力仍存在不足,算網(wǎng)協(xié)同和全局調(diào)度能力有待提高,難以滿足數(shù)據(jù)對(duì)算力隨需處理的需求,將領(lǐng)先算力高效轉(zhuǎn)化為解決科學(xué)與工程難題的能力依然面臨挑戰(zhàn)。
他表示,智算中心的建設(shè)和布局是一個(gè)重要趨勢(shì),但也伴隨著包括資源分配、合作與競(jìng)爭(zhēng)等方面的挑戰(zhàn),算力的統(tǒng)一調(diào)度是算力發(fā)展的路徑之一,其關(guān)鍵在于將分散的算力資源聚合,形成集群效應(yīng)。
同時(shí),鄭緯民對(duì)算力互聯(lián)互通也提出了兩點(diǎn)建議:一是屏蔽異構(gòu)基礎(chǔ)設(shè)施,通過(guò)統(tǒng)一的資源管理與調(diào)度軟件實(shí)現(xiàn)算力的互通;二是提供更多的服務(wù)軟件,抓住算力應(yīng)用的機(jī)遇,提升算力普惠價(jià)值。
為滿足客戶對(duì)算力的靈活、高效、充分使用的需求,北電數(shù)智在算力靈活調(diào)度層面發(fā)力,整合分散的先進(jìn)計(jì)算能力、充分發(fā)揮計(jì)算效果。同時(shí),北電數(shù)智也在布局兼顧國(guó)內(nèi)外不同品牌訓(xùn)練芯片及推理芯片等多種算力集群,通過(guò)調(diào)度算法,更合理地分配和調(diào)度計(jì)算資源,實(shí)現(xiàn)最優(yōu)的計(jì)算性能和資源利用率。同時(shí),其也在同步規(guī)劃能夠更高效地配置和使用計(jì)算能力的先進(jìn)軟件,智能分析用戶提交的作業(yè)任務(wù),根據(jù)任務(wù)特性進(jìn)行自動(dòng)化配置,確保每一個(gè)任務(wù)都能夠得到最適合的計(jì)算資源。
算力狂飆也須兼顧“雙碳”
鄭緯民特別提醒道,在建設(shè)智能算力中心的同時(shí),也要兼顧算力能耗與國(guó)家“雙碳”目標(biāo)的平衡。未來(lái)數(shù)據(jù)中心的發(fā)展須考慮不同地區(qū)能源結(jié)構(gòu)的差異、同一地區(qū)不同行業(yè)的業(yè)務(wù)差異,提供更綠色的算力,并滿足實(shí)時(shí)應(yīng)用的需求。
在新建智算中心的同時(shí),傳統(tǒng)數(shù)據(jù)中心的智算改造與升級(jí),成為綠色算力的重要組成部分。北電數(shù)智相關(guān)負(fù)責(zé)人介紹,北電數(shù)智通過(guò)軟硬件升級(jí)和能耗方案的優(yōu)化,幫助傳統(tǒng)數(shù)據(jù)中心實(shí)現(xiàn)面向未來(lái)的整體智算升級(jí)與政策合規(guī);同時(shí),以攜手改造、共同運(yùn)營(yíng)的全方位投入產(chǎn)出支持,幫助傳統(tǒng)數(shù)據(jù)中心獲得可持續(xù)增長(zhǎng),以滿足人工智能產(chǎn)業(yè)對(duì)數(shù)據(jù)中的高算力、高效率、更環(huán)保的需求。
鄭緯民還提醒,算力、網(wǎng)絡(luò)具備很強(qiáng)的公共基礎(chǔ)設(shè)施特性,加快建立一個(gè)開放性的產(chǎn)業(yè)生態(tài),把選擇權(quán)交給用戶,才能驅(qū)動(dòng)行業(yè)百花齊放,從而真正促進(jìn)大模型產(chǎn)業(yè)的健康發(fā)展。