亚洲av无码av吞精,蜜柚黄色网站,亚洲无aV码在线中文字幕,福利社区性爱青青草,国产乱子伦视频大全,国产91AV视频在线播放,99久久最新网址

關(guān)于我們

算力租賃行業(yè)的需求從何而來?

發(fā)布時間:2024-08-23 15:40:32

近年來,人工智能領(lǐng)域的迅猛發(fā)展引發(fā)了全球范圍內(nèi)的巨大關(guān)注。尤其是在2023年,以ChatGPT為代表的大型語言模型應(yīng)用展現(xiàn)出非凡的潛力,推動了人工智能技術(shù)的商業(yè)化進(jìn)程。隨著越來越多的大模型創(chuàng)業(yè)公司涌現(xiàn),全球?qū)Υ竽P涂蒲械臒崆槌掷m(xù)高漲。

 這一趨勢不僅加速了大模型的研究與開發(fā),也引發(fā)了對AI算力需求的井噴式增長。在這一背景下,算力租賃業(yè)務(wù)作為一種新興行業(yè),迅速崛起,成為滿足AI模型開發(fā)和推理需求的關(guān)鍵解決方案。

1. 算力需求井噴

ChatGPT等大型語言模型震撼世界以來,人工智能的商業(yè)化落地預(yù)期不斷升高,全球范圍內(nèi)涌現(xiàn)了大批大模型創(chuàng)業(yè)公司。隨著大模型的訓(xùn)練、微調(diào)、推理需求急劇增加,AI算力需求迎來了前所未有的井噴式增長。AI應(yīng)用在不同開發(fā)階段對算力的需求也各不相同。在開發(fā)周期中,大量的訓(xùn)練側(cè)算力是必需的;而當(dāng)模型開發(fā)完成并上線后,推理算力則成為主要需求。目前,AI應(yīng)用開發(fā)如火如荼,訓(xùn)練模型所需的算力需求尤為迫切;而在不久的將來,隨著AI應(yīng)用的大規(guī)模落地,推理側(cè)算力的需求將更加旺盛。

以訓(xùn)練算力為例,根據(jù)英偉達(dá)與斯坦福大學(xué)合作的研究,GPT-3模型假設(shè)使用1024張A100顯卡(約600P)進(jìn)行訓(xùn)練,端到端訓(xùn)練時間大約為34天。然而,隨著模型參數(shù)量的增加,所需的GPU數(shù)量呈非線性增長。以GPT-3到GPT-4的迭代為例,參數(shù)規(guī)模增大10倍,對應(yīng)的訓(xùn)練計算量增加至少60倍。根據(jù)SemiAnalysis的報道,GPT-4的參數(shù)量達(dá)到了1.8萬億,并使用了更大的訓(xùn)練集,訓(xùn)練過程中所需的A100顯卡數(shù)量達(dá)到萬張量級。 

2. 云計算廠商為何無法完全承接需求?

盡管AI算力需求異常旺盛,傳統(tǒng)云計算廠商卻未能完全承接這些需求。這主要源于模型訓(xùn)練時需要大量GPU同時對同一模型進(jìn)行計算,不僅要求峰值運算能力,還要求GPU之間的高效連接。傳統(tǒng)的GPU集群在單個服務(wù)器節(jié)點內(nèi)可以使用大帶寬連接,但在服務(wù)器之間仍然采用傳統(tǒng)架構(gòu),無法進(jìn)行高效的多節(jié)點并行訓(xùn)練。對于大多數(shù)業(yè)務(wù)級大模型來說,單節(jié)點(最多8GPU)無法滿足訓(xùn)練需求。而高性能集群則通過在節(jié)點間大量使用高帶寬光模塊進(jìn)行互聯(lián),大幅提升了多節(jié)點訓(xùn)練時的GPU利用率。

傳統(tǒng)云計算廠商提供的服務(wù)主要關(guān)注單節(jié)點的可用性與可靠性,但缺乏節(jié)點間超高帶寬互聯(lián)的基礎(chǔ)設(shè)施,因此無法滿足大模型訓(xùn)練客戶的需求。要滿足客戶的訓(xùn)練需求,必須規(guī)劃建設(shè)新的集群,而現(xiàn)有基礎(chǔ)設(shè)施無法重復(fù)利用。此外,高性能集群主要適用于模型訓(xùn)練,用于普通互聯(lián)網(wǎng)業(yè)務(wù)則成本過高,因此在高性能集群業(yè)務(wù)方面,云計算廠商并無優(yōu)勢。因此,當(dāng)算力需求爆發(fā)時,云計算廠商無法完全承接,給了其他算力租賃公司介入的機(jī)會。 

3. 為何不自建算力中心?

雖然在服務(wù)器采購成本與租金成本之間進(jìn)行比較時,算力租賃似乎不具備明顯優(yōu)勢,但考慮到算力的彈性需求、硬件采購、調(diào)試、維護(hù)成本以及工程師研發(fā)時間成本,自建算力中心的模式對大多數(shù)大模型研發(fā)廠商而言并不適合。除了一些算力資源復(fù)用率較高的互聯(lián)網(wǎng)大廠外,算力租賃已成為大多數(shù)大模型研發(fā)廠商的最佳選擇。

除了大模型廠商外,還有許多有訓(xùn)練和推理需求的客戶,他們更加需要算力租賃供應(yīng)方的存在。尤其在推理側(cè),需求更為旺盛。例如,GPT-3大約需要1024張A100訓(xùn)練34天,而據(jù)相關(guān)機(jī)構(gòu)的測算,ChatGPT的推理大約需要7000張A100算力卡持續(xù)運行來支持。 

4. 算力租賃業(yè)務(wù)的增速與規(guī)模

正是在這種需求背景下,算力租賃業(yè)務(wù)應(yīng)運而生,并迅速發(fā)展成為一個兼具確定性與成長性的新興行業(yè)。根據(jù)部分機(jī)構(gòu)數(shù)據(jù)顯示,受AI影響,從2022年到2026年,中國區(qū)人工智能算力規(guī)模的年復(fù)合增長率預(yù)計將達(dá)到52.3%。這不僅展示了算力租賃業(yè)務(wù)的潛力,也預(yù)示著未來將有更多企業(yè)涌入這一市場,推動整個行業(yè)進(jìn)一步發(fā)展。

注:國內(nèi)人工智能行業(yè)應(yīng)用滲透度及提升百分點(來源:東方證券)

在人工智能技術(shù)飛速發(fā)展的時代,算力需求的井噴式增長為算力租賃行業(yè)帶來了巨大的機(jī)遇。傳統(tǒng)云計算廠商難以滿足大模型研發(fā)和推理的需求,使得高性能集群和算力租賃成為了新的解決方案。未來,隨著AI應(yīng)用的廣泛落地和推理需求的激增,算力租賃業(yè)務(wù)將繼續(xù)保持強(qiáng)勁的增長勢頭,并在全球范圍內(nèi)扮演越來越重要的角色。


/template/Home/AllNew/PC/Static

中國互聯(lián)網(wǎng)信息中心(CNNIC)IP地址分配聯(lián)盟成員 北京市通信行業(yè)協(xié)會會員單位 中國互聯(lián)網(wǎng)協(xié)會會員單位

跨地區(qū)增值業(yè)務(wù)經(jīng)營許可證(B1-20150255) 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證(京ICP證060342號) 京ICP備05032038號-1 京公網(wǎng)安備11010802020193號

Copyright ?2005-2024 北京互聯(lián)互通科技有限公司 版權(quán)所有

售前
電話
400-700-7300
在線
咨詢
微信
咨詢
微信咨詢
售后
服務(wù)