“如果說互聯(lián)網(wǎng)是一片汪洋,那么數(shù)據(jù)中心就是深藏其中的珊瑚礁生態(tài)系統(tǒng),服務(wù)器則是構(gòu)筑這個生態(tài)系統(tǒng)的基石。”
孟繁超作為北京電信資深技術(shù)專家,親身經(jīng)歷了我國從傳統(tǒng)的基礎(chǔ)運維向云端智慧化運營的華麗轉(zhuǎn)身,他在北京電信親眼見證并參與這場有關(guān)算力的“技術(shù)革命”。
2024年4月20日,我國正式接入互聯(lián)網(wǎng)30周年。這30年來,互聯(lián)網(wǎng)技術(shù)由簡單的網(wǎng)頁搜索,發(fā)展到復(fù)雜的大數(shù)據(jù)處理、人工智能應(yīng)用;算力領(lǐng)域?qū)崿F(xiàn)了從單機計算到云計算、邊緣計算的跨越;核心網(wǎng)建設(shè)經(jīng)歷了從窄帶通信到寬帶網(wǎng)絡(luò)、從2G到5G的飛躍;物聯(lián)網(wǎng)從最初的簡單連接,到現(xiàn)在的智能感知、遠(yuǎn)程控制,發(fā)展日新月異,滲透到智能家居、智慧交通、智慧農(nóng)業(yè)等方方面面。
圖:中國電信永豐數(shù)據(jù)中心,同時也是北京人工智能公共算力平臺永豐節(jié)點。
從厚重的物理網(wǎng)元,邁向靈動的云端之旅
寂靜無聲的機房里,只有機器運轉(zhuǎn)的微弱嗡鳴和冷氣流動的聲音相伴,技術(shù)人員手持手電筒和檢測工具,穿梭在宛如迷宮般的機柜走廊間。
他們逐一檢查每臺服務(wù)器的指示燈狀態(tài)、溫度讀數(shù)以及網(wǎng)絡(luò)設(shè)備的鏈路狀況……這是早期現(xiàn)場維護的工作場景。
圖:中國電信永豐數(shù)據(jù)中心內(nèi)部服務(wù)器機架鱗次櫛比。
孟繁超曾是中國電信永豐數(shù)據(jù)中心的一位技術(shù)工程師,“那個時代,機柜中的網(wǎng)絡(luò)設(shè)備如同互聯(lián)網(wǎng)的神經(jīng)中樞,每一次故障都可能導(dǎo)致整個業(yè)務(wù)的癱瘓?!睆匾贡3执鼱顟B(tài),已經(jīng)是技術(shù)工程師們的家常便飯。
網(wǎng)元,這個詞,既熟悉又陌生。據(jù)孟繁超介紹,“網(wǎng)元就是網(wǎng)絡(luò)設(shè)備,一種網(wǎng)絡(luò)單元”,運營商在這變革的30年,其角色從維護物理網(wǎng)元,到提供賦能千行百業(yè)的云服務(wù),再到聚焦人工智能、大模型等的算力服務(wù),實現(xiàn)“數(shù)智化”華麗轉(zhuǎn)型。
2015年,我國云計算產(chǎn)業(yè)規(guī)模高速增長,產(chǎn)業(yè)格局重新洗牌。北京電信積極落實中國電信發(fā)展戰(zhàn)略,在云計算領(lǐng)域政務(wù)、教育、金融、醫(yī)療和園區(qū)方面迅速發(fā)力。
“隨著云計算技術(shù)的逐漸成熟,云基礎(chǔ)設(shè)施提供商開始嶄露頭角,為企業(yè)提供了更加靈活、高效的IT基礎(chǔ)設(shè)施服務(wù)?!卑戏背趦?nèi)的技術(shù)人員也順應(yīng)技術(shù)發(fā)展的潮流,積極參與到平臺的自動化運維工作中。北京電信緊隨技術(shù)發(fā)展步伐,通過云平臺的自動化運維能力,實現(xiàn)快速部署、彈性擴展和故障恢復(fù),提高了運維效率和可靠性。
以“特殊的學(xué)習(xí)方式”,直面大模型的挑戰(zhàn)
技術(shù)的變革永不停歇。2023年,隨著ChatGPT的橫空出世,全球掀起了AI大模型熱潮,北京電信也接下了大模型的“挑戰(zhàn)書”。
“從傳統(tǒng)的網(wǎng)絡(luò)運維到擁抱開源、熟悉IT和敏捷開發(fā)的轉(zhuǎn)變,是一段充滿挑戰(zhàn)和成長的歷程。我最大的挑戰(zhàn)之一是適應(yīng)新的工作方式和技術(shù)。需要不斷更新知識,學(xué)習(xí)新的技能,以確保自己跟上行業(yè)發(fā)展的步伐?!泵戏背v到自己在大模型時代面臨的挑戰(zhàn)。
面對新技術(shù)的挑戰(zhàn),孟繁超有自己“特殊的學(xué)習(xí)方式”——在使用中學(xué)習(xí)。通過使用生成式大模型,了解其中蘊涵的技術(shù)邏輯,找出應(yīng)用中存在的契機,并不斷探索如何將其更好地應(yīng)用于實際業(yè)務(wù)中?!盎诖笠?guī)模語料庫的生成式大模型有時會產(chǎn)生看似真實,但實際上是錯誤的或不存在的信息?!?/p>
在孟繁超等專家團隊的努力下,北京電信積極擁抱人工智能大模型時代,按照首都“2+15+N”人工智能算力布局規(guī)劃要求,加快打造數(shù)網(wǎng)協(xié)同、數(shù)云協(xié)同、云邊協(xié)同、綠色智能的多層次算力設(shè)施體系,滿足大數(shù)據(jù)大算力需求。
截至目前,北京電信已經(jīng)建成并運營了24 個數(shù)據(jù)中心,京津冀智能算力中心、北京人工智能公共算力平臺永豐節(jié)點及各邊緣與專屬智算節(jié)點,推進構(gòu)建“1+1+X”的算力布局,積極打造京內(nèi)“1ms”、京津冀“3ms”的低時延、大帶寬、高可靠智能算力體系。
產(chǎn)生顛覆性變革 網(wǎng)絡(luò)運維模式躍遷
“‘技多不壓身’是我從業(yè)多年感受最深的一個詞,我感覺自己的技能遠(yuǎn)遠(yuǎn)不夠?!泵鎸ヂ?lián)網(wǎng)技術(shù)“翻天覆地”的創(chuàng)新變革,孟繁超如是說。
“從開始接觸算力維護那一刻起,我深刻地感受到創(chuàng)新竟發(fā)生得如此神奇和頻繁,我所接觸的硬件、協(xié)議及軟件都產(chǎn)生了顛覆性變革?!泵戏背a充道,“對于運營商來說,變化最大的還是網(wǎng)絡(luò)的迭代更替?!?/p>
從專業(yè)角度,傳統(tǒng)的網(wǎng)絡(luò)運維模式主要依賴于基于TCP/IP協(xié)議的網(wǎng)絡(luò)架構(gòu),需要進行大量的配置和管理工作,同時存在一定的延遲和性能瓶頸。而在智算場景中,RDMA(遠(yuǎn)程直接數(shù)據(jù)存?。┚W(wǎng)絡(luò)被大量應(yīng)用,打破了這種傳統(tǒng)的網(wǎng)絡(luò)技術(shù)架構(gòu),可以直接在網(wǎng)絡(luò)適配器之間進行數(shù)據(jù)傳輸,避免了CPU的參與,降低了數(shù)據(jù)傳輸?shù)难舆t和負(fù)載,從而提高了網(wǎng)絡(luò)通信的效率和性能。
圖:北京電信用于機房巡檢5G四足AI智能“機器狗”,具備自主巡航能力。
如今,穿梭在北京電信機房巡檢的,已經(jīng)變成AI智能巡檢“機器狗”。正如孟繁超所言:“未來,所有的互聯(lián)網(wǎng)軟件應(yīng)用都將被重構(gòu),都將擁抱大模型!”對于北京電信來說,立足于創(chuàng)新驅(qū)動,深化云網(wǎng)融合,提升算力服務(wù)效能,勢必是在新的征程中加快數(shù)字中國建設(shè)、推進中國式現(xiàn)代化的必然選擇。