來源:華為 時間:2024-01-22 16:05:40 作者:
數據中心當前處于一個快速發(fā)展和技術變革的特殊時期,全新的人工智能應用正在重塑整個世界,為社會帶來便捷的同時,也為數據中心的發(fā)展帶來了新的機遇和挑戰(zhàn)。智能算力的爆發(fā)式增長,對數據中心提出了大算力、高性能的新需求,并為數據中心的發(fā)展提供了強勁的動力和更加廣闊的空間。
隨著數字化技術的進一步發(fā)展,數據中心的規(guī)模、架構、技術、管理等方面都取得了顯著的進步和突破,其重要性等級也不斷提升。而近年來數據中心的安全事故時有發(fā)生,由此造成的社會影響和經濟損失,呈逐年升高的趨勢,安全可靠作為數據中心的最基本要素,成為行業(yè)共同關注的重要課題。
華為數字能源與產業(yè)領袖、技術專家和行業(yè)客戶基于深入研討,并結合自身的深刻洞察和長期實踐,發(fā)布《數據中心能源十大趨勢白皮書》,希望為促進數據中心行業(yè)健康發(fā)展提供參考,貢獻智慧。
據Uptime權威數據,從2019年到2022年,數據中心業(yè)務中斷損失超過10萬美金的比例,已經從39%上升至71%,且會隨著算力需求翻番成倍增長。毫無疑問,安全可靠是數據中心最核心需求,應始終作為最高優(yōu)先級關注。
趨勢1:高可靠產品+專業(yè)化服務是保障數據中心安全可靠運行的關鍵
數據中心承載海量數據的存儲、處理和傳輸,為千行百業(yè)堅定運行提供保障,而數據中心的安全性、可靠性一直是較薄弱的環(huán)節(jié)。為確保數據中心的安全可靠運行,在產品設計、生產環(huán)節(jié)就要貫穿“全鏈安全”的理念,同時嚴控產線質量,高度自動化,減少人為干預,保障產品自身的高可靠性。
此外,要大膽假設,充分考慮產品出現問題后的應對措施,通過提供專業(yè)化部署和運維服務,降低產品失效率,最小化災后影響,完善端到端的保障機制,雙管齊下保障數據中心安全可靠運行。
趨勢2:分布式制冷架構將成為溫控安全的更優(yōu)選擇
傳統(tǒng)大型數據中心多采用集中式制冷架構的方案,如傳統(tǒng)冷凍水系統(tǒng),冷凍站中涉及七大子系統(tǒng)和幾十種設備,各設備之間不能獨立運行,一旦發(fā)生單點故障,可能會影響整個冷凍站的安全運行,導致數據中心大規(guī)模宕機,近年來業(yè)內部分數據中心安全事故也說明集中式制冷架構存在單點故障的風險。
相較之下,分布式制冷架構靈活,各個子系統(tǒng)相互獨立,單臺設備故障不會影響其他設備運行,故障域更小,可靠性更高,可以直接從架構設計上避免數據中心制冷系統(tǒng)的單點故障,提升數據中心的運行可靠性。
趨勢3:預測性維護將成為數據中心基礎設施的標配
數據中心的維護往往是事后型,發(fā)生事故后才知道問題所在,但隨著智算時代的到來,數據中心的故障響應時間大幅縮短。未來數據中心基礎設施的運維,預測性維護將成為標配,從事后型轉為事前型。
得益于AI技術的快速發(fā)展,預測性維護的范圍將持續(xù)擴大,從電容、風扇等易損件的壽命預測、設備的熱失控預警到制冷系統(tǒng)的漏液預警,都能提前預測,提前處理避免事故的發(fā)生,做到“治未病”,從被動“救火”走向主動“防火”,在運維方面大幅提升數據中心可靠性。
趨勢4:全生命周期的網絡安全防護體系將成為數據中心基礎設施的保護盾
隨著數字化、智能化程度的加深,網絡安全風險也在成倍增加,網絡攻擊越來越常態(tài)化。不管是UPS還是空調設備,一旦遭遇惡意攻擊,都會直接影響數據中心安全可靠性。
未來數據中心基礎設施,硬件安全加軟件安全,才是全方位的安全,軟件安全要從供應安全、縱深防御和運維/運營安全三個維度,構筑全生命周期網絡安全防護體系,為數據中心的安全可靠運行保駕護航。
趨勢5:預制化、模塊化將成為高質量快速交付的最佳選擇
互聯網云廠商全球業(yè)務加速發(fā)展,帶動數據中心建設需求顯著增長。而傳統(tǒng)的數據中心建設模式,建設速度慢,工程復雜,不能滿足快速部署的要求。
因此,建設周期更短、質量更高的預制化、模塊化方案將成為首選。通過“工程產品化”和“產品模塊化”,在工廠一體化集成,完成預制和預調試,保證現場交付的是高質量產品,有效縮短交付周期,同時滿足客戶業(yè)務快速上線需求,還大幅減少現場施工造成的“三廢”垃圾。
趨勢6:專業(yè)化管理平臺讓數據中心運維更安全、更高效
從千柜級建筑到萬柜級園區(qū),數據中心呈現規(guī)?;?、集約化發(fā)展趨勢,相應的整體運維復雜度也大幅提升,且數據中心設備多為“啞”設備,依賴傳統(tǒng)巡檢難度大,對技能的要求較高,故障定位時間長。
構建專業(yè)化的管理平臺,可以顯著提升數據中心運維效率和準確性,通過原廠的專業(yè)化管理平臺,幫助客戶構建設備深度管理能力,大大降低運維難度,做到快速判斷問題,及時排除故障,確保數據中心安全穩(wěn)定運行。
趨勢7:風液融合將成為業(yè)務需求不確定場景下的優(yōu)選架構
當前正處于通用算力和智能算力的過渡期,同一個數據中心會同時存在通用算力和智能算力場景。通用服務器單柜功率密度一般不超過15kW,風冷型設備即可滿足制冷需求,而智算中心單柜功率密度通常超過30kW,這種場景往往需要液冷來散熱。
對于需求不確定的業(yè)務場景,風液融合將成為適配未來演進的數據中心優(yōu)選架構,通過風冷+液冷的組合和比例可調,靈活適應業(yè)務需求變化,保護用戶投資。
趨勢8:間接蒸發(fā)冷依然是現在和未來最優(yōu)的制冷方案
當前風冷方案仍占據主流應用場景,在冷源側,間接蒸發(fā)冷卻方案相較冷凍水系統(tǒng),在架構、效率和運維方面存在明顯優(yōu)勢,是現在和未來最經濟適用的制冷方案。
間接蒸發(fā)冷卻的分布式制冷架構可有效避免單點故障,可靠性更高;并且通過最大化利用自然冷源,僅需一次熱交換,在寒冷地區(qū)絕大部分時間無需壓縮機制冷,實現極致PUE;針對智能算力需求,間接蒸發(fā)冷卻支持未來演進的架構,進一步適配液冷的計算場景。
趨勢9:能效PUE挖潛要從關注部件高效調整為系統(tǒng)工程最優(yōu)解
“碳中和”是全球共識和使命,傳統(tǒng)數據中心關注提升UPS、空調等部件效率,但受限于元器件物理限制,部件的效率提升接近瓶頸,微小改進的時間和成本遠趕不上算力時代需求。
因此,數據中心能效的提升要轉換思路,從關注部件效率轉為系統(tǒng)工程優(yōu)化,用系統(tǒng)工程思維綜合審視,在現實條件和部件技術水平進行權衡,得出最優(yōu)解,如UPS雙變換模式轉向S-ECO、數據中心PUE轉向PFPUE(算力PUE),端到端的進行數據中心能效優(yōu)化。
趨勢10:AI調優(yōu)將成為存量DC能效智能優(yōu)化的最佳選擇
在數據中心節(jié)能方面,除了新建的數據中心,仍有大量存量數據中心PUE遠高于“國家一體化大數據中心”政策要求,面臨節(jié)能改造的迫切需求。傳統(tǒng)的節(jié)能改造需要停線停業(yè)務,存在業(yè)務中斷的風險,而采用人工調整優(yōu)化的方式,難度大,效果差,頻率低。
相較之下,AI能效調優(yōu)解決方案通過預置AI算法和大數據模型,可對存量數據中心實現節(jié)能優(yōu)化,且AI調優(yōu)不依賴人工經驗,優(yōu)化速度快,效果好,實現從“制冷”到“智冷”的轉變。
具體內容如下
責任編輯:張薇