無論是觀看最新熱播劇,在社交媒體上和親友互動,還是在家遠程更新公司網絡上的表格,我們如今的數字生活幾乎離不開信息訪問,而存儲和處理這些信息的數據中心可能與訪問者遠隔萬里。作為數字經濟的基礎,數據中心基礎設施 (DCI) 需要不斷擴展和升級,實現提效降本。事實上,數據中心一旦運行中斷,不僅會令運營商損失巨大,還會有礙數字經濟發展。
數字經濟發展成本
所有數據中心最注重兩點:一,提高用電效率;二,保持服務器等設備散熱良好。可以說,電力和散熱系統在數據中心建設成本中占據大頭,在運營成本中的比重也不容小覷。因此,不管是投資興建新的數據中心,還是擴展現有數據中心的基礎設施,選擇最合適的電力和散熱系統是重中之重。
大型主機托管式數據中心的新設施建設成本平均達數億美元,目前其中絕大部分資金用于電力和散熱系統。不過,這兩項投資的回報非常優厚,電力和散熱系統的效率和可靠性每提高一點,項目總成本就會下降一大截。由于客戶需求難以預測、容易波動,數據中心必須能夠隨時擴展,因此許多運營商通常會先安裝電力、散熱、監控設備,再添加服務器等聯網設備。
一座現有大型數據中心的年均運營成本往往高達數千萬美元,其中將近 50% 都用于電力和散熱系統。DCI 與運營成本及可持續發展息息相關。從長遠來看,投資優化 DCI 能耗,有助于大幅減少總成本和碳足跡。這一做法在北美和歐洲的成效尤其顯著,大力發展并優化 DCI,讓既有設備煥發新生,也是可持續發展的重要助力。
影響 DCI 擴展的兩大關鍵問題
大型數據中心基礎設施由一整套互聯系統組成,集成了開關柜、電表、控制器、環境傳感器等諸多設備。其中,關鍵的電源、散熱、建筑自動化等操作技術 (OT) 系統對保障數據中心穩定、高效運行功不可沒,而各個系統的不同硬件必須相互連通,才能確保順暢運行。因此,決策者常面臨以下兩大連接挑戰:
● 最大程度降低停機時間。 在現有網絡中增加設備時,可能需要進行安裝、測試、重啟、重新配置等一系列操作,這可能會影響局部甚至整個網絡,引發網絡故障。而停機會給數據中心造成巨大損失,對要求可用率高達 99.995%、全年停機時間不超過 25 分鐘的 Tier IV 數據中心尤其如此。但要選擇正確的設備和安裝方案,往往比預期的更復雜、繁瑣、費時。
● 連接采用不同通信協議的系統。不同系統采用的通信協議五花八門。例如,電表采用 RS-422/485 接口和常規串口協議,而散熱或 HVAC 系統采用的是 BACnet 等其他 OT 協議。因此,要將這些系統連接起來,并通過數據中心基礎設施管理 (DCIM) 系統進行有效監測和控制,需要經歷艱難漫長的系統集成過程,還可能涉及系統重新配置、測試和故障排除。
極力減少對數據中心運行的影響
為解決上述兩個關鍵問題,減輕不利影響,數據中心運營商在評估 DCI 擴展項目解決方案時應考慮靈活性、冗余、互操作性三大因素。
● 靈活性:微型模塊化數據中心 (MMDC) 等模塊化方式有助于提高運行靈活度和系統彈性。運營商可利用模塊化交換機,按需增加擴展模塊。模塊化設計的靈活性最高,便于運營商通過增加應用專用的關鍵任務模塊,提升數據中心能級,這些模塊中包含了監控和管理散熱、不間斷供電、總能耗的傳感器和控制器。
● 冗余:為 DCI 建立適當冗余有助于最大程度減少系統停機時間,這在系統擴展或優化期間尤為重要。例如,集成新系統時,冗余網絡可暫時頂替常規網絡路徑發揮作用。如此一來,整個系統就可依托備用網絡,持續穩定運行。
● 互操作性:系統擴展或升級后,既有設備可能與新設備或設置不兼容。更換既有設備可能不現實,那就必須想辦法讓 DCIM 系統能夠監測和控制包括既有設備在內的所有關鍵設備。在系統之間使用工業協議轉換器是一種性價比較高的解決方案。例如,BACnet 轉 Modbus 轉換器可以擔任兩種通信協議之間的“翻譯”,幫助 DCIM 系統與電力管理系統和散熱系統建立通信。
DCI 擴展就像是在空中為客機加油,飛機不能停止飛行,數據中心也不能停止運行。因此,小錯誤也可能給運營商造成巨大損失,嚴重影響業務發展。由于電力和散熱系統在 DCI 建設、擴展、運行總成本中占據“大半江山”,必須從一開始就考慮靈活性、冗余和穩定性,制定合理的設備采購計劃和周密的項目計劃,未雨綢繆,才能一路通達。