資料中心的管理及持續營運
想要維持資料中心長期每天正常運作,不僅僅是要做好環境建置及設備維護,Uptime Institute LLC顧問王衛道指出,資料中心的作業流程及管理也非常重要,Uptime Institute為此不僅提供機房的設計與建設認證,也對於機房的持續營運提供標準及認證,且採Tier I?IV分級。
王衛道表示,許多資料中心之所以要採用Uptime Institute的標準,是因為Uptime Institute很早就已提出,且已在65個以上的國家發出600多個認證,廣受國際肯定,而且所有的標準都是透過業者諮詢委員會提出,這些委員都是已經認證過的業者,其根據實際的狀況所訂出的標準,也比較能被其他使用者所接受。
此外,王衛道強調,Uptime Institute的標準,是基於績效的基本概念,使用者要如何達到各種不同的標準,設計師可以根據不同的空間或預算等狀況來設計,沒有非常硬性的規定,不但有助於鼓勵創新工程,同時也可能符合使用者喜好。
想要建立一個比較好或可靠的資料中心,王衛道認為,包括機房設計及持續營運都要夠標準。所謂的持續營運,主要是指機房運作的行為和風險,是否會超出設計結構,影響資料中心的運轉,進而影響滿足業務或任務目標的長期營運能力。
為什麼持續營運這麼重要?王衛道指出,機房會出問題,大概有70%是因為人為失誤,而不是基礎設施或設計所造成。而且透過標準認證,也可以用來作為資料中心的投資效能評估指標,管理是否真的有效,以實現業務或任務目標。
事實上,現有的資料中心其時遭遇不少難題。如機房建置時間已久,當初的設計已經不合標準,或是員工沒有經過適當的訓練,或是標準作業流程有疏失,甚至根本不存在。王衛道表示,Uptime Institute為此特別提出Management & Operations(M&O)的認證服務,可以幫助企業針對資料中心長期營運能力進行完整的評估,有助於企業建置符合標準的資料中心。
王衛道強調,M&O計劃是一個獨立的標準認證,致力於成為公正的第三方驗證,以驅動各行各業的運營和現場管理所實際需要的結果。M&O計劃除提供現場管理框架,用來評估機房管理的行為及風險,同時也可能因應現今的多重計算環境。
對於資料中心的要求,除了必須是正在營運中外,還適合有24×7的正常運行時間之要求、高停機成本、非Tier認證的設計和設施,及有致力於追求卓越的運營績效等之機房。以人為錯誤為例,除了操作錯誤外,更重要的是,有關人員編制、培訓、維護和操作的管理決策是否嚴謹。
王衛道指出,通過由M&O聯合審核的管理和操作,可以確保資料中心持續運作,由於參與標準制定的組織非常多,包括企業所有者、外包業者及第三方解決方案用戶等,而且不管是運營商和業主,雙方都會相當專注於如何解決資料中心真正重要的問題。
而在審查過程方面,除了Uptime Institute會執行專業審查服務外,而且絕對可以保持中立,不會要求企業一定要用什麼設備,而且會由資深專業人士以實際的資料中心運營經驗,基於M&O計畫進行驗證,而且一定會先跟客戶約定好,配合客戶的需求,選擇最為適當的時間,認真制定方法,絕對不會影響資料中心的作業。
如在查看資料中心操作時,Uptime Institute會根據客戶提供的行為分析,了解現有的資源是否能有效地利用,是否能真正落實執行,如標籤管理等。同時也會深入了解,資料中心是否有完善的管理辦法及管理流程,還要進一步觀察,是否有完整的執行紀錄,如定期保養工單等,由誰負責認證,使用那些工具,如何執行等。
王衛道強調,Uptime Institute的標準認證,不會有各種硬性規定,要求客戶填寫許多表格,而是注重現有的行為是否有效,因為每一家企業的資料中心都會有不同的管理方法,因此會積極專注於資料中心的預期需求,而不只是制式的反應,致力於協助持續改善並熟練原本所規範的方法,完善資料中心的管理和實施的詳盡流程。
審查的項目包括五大項,第一項是人員的編制及資格,如是否具備維修空調設備的能力與資格,組織的事權是否統一等;第二項是維護作業,包括是否有預防性維護、清潔作業是否有標準作業流程、有無MMS用來定時追蹤維護作業、維護遞延時是否會記得處理、供應商能否提供足夠的支援、是否有預測性維護、設備生命週期規劃、故障分析程序等;第三項是訓練,不僅是資料中心的工作人員,供應商也需要納入訓練範圍;第四項是規劃、協調及管理,包括數據中心政策、財務流程、參考圖書、容量管理等;第五項是工作條件規範,如危險溫度評級,一定要有完整的操作設置點。
王衛道強調,評估運營行為是否有效,可以參考幾項原則,如企業是否願意主動積極的管理,並且能否真正加以實踐,非常重要,而且要讓所有資訊能夠自由流通,讓所有相關人員都能夠分享各種經驗及知識,人員才能有所成長。
王衛道強調,改善資料中心的管理,不見得需要花費很多費用,有時只要閥門放在正確的位置,就可以達到預期的管理目標。一旦通過驗證,就會得到M&O標章,而且可以得到完整的評估結果及建議,每個行為的有效性評估及改進的可行性建議,提供企業機房管理完整的參考。