第三是做好日常監(jiān)控工作,良好狀態(tài)離不開每天的觀察,需要時時刻刻觀察數據中心,看看數據中心發(fā)生的細小問題。每天都要對數據中心的所有運行參數進行全面檢查和記錄,慢慢地就會對數據中心運行狀態(tài)有了掌握,當某些參數變化時及時做應對之策。如設備運行的 CPU 使用率,平常監(jiān)控所有設備 CPU 使用率都在 30% 左右,突然有一天幾臺設備的 CPU 使用率無緣無故升到了 60%,這就需要進一步檢查升高的原因,直到消除問題為止。如果沒有這些平日裡的統(tǒng)計記錄,這樣的參數變化就不會引起注意,故障遲早會到來。
第四做好統(tǒng)計工作。一般的數據中心都擁有上千臺的服務器,還有其它不少的電子設備,要做好統(tǒng)計工作。如服務器多少臺,網路設備如何互連的,每臺設備的配置,應用的特性等等,這些統(tǒng)計工作馬虎不得,都關係著數十萬設備的物理安全。在平日接觸到的維護人員讓我們感受到不同的人員對自己數據中心的瞭解差異是非常大的,有些人可隨口便說出某個網段 IP 連接的機、對應的應用;而有些人卻對服務器放在哪個機架上都一無所知,當遇到問題或者轉換數據中心時,后者的表現(xiàn)是顯而易見且必定會出問題的。
專才…達人?
最后是要至少精通一門技術,數據中心需要維護人員是達人,這裡指的是需要在各方面都略懂一些;然而懂一些即代表技藝不精,這樣在數據中心裡是無法立足的。還需要有自己精通的領域,至少有一門是自己精通,而別人無法替代。如精通 Linux、Unix、網路技術、安全相關等等,這樣才能在數據中心裡立足,然后再向其它領域拓展,最終成為一個技術較為全面的 IT 專才。