監(jiān)視Linux系統(tǒng)資源的使用情況
一、如何監(jiān)視系統(tǒng)資源?
在Windows操作系統(tǒng)中,可以通過(guò)任務(wù)管理器來(lái)查詢(xún)各個(gè)進(jìn)程所占用的CPU與內(nèi)存的比率。在Linux操作系統(tǒng)中沒(méi)有這種圖形化的管理。在命令行模式下,鍵入top命令,即可以看到各個(gè)進(jìn)程所占用的系統(tǒng)資源。
作為一個(gè)合格的系統(tǒng)管理員,出于系統(tǒng)性能優(yōu)化或者其他方面的考慮,往往需要掌握系統(tǒng)中最消耗CPU或者內(nèi)存資源的程序。為了達(dá)到這個(gè)目的,系統(tǒng)管理員就需要借助系統(tǒng)提供的top命令。這個(gè)命令可以幫助管理員監(jiān)控系統(tǒng)資源的使用情況,包括內(nèi)存、CPU、交換文件分區(qū)的使用率等等。如上圖所示,就是這個(gè)命令的執(zhí)行結(jié)果。系統(tǒng)管理員想要提升操作系統(tǒng)的性能,第一步就是需要讀懂上面這張表格。如果這種圖中的內(nèi)容系統(tǒng)管理員無(wú)法看懂,那么他就想提升系統(tǒng)的性能根本無(wú)法入手。
Top命令的運(yùn)行結(jié)果大致可以分為兩個(gè)部分。上半部是使一些統(tǒng)計(jì)的信息,包括內(nèi)存和交換分區(qū)的使用情況、CPU的運(yùn)行情況、進(jìn)程的總數(shù)等等。在這些統(tǒng)計(jì)信息中,系統(tǒng)管理員除了要關(guān)注這些重要資源的使用濾外,還需要注意進(jìn)程運(yùn)行的狀態(tài)。如上圖所示,可見(jiàn)在Linux系統(tǒng)中進(jìn)程的狀態(tài)主要有四種,分別為running、sleeping、stopped和zombie。如果從系統(tǒng)維護(hù)與性能優(yōu)化考慮,則系統(tǒng)管理員需要關(guān)注那些狀態(tài)為zombie的進(jìn)程。若進(jìn)程處于這個(gè)狀態(tài),在Linux操作系統(tǒng)中叫做僵尸進(jìn)程。什么叫做僵尸進(jìn)程呢?就是那些父進(jìn)程還沒(méi)死、但是子進(jìn)程卻死了的進(jìn)程。在Linux操作系統(tǒng)中,進(jìn)程一般分為父進(jìn)程和子進(jìn)程。某個(gè)進(jìn)程A可能會(huì)調(diào)用另外一個(gè)進(jìn)程B。此時(shí)這個(gè)進(jìn)程A就叫做父進(jìn)程,而進(jìn)程B就叫做子進(jìn)程。由于一些意外的情況,子進(jìn)程運(yùn)行已經(jīng)停止,但是父進(jìn)程卻還不知道子進(jìn)程早已停止運(yùn)行,還在那邊傻傻的等待著子進(jìn)程返回運(yùn)行結(jié)果。由于子進(jìn)程沒(méi)有返回結(jié)果,則父進(jìn)程可能一直會(huì)在那邊等待。從而導(dǎo)致系統(tǒng)性能的下降。如果系統(tǒng)管理員發(fā)現(xiàn)有僵尸進(jìn)程的話,首先要做的就是結(jié)束父進(jìn)程(有時(shí)候還需要查看這個(gè)父進(jìn)程打開(kāi)的其他子進(jìn)程運(yùn)行情況),以釋放其占用的系統(tǒng)資源。其次如果這種情況發(fā)生的比較頻繁時(shí),則系統(tǒng)管理員就需要分析到底是什么原因?qū)е逻@種情況發(fā)生的。找到原因后要采取積極的措施。通常情況下,如果子進(jìn)程的狀態(tài)為“僵尸”時(shí),父進(jìn)程就不會(huì)自動(dòng)結(jié)束,從而其占用的系統(tǒng)資源就不會(huì)自動(dòng)釋放,從而降低操作系統(tǒng)的性能。
二、Top命令的使用技巧。
1、 選擇合適的排序順序
在Windows操作系統(tǒng)的任務(wù)管理器中,管理員可以根據(jù)需要選擇合適的排序順序,如按CPU排序或者按內(nèi)存的使用率進(jìn)行排序。而在top命令的顯示結(jié)果中,默認(rèn)情況下是按照CPU的使用率來(lái)進(jìn)行排序的。如果現(xiàn)在系統(tǒng)管理員想按照內(nèi)存使用率來(lái)排序,該如何處理呢?如果要想改變top命令結(jié)果的排序順序,則可以按m鍵來(lái)按內(nèi)存進(jìn)行排序。注意這里的m是小寫(xiě),而不是大寫(xiě)的。在Linux操作系統(tǒng)中大部分命令與參數(shù)大小寫(xiě)都是敏感的。這跟微軟操作系統(tǒng)中的DOS命令不同。Dos命令是不區(qū)分大小寫(xiě)的。雖然這個(gè)排序沒(méi)有像微軟操作系統(tǒng)中的任務(wù)管理器那么方便,只需要點(diǎn)點(diǎn)鼠標(biāo)就可以完成排序。但是只要熟悉相關(guān)的命令,在命令行中對(duì)其排序沒(méi)有大家想想的那么困難。
2、 監(jiān)視特定用戶(hù)使用的資源情況。
在Windows操作系統(tǒng)中,如果想要查看特定帳戶(hù)所打開(kāi)的進(jìn)程以及所耗用的系統(tǒng)資源,操作非常簡(jiǎn)單。只需要打開(kāi)系統(tǒng)任務(wù)管理器,然后按照用戶(hù)來(lái)進(jìn)行排序。就可以知道某個(gè)用戶(hù)開(kāi)啟了哪些進(jìn)程以及所占用的比例。而在top命令中,沒(méi)有按帳戶(hù)進(jìn)行排序的功能。即在上面這個(gè)顯示結(jié)果中,只可以按照內(nèi)存使用率或者CPU負(fù)載來(lái)進(jìn)行排序,而無(wú)法按照用戶(hù)來(lái)進(jìn)行排序。如上圖所示,在同一個(gè)結(jié)果中夾雜著系統(tǒng)特權(quán)用戶(hù)root與普通用戶(hù)所打開(kāi)的進(jìn)程。這對(duì)于系統(tǒng)管理員查找問(wèn)題原因非常的不方便。有時(shí)候系統(tǒng)管理員往往需要只查看特定用戶(hù)的進(jìn)程,如只需要查看oracle帳戶(hù)所打開(kāi)的進(jìn)程以及所占用的系統(tǒng)資源。而忽略掉系統(tǒng)帳戶(hù)。因?yàn)樘貦?quán)帳戶(hù)其他用戶(hù)無(wú)權(quán)進(jìn)行登陸操作,而其運(yùn)行的往往是一些系統(tǒng)級(jí)別的進(jìn)程,為此一般不會(huì)出現(xiàn)問(wèn)題。而普通用戶(hù)可以運(yùn)行一些應(yīng)用程序。有時(shí)候他們糊里糊涂可能會(huì)打開(kāi)一些非法程序,占用大量的系統(tǒng)資源,從而降低系統(tǒng)性能。廢話少說(shuō),如何才能夠查看特定帳戶(hù)所啟動(dòng)的進(jìn)程呢?其實(shí)很簡(jiǎn)單。現(xiàn)運(yùn)行top命令,讓系統(tǒng)統(tǒng)計(jì)所有帳戶(hù)的進(jìn)程。然后在需要查看特定帳戶(hù)的進(jìn)程使,只需要按u鍵(注意小寫(xiě)),然后輸入用戶(hù)名即可。此時(shí)系統(tǒng)會(huì)自動(dòng)把其他帳戶(hù)的進(jìn)程過(guò)濾掉,方便系統(tǒng)管理員查看。按用戶(hù)過(guò)濾后,仍然可以按m鍵來(lái)對(duì)現(xiàn)實(shí)的結(jié)果進(jìn)行過(guò)濾。如果在一開(kāi)始就需要查看某個(gè)特定用戶(hù)的進(jìn)程,那么只需要直接在top命令后面加入-u可選項(xiàng)然后帶上具體的用戶(hù)名即可。但是,此時(shí)如果再想查看全部用戶(hù)的話,那么只有先推出top命令,然后再利用top命令不帶任何選項(xiàng),來(lái)查看所有用戶(hù)的進(jìn)程?;蛘哒f(shuō),再在這個(gè)窗口中輸入字符u,然后直接按回車(chē)鍵,也可以顯示所用用戶(hù)的進(jìn)程信息。
3、動(dòng)態(tài)統(tǒng)計(jì)信息。
使用top命令來(lái)統(tǒng)計(jì)進(jìn)程的運(yùn)行信息,跟微軟操作系統(tǒng)的任務(wù)管理器一樣,都是動(dòng)態(tài)調(diào)整的。也就是說(shuō),系統(tǒng)會(huì)每隔一段時(shí)間去統(tǒng)計(jì)這個(gè)信息,然后動(dòng)態(tài)的顯示在窗口中。不需要用戶(hù)手工去更新相關(guān)的信息。而且從上面的圖形中可以看出,top命令統(tǒng)計(jì)的信息要比微軟任務(wù)管理器統(tǒng)計(jì)的信息要多的多。所以對(duì)系統(tǒng)管理員來(lái)說(shuō),具有更大的參考價(jià)值。筆者以前也很喜歡采用微軟操作系統(tǒng)的任務(wù)管理器。而了解了top命令后,就對(duì)其鐘愛(ài)有加了。因?yàn)槠洳粌H可以完成任務(wù)管理器中的所有功能。而且top命令中有的信息在微軟任務(wù)管理器中卻無(wú)法顯示。而這些信息往往對(duì)我們維護(hù)系統(tǒng)、提升性能具有很大的參考價(jià)值。
4、刪除有異常的進(jìn)程。
如果這個(gè)窗口中,發(fā)現(xiàn)某些進(jìn)程有異常或者用戶(hù)執(zhí)行了規(guī)定以外的應(yīng)用程序,如占用了太多的系統(tǒng)資源或者有僵尸進(jìn)程的存在,則可以直接在這個(gè)窗口中講其刪除。操作的方法很簡(jiǎn)單,只需要在這個(gè)窗口內(nèi)輸入字符p,然后系統(tǒng)會(huì)提示系統(tǒng)管理員輸入要關(guān)閉進(jìn)程的PID。管理員只需要鍵入這個(gè)值,然后按回車(chē)鍵就可以殺掉不需要的進(jìn)程。不過(guò)在關(guān)閉進(jìn)程的時(shí)候,有權(quán)限的限制。系統(tǒng)特權(quán)帳戶(hù)root可以關(guān)閉所有用戶(hù)的進(jìn)程。而普通帳戶(hù)則只能夠刪除自己打開(kāi)的程序,而無(wú)法關(guān)閉其他用戶(hù)的進(jìn)程。如現(xiàn)在系統(tǒng)管理員先以oracle用戶(hù)登錄,發(fā)現(xiàn)root帳戶(hù)下某個(gè)進(jìn)程異常,想要關(guān)閉時(shí),系統(tǒng)會(huì)提示無(wú)法關(guān)閉的錯(cuò)誤信息。此時(shí)管理員必須先終止這個(gè)top進(jìn)程,然后利用su命令更改登陸的帳戶(hù)。然后再關(guān)閉這個(gè)異常的進(jìn)程。系統(tǒng)管理員可以同時(shí)關(guān)閉多個(gè)進(jìn)程。方法很簡(jiǎn)單,就是同時(shí)輸入多個(gè)需要關(guān)閉的進(jìn)程號(hào)。在各個(gè)進(jìn)程號(hào)之間需要利用逗號(hào)隔開(kāi)。
top在系統(tǒng)維護(hù)中是一個(gè)很有用的命令。除了可以實(shí)現(xiàn)如上的功能外,還可以設(shè)置其動(dòng)態(tài)更新的時(shí)間間隔等等。不過(guò)需要注意的是,在不同版本的Linux系統(tǒng)中其功能稍有差異,而且其顯示的布局與內(nèi)容也有所不同。為此當(dāng)系統(tǒng)管理員維護(hù)其不怎么熟悉的版本時(shí),有時(shí)候需要查看系統(tǒng)的幫助說(shuō)明。此時(shí)只需要在top命令后面加上?號(hào)就可以獲得相關(guān)的幫助。這個(gè)聯(lián)機(jī)幫助文檔根top命令一樣,都是系統(tǒng)管理員的好幫手。不過(guò)可惜的是,現(xiàn)在這些在線幫助文檔都是英文的。所以這對(duì)系統(tǒng)管理員的英文說(shuō)明要求比較高。
linux操作系統(tǒng)文章專(zhuān)題:linux操作系統(tǒng)詳解(linux不再難懂)
評(píng)論