Linux操作系統(tǒng)的內存使用機制研究
以下主要說明swap和buffer cache機制
Linux支持虛擬內存(virtual memory),虛擬內存是指使用磁盤當作RAM的擴展,這樣可用的內存的大小就相應地增大了。內核會將暫時不用的內存塊的內容寫到硬盤上,這樣一來,這塊內存就可用于其它目的。當需要用到原始的內容時,它們被重新讀入內存。這些操作對用戶來說是完全透明的;Linux下運行的程序只是看到有大量的內存可供使用而并沒有注意到時不時它們的一部分是駐留在硬盤上的。當然,讀寫硬盤要比直接使用真實內存慢得多(要慢數(shù)千倍),所以程序就不會象一直在內存中運行的那樣快。用作虛擬內存的硬盤部分被稱為交換空間(swap space)。
一般,在交換空間中的頁面首先被換入內存;如果此時沒有足夠的物理內存來容納它們又將被交換出來(到其他的交換空間中)。如果沒有足夠的虛擬內存來容納所有這些頁面,Linux就會波動而不正常;但經(jīng)過一段較長的時間Linux會恢復,但此時系統(tǒng)已不可用了。
有時,盡管有許多的空閑內存,仍然會有許多的交換空間正被使用。這種情況是有可能發(fā)生的,例如如果在某一時刻有進行交換的必要,但后來一個占用很多物理內存的大進程結束并釋放內存時。被交換出的數(shù)據(jù)并不會自動地交換進內存,除非有這個需要時。此時物理內存會在一段時間內保持空閑狀態(tài)。對此并沒有什么可擔心的,但是知道了是怎么一回事,也就無所謂了。
許多操作系統(tǒng)使用了虛擬內存的方法。因為它們僅在運行時才需要交換空間,以解決不會在同一時間使用交換空間,因此,除了當前正在運行的操作系統(tǒng)的交換空間,其它的就是一種浪費。所以讓它們共享一個交換空間將會更有效率。
注意,如果會有幾個人同時使用這個系統(tǒng),他們都將消耗內存。然而,如果兩個人同時運行一個程序,內存消耗的總量并不是翻倍,因為代碼頁以及共享的庫只存在一份。
Linux系統(tǒng)常常動不動就使用交換空間,以保持盡可能多的空閑物理內存。即使并沒有什么事情需要內存,Linux也會交換出暫時不用的內存頁面。這可以避免等待交換所需的時間:當磁盤閑著,就可以提前做好交換。
可以將交換空間分散在幾個硬盤之上。針對相關磁盤的速度以及對磁盤的訪問模式,這樣做可以提高性能。
高速緩沖
與訪問(真正的)的內存相比,磁盤的讀寫是很慢的。另外,在相應較短的時間內多次讀磁盤同樣的部分也是常有的事。例如,某人也許首先閱讀了一段e-mail消息,然后為了答復又將這段消息讀入編輯器中,然后又在將這個消息拷貝到文件夾中時,使得郵件程序又一次讀入它?;蛘呖紤]一下在一個有著許多用戶的系統(tǒng)中 ls命令會被使用多少次。通過將信息從磁盤上僅讀入一次并將其存于內存中,除了第一次讀以外,可以加快所有其它讀的速度。這叫作磁盤緩沖(disk buffering),被用作此目的的內存稱為高速緩沖(buffer cache)。
但是,由于內存是一種有限而又不充足的資源,高速緩沖不可能做的很大(它不可能包容要用到的所有數(shù)據(jù))。當緩沖充滿了數(shù)據(jù)時,其中最長時間不用的數(shù)據(jù)將被舍棄以騰出內存空間用于新的數(shù)據(jù)。
對寫磁盤操作來說磁盤緩沖技術同樣有效。一方面,被寫入磁盤的數(shù)據(jù)常常會很快地又被讀出(例如,原代碼文件被保存到一個文件中,又被編譯器讀入),所以將要被寫的數(shù)據(jù)放入緩沖中是個好主意。另一方面,通過將數(shù)據(jù)放入緩沖中,而不是將其立刻寫入磁盤,程序可以加快運行的速度。以后,寫的操作可以在后臺完成,而不會拖延程序的執(zhí)行。
大多數(shù)操作系統(tǒng)都有高速緩沖(盡管可能稱呼不同),但是并不是都遵守上面的原理。有些是直接寫(write-through):數(shù)據(jù)將被立刻寫入磁盤(當然,數(shù)據(jù)也被放入緩存中)。如果寫操作是在以后做的,那么該緩存被稱為后臺寫(write-back)。后臺寫比直接寫更有效,但也容易出錯:如果機器崩潰,或者突然掉電,緩沖中改變過的數(shù)據(jù)就被丟失了。如果仍未被寫入的數(shù)據(jù)含有重要的薄記信息,這甚至可能意味著文件系統(tǒng)(如果有的話)已不完整。
針對以上的原因,出現(xiàn)了很多的日志文件系統(tǒng),數(shù)據(jù)在緩沖區(qū)修改后,同時會被文件系統(tǒng)記錄修改信息,這樣即使此時系統(tǒng)掉電,系統(tǒng)重啟后會首先從日志記錄中恢復數(shù)據(jù),保證數(shù)據(jù)不丟失。當然這些問題不再本文的敘述范圍。
由于上述原因,在使用適當?shù)年P閉過程之前,絕對不要關掉電源,sync命令傾空(flushes)緩沖,也即,強迫所有未被寫的數(shù)據(jù)寫入磁盤,可用以確定所有的寫操作都已完成。在傳統(tǒng)的UNIX系統(tǒng)中,有一個叫做update的程序運行于后臺,每隔30秒做一次sync操作,因此通常無需手工使用sync命令了。Linux另外有一個后臺程序,bdflush,這個程序執(zhí)行更頻繁的但不是全面的同步操作,以避免有時sync的大量磁盤I/O操作所帶來的磁盤的突然凍結。
在Linux中,bdflush是由update啟動的。通常沒有理由來擔心此事,但如果由于某些原因bdflush進程死掉了,內核會對此作出警告,此時你就要手工地啟動它了(/sbin/update)。
緩存(cache)實際并不是緩沖文件的,而是緩沖塊的,塊是磁盤I/O操作的最小單元(在Linux中,它們通常是1KB)。這樣,目錄、超級塊、其它文件系統(tǒng)的薄記數(shù)據(jù)以及非文件系統(tǒng)的磁盤數(shù)據(jù)都可以被緩沖了。
緩沖的效力主要是由它的大小決定的。緩沖太小的話等于沒用:
它只能容納一點數(shù)據(jù),因此在被重用時,所有緩沖的數(shù)據(jù)都將被傾空。實際的大小依賴于數(shù)據(jù)讀寫的頻次、相同數(shù)據(jù)被訪問的頻率。只有用實驗的方法才能知道。
如果緩存有固定的大小,那么緩存太大了也不好,因為這會使得空閑的內存太小而導致進行交換操作(這同樣是慢的)。為了最有效地使用實際內存,Linux自動地使用所有空閑的內存作為高速緩沖,當程序需要更多的內存時,它也會自動地減小緩沖的大小。
這就是一般情況下linux內存的一般機制,當然linux內存的運行機制遠遠比這個復雜,但是只有了解了這個機制,我們管理服務器才能得心應手!
評論