代碼段 |
數據段 |
堆棧段 |
代碼段是存放了程序代碼的數據,假如機器中有數個進程運行相同的一個程序,那么它們就可以使用同一個代碼段。而數據段則存放程序的全局變量、常數及動態數據分配的數據空間。堆棧段存放的就是子進程的返回地址、子程序的參數及程序的局部變量。堆棧段包含在進程控制塊PCB(Process Control Block)中。PCB處于進程核心堆棧的底部,不需要額外分配空間。
四.進程狀態
現在我們來看看,進程在生存周期中的各種狀態及狀態的轉換。下面是Linux系統的進程狀態模型的各種狀態。
現在我們從進程的創建到退出來看看進程的狀態轉化。需要說明的是,進程在它的生命周期里并不一定要經歷所有狀態。
五.Linux進程的創建
fork函數在Linux下產生新的進程的系統調用,這個函數名是英文中“分叉”的意思。為什么取這個名字呢? 因為一個進程在運行中,如果使用了fork,就產生了另一個進程,于是進程就“分叉”了,所以這個名字取得很形象。fork的語法如下所示:
在Linux網絡編程中經常用到fork()系統調用。例如在一個客戶機/Web服務器構建的網絡環境中,Web服務器往往可以滿足許多客戶端的請求。如果一個客戶機要訪問Web服務器,需要發送一個請求,此時由服務器生成一個父進程,然后父進程通過fork()系統調用產生一個子進程,此時客戶機的請求由子進程完成。父進程可以再度回到等待狀態不斷服務其他客戶端。原理如下圖所示。
有一個更簡單的執行其他程序的函數system,參數string傳遞給一個命令解釋器(一般為sh)執行,即string被解釋為一條命令,由sh執行該命令。若參數string為一個空指針,則檢查命令解釋器是否存在。該命令可以和同命令行下的命令形式相同,但由于命令作為一個參數放在系統調用中,應注意編譯時對特殊意義字符的處理。命令的查找是按PATH環境變量的定義執行的。命令所生成的后果一般不會對父進程編程造成影響。返回值:當參數為空指針時,只有當命令解釋器有效時返回值為非零。若參數不為空指針,返回值為該命令的返回狀態(同waitpid())的返回值。命令無效或語法錯誤則返回非零值,所執行的命令被終止。其他情況則返回-1.它是一個較高層的函數,實際上相當于在shell下執行一條命令,除了system之外,系統調用exec來執行一個可執行文件,來代替當前進程的執行映像。系統調用exit的功能是終止發出調用的進程。sleep函數調用用來指定進程掛起的秒數。wait函數族用來等待和控制進程。poppen函數和system函數類似,區別是它用管道方式處理輸出。
父進程和子進程的關系是管理和被管理的關系,當父進程終止時,子進程也隨之而終止。但子進程終止時,父進程并不一定終止。比如httpd服務器運行時,我們可以殺掉其子進程,父進程并不會因為子進程的終止而終止。
六.進程的管理
1.啟動進程
輸入需要運行的程序的程序名,執行一個程序,其實也就是啟動了一個進程。在Linux系統中,每個進程都具有一個進程號(PID),用于系統識別和調度進程。啟動一個進程有兩個主要途徑:手工啟動和調度啟動,后者是事先進行設置,根據用戶要求自動啟動。由用戶輸入命令,直接啟動一個進程便是手工啟動進程。但手工啟動進程又可以分為很多種,根據啟動的進程類型不同;性質不同,實際結果也不一樣。
(1)前臺啟動
前臺啟動是手工啟動一個進程的最常用的方式。用戶鍵入一個命令“df”,就已經啟動了一個進程,而且是一個前臺的進程。這時候系統其實已經處于多進程狀態。有許多運行在后臺的、系統啟動時就已經自動啟動的進程正在悄悄運行著。有的用戶在鍵入“df”命令以后趕緊使用“ps -x”查看,卻沒有看到df進程,會覺得很奇怪。其實這里因為df這個進程結束太快,使用ps查看時該進程已經執行結束了。如果啟動一個比較耗時的進程,例如在根命令下運行:find,然后使用ps aux查看,就會看到在里面有一個find進程。
(2)后臺啟動
直接從后臺手工啟動一個進程用得比較小一些,除非是該進程甚為耗時,且用戶也不急著需要結果。假設用戶要啟動一個需要長時間運行的格式化文本文件的進程,為了不使整個shell在格式化過程中都處于“癱瘓”狀態,從后臺啟動這個進程是明智的選擇。
2.進程調度
當需要中斷一個前臺進程的時候,通常使用Ctrl+C組合鍵。但是對于一個后臺進程,就不是一個組合鍵所能解決的了,這時就必須使用kill命令。該命令可以終止后臺進程。至于終止后臺進程的原因有很多,或許是該進程占用的CPU時間過多;或許是該進程已經掛死。這種情況是經常發生的。kill命令的工作原理是:向Linux系統的內核發送一個系統操作信號和某個程序的進程標識號,然后系統內核就可以對進程標識號指定的進程進行操作。
七.Linux的第一個進程:init
init是Linux系統執行的第一個進程,進程ID為1,是系統所有進程的起點,主要用來執行一些開機初始化腳本和監視進程。Linux系統在完成核內引導以后就開始運行init程序,init程序需要讀取配置文件/etc/inittab。Inittab是一個不可執行的文本文件,它由若干行命令所組成。
在RHEL 4系統中,inittab配置文件的內容如下所示:
Inittab配置文件每行的基本格式如下。
id:runlevels:action:procees
其中某些部分可以為空,下面我們逐一介紹。
1.id
1~2個字符,配置行的惟一標識,在配置文件中不能重復。
2.runlevels
配置行適用的運行級別,在這里可填入多個運行級別,比如12345或者35等。
Linux有7個運行級別:
0:關機
1:單用戶字符界面
2:不具備網絡文件系統(NFS)功能的多用戶字符界面
3:具有網絡功能的多用戶字符界面
4:保留不用
5:具有網絡功能的圖形用戶界面
6:重新啟動系統
3.action
init有如下幾種行為,如下表所示。
init行為
行為 |
描述 |
respawn |
啟動并監視第4項指定的process,若process終止則重啟它 |
wait |
執行第4項指定的process,并等待它執行完備 |
once |
執行第4項指定的process |
boot |
不論在哪個執行等級,系統啟動時都會運行第4項指定的process |
bootwait |
不論在哪個執行等級,系統啟動時都會運行第4項指定的process,且一直等它執行完備 |
off |
關閉任何動作,相當于忽略該配置行 |
ondemand |
進入ondemand執行等級時,執行第4項指定的process |
initdefault |
系統啟動后進入的執行等級,該行不需要指定process |
sysinit |
不論在哪個執行等級,系統會在執行boot及bootwait之前執行第4項指定的process |
powerwait |
當系統的供電不足時執行第4項指定的process,且一直等它執行完備 |
powerfailnow |
當系統的供電嚴重不足時執行第4項指定的process |
ctrlaltdel |
當用戶按下ctrl+alt+del 時執行的操作 |
kbrequest |
當用戶按下特殊的組合鍵時執行第4項指定的process,此組合鍵需在keymaps文件定義 |
4.process
Process為init執行的進程,這些進程都保存在目錄/etc/rc.d/rcX中,其中的X代表運行級別,rc程序接收X參數,然后運行/etc/rc.d/rc.X下面的程序。使用如下命令可以查看/etc/rc.d目錄內容。
使用如下命令查看/etc/rc.d/rc5.d的內容。
這些文件都是符號鏈接,以S打頭的標識啟動該程序,而以K打頭的標識終止該程序,后面的數字標識執行順序,越小越先執行,剩下的標識程序名。系統啟動或者切換到該運行級別時會執行以S打頭的程序,系統切換到該運行級別時會執行以K打頭的程序。
這個目錄下的程序可通過chkconfig程序進行管理,當然這個目錄下的程序需要符合一定規范,如果了解shell編程,可以查看這些符號鏈接所指向的程序的源碼。
init也是一個進程,和普通的進程具有一樣的屬性。比如修改了/etc/inittab,想讓修改馬上生效,可通過運行“kill-SIGHUP 1”來實現,也可通過運行“init q”來實現。
八.Linux的線程簡介
1.Linux線程的定義
線程(thread)是在共享內存空間中并發的多道執行路徑,它們共享一個進程的資源,如文件描述和信號處理。在兩個普通進程(非線程)間進行切換時,內核準備從一個進程的上下文切換到另一個進程的上下文要花費很大的開銷。這里上下文切換的主要任務是保存老進程CPU狀態并加載新進程的保存狀態,用新進程的內存映像替換進程的內存映像。線程允許你的進程在幾個正在運行的任務之間進行切換,而不必執行前面提到的完整的上下文。另外本文介紹的線程是針對POSIX線程的,也就是Pthread。也因為Linux對它的支持最好,相對進程而言,線程是一個更加接近于執行體的概念,它可以與同進程中的其他線程共享數據,但擁有自己的棧空間,擁有獨立的執行序列。在串行程序基礎上引入線程和進程是為了提高程序的并發度,從而提高程序運行效率和響應時間。也可以將線程和輕量級進程(LWP)視為等同的,但其實在不同的系統/實現中有不同的解釋,LWP更恰當的解釋為一個虛擬CPU或內核的線程。它可以幫助用戶態線程實現一些特殊的功能。Pthread是一種標準化模型,它用來把一個程序分成一組能夠同時執行的任務。
2.什么場合使用Pthread,即線程
(1)在返回前阻塞的I/O任務能夠使用一個線程處理I/O,同時繼續執行其他處理任務。
(2)在有一個或多個任務受不確定性事件,比如網絡通信的可獲得性影響的場合,能夠使用線程處理這些異步事件,同時繼續執行正常的處理。
(3)如果某些程序功能比其他的功能更重要,可以使用線程以保證所有功能都出現,但那些時間密集型的功能具有更高的優先級。
以上三點可以歸納為:在檢查程序中潛在的并行性時,也就是說在要找出能夠同時執行任務時使用Pthread。上面已經介紹了,Linux進程模型提供了執行多個進程的能力,已經可以進行并行或并發編程,可是純種能夠讓你對多個任務的控制程序更好、使用資源更少,因為一個單一的資源,如全局變量,可以由多個線程共享。而且,在擁有多個處理器的系統上,多線程應用會比用多個進程實現的應用執行速度更快。
3.Linux進程和線程的發展
1999年1月發布的Linux 2.2內核中,進程是通過系統調用fork創建的,新的進程是原來進程的子進程。需要說明的是,在2.2.x版本中,不存在真正意義上的線程(thread)。Linux中常用的線程Pthread實際上是通過進程來模擬的。也就是說Linux中的線程也是通過fork創建的,是“輕”進程。Linux 2.2只默認允許4096個進程/線程同時運行。高端系統同時要服務上千個用戶,所以這顯然是一個問題,它一度是阻礙Linux進入企業級市場的一大因素。
2001年1月發布的Linux 2.4內核消除了這個限制,并且允許在系統運行中動態調整進程數上限。因此,進程數現在只受制于物理內存的多少。在高端服務器上,即使安裝了512MB內存,現在也能輕而易舉地同時支持1萬6千個進程。
2003年12月發布的2.6內核,進程調度經過重新編寫,去掉了以前版本中效率不高的算法。以前,為了決定下一步要運行哪一個任務,進程調度程序要查看每一個準備好的任務,并且經過計算機來決定哪一個任務相對來更為重要。進程標識號(PID)的數目也從32000升到10億。內核內部的大改變之一就是Linux的線程框架被重寫,以使NPTL(Native POSIX Thread Library)可以運行于其上。對于運行負荷繁重的線程應用的Pentium Pro及更先進的處理器而言,這是一個主要的性能提升,也是企業級應用中的很多高端系統一直以來所期待的。線程框架的改變包含Linux線程空間中的許多新的概念,包括線程組、線程各自的本地存儲區、POSIX風格信號,以及其他改變。改進后的多線程和內存管理技術有助于更好地運行大型多媒體應用軟件。
4.總結
線程和進程在使用上各有優缺點:線程執行開銷小,但不利于資源的管理和保護;而進程正相反。同時,線程適合于在對稱處理器的計算機上運行,而進程則可以跨機器遷移。另外,進程可以擁有資源,線程共享進程擁有的資源。進程間的切換必須保存在進程控制塊PCB(Process Control Block)中。同一個進程的多個線程間的切換不用那么麻煩。最后一個實例來作為本文的結束:當你在一臺Linux PC上打開兩個OICQ,每一個OICQ是一個進程;而當你在一個OICQ上和多人聊天時,每一個聊天窗口就是一個線程。