線程的概念
C++中的線程的Text Segment和Data Segment都是共享的,如果定義一個函數(shù),在各線程中都可以調(diào)用,如果定義一個全局變量,在各線程中都可以訪問到。除此之外,各線程還共享以下進(jìn)程資源和環(huán)境:
- 文件描述符
- 每種信號的處理方式
- 當(dāng)前工作目錄
- 用戶id和組id
但是,有些資源是每個線程各有一份的:
- 線程id
- 上下文,包括各種寄存器的值、程序計數(shù)器和棧指針
- 棧空間
- errno變量
- 信號屏蔽字
- 調(diào)度優(yōu)先級
我們將要學(xué)習(xí)的線程庫函數(shù)是由POSIX標(biāo)準(zhǔn)定義的,稱為POSIX thread或pthread。
線程控制
創(chuàng)建線程
創(chuàng)建線程的函數(shù)原型如下:
1
2
|
#include <pthread.h> int pthread_create(pthread_t * thread , const pthread_attr_t *attr, void *(*start_routine)( void *), void *arg); |
返回值:成功返回0,失敗返回錯誤號。
在一個線程中調(diào)用pthread_create()創(chuàng)建新的線程后,當(dāng)前線程從pthread_create()返回繼續(xù)往下執(zhí)行,而新的線程所執(zhí)行的代碼由我們傳給pthread_create的函數(shù)指針start_routine決定。start_routine函數(shù)接收一個參數(shù),是通過pthread_create的arg參數(shù)傳遞給它的,該參數(shù)類型為void*,這個指針按什么類型解釋由調(diào)用者自己定義。start_routine的返回值類型也是void *,這個指針的含義同樣由調(diào)用者自己定義。start_routine返回時,這個線程就退出了,其它線程可以調(diào)用pthread_join得到start_routine的返回值。
pthread_create成功返回后,新創(chuàng)建的線程的id被填寫到thread參數(shù)所指向的內(nèi)存單元。我們知道進(jìn)程id的類型是pid_t,每個進(jìn)程的id在整個系統(tǒng)中是唯一的,調(diào)用getpid可以得到當(dāng)前進(jìn)程的id,是一個正整數(shù)值。線程id的類型是thread_t,它只在當(dāng)前進(jìn)程中保證是唯一的,在不同的系統(tǒng)中thread_t這個類型有不同的實(shí)現(xiàn),它可能是一個整數(shù)值,也可能是一個結(jié)構(gòu)體,也可能是一個地址,所以不能簡單的當(dāng)成整數(shù)用printf打印,調(diào)用pthread_self可以獲取當(dāng)前線程的id。
我們先來寫一個簡單的例子:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
|
#include <stdio.h> #include <string.h> #include <stdlib.h> #include <pthread.h> #include <unistd.h> pthread_t ntid; void printids( const void *t) { char *s = ( char *)t; pid_t pid; pthread_t tid; pid = getpid(); tid = pthread_self(); printf ( "%s pid %u tid %u (0x%x)\n" , s, (unsigned int )pid, (unsigned int )tid, (unsigned int )tid); } void *thr_fn( void *arg) { printids(arg); return NULL; } int main( void ) { int err; err = pthread_create(&ntid, NULL, thr_fn, ( void *) "Child Process:" ); if (err != 0) { fprintf (stderr, "can't create thread: %s\n" , strerror (err)); exit (1); } printids( "main thread:" ); sleep(1); return 0; } |
編譯執(zhí)行結(jié)果如下:
1
2
3
4
|
g++ thread.cpp -o thread -lpthread ./thread main thread: pid 21046 tid 3612727104 (0xd755d740) Child Process: pid 21046 tid 3604444928 (0xd6d77700) |
從結(jié)果可以知道,thread_t類型是一個地址值,屬于同一進(jìn)程的多個線程調(diào)用getpid可以得到相同的進(jìn)程號,而調(diào)用pthread_self得到的線程號各不相同。
如果任意一個線程調(diào)用了exit或_exit,則整個進(jìn)程的所有線程都終止,由于從main函數(shù)return也相當(dāng)于調(diào)用exit,為了防止新創(chuàng)建的線程還沒有得到執(zhí)行就終止,我們在main函數(shù)return之前延時1秒,這只是一種權(quán)宜之計,即使主線程等待1秒,內(nèi)核也不一定會調(diào)度新創(chuàng)建的線程執(zhí)行,接下來,我們學(xué)習(xí)一下比較好的解決方法。
終止線程
如果需要只終止某個線程而不是終止整個進(jìn)程,可以有三種方法:
- 從線程函數(shù)return。這種方法對主線程不適應(yīng),從main函數(shù)return相當(dāng)于調(diào)用exit。
- 一個線程可以調(diào)用pthread_cancel終止同一個進(jìn)程中的另一個線程。
- 線程可以調(diào)用pthread_exit終止自己。
這里主要介紹pthread_exit和pthread_join的用法。
1
2
3
|
#include <pthread.h> void pthread_exit( void *value_ptr); |
value_ptr是void*類型,和線程函數(shù)返回值的用法一樣,其它線程可以調(diào)用pthread_join獲取這個指針。
需要注意,pthread_exit或者return返回的指針?biāo)赶虻膬?nèi)存單元必須是全局的或者是用malloc分配的,不能在線程函數(shù)的棧上分配,因為當(dāng)其它線程得到這個返回指針時線程函數(shù)已經(jīng)退出了。
1
2
3
|
#include <pthread.h> int pthread_join(pthread_t thread , void **value_ptr); |
返回值:成功返回0,失敗返回錯誤號。
調(diào)用該函數(shù)的線程將掛起等待,直到id為thread的線程終止。thread線程以不同的方法終止,通過pthread_join得到的終止?fàn)顟B(tài)是不同的,總結(jié)如下:
- 如果thread線程通過return返回,value_ptr所指向的單元里存放的是thread線程函數(shù)的返回值。
- 如果thread線程被別的線程調(diào)用pthread_cancel異常終止掉,value_ptr所指向的單元存放的是常數(shù)PTHREAD_CANCELED。
- 如果thread線程是自己調(diào)用pthread_exit終止的,value_ptr所指向的單元存放的是傳給pthread_exit的參數(shù)。
如果對thread線程的終止?fàn)顟B(tài)不感興趣,可以傳NULL給value_ptr參數(shù)。參考代碼如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
|
#include <stdio.h> #include <stdlib.h> #include <pthread.h> #include <unistd.h> void * thread_function_1( void *arg) { printf ( "thread 1 running\n" ); return ( void *)1; } void * thread_function_2( void *arg) { printf ( "thread 2 exiting\n" ); pthread_exit(( void *) 2); } void * thread_function_3( void * arg) { while (1) { printf ( "thread 3 writeing\n" ); sleep(1); } } int main( void ) { pthread_t tid; void *tret; pthread_create(&tid, NULL, thread_function_1, NULL); pthread_join(tid, &tret); printf ( "thread 1 exit code %d\n" , *(( int *) (&tret))); pthread_create(&tid, NULL, thread_function_2, NULL); pthread_join(tid, &tret); printf ( "thread 2 exit code %d\n" , *(( int *) (&tret))); pthread_create(&tid, NULL, thread_function_3, NULL); sleep(3); pthread_cancel(tid); pthread_join(tid, &tret); printf ( "thread 3 exit code %d\n" , *(( int *) (&tret))); return 0; } |
運(yùn)行結(jié)果是:
1
2
3
4
5
6
7
8
|
thread 1 running thread 1 exit code 1 thread 2 exiting thread 2 exit code 2 thread 3 writeing thread 3 writeing thread 3 writeing thread 3 exit code -1 |
可見,Linux的pthread庫中常數(shù)PTHREAD_CANCELED的值是-1.可以在頭文件pthread.h中找到它的定義:
1
|
#define PTHREAD_CANCELED ((void *) -1) |
線程間同步
多個線程同時訪問共享數(shù)據(jù)時可能會沖突,例如兩個線程都要把某個全局變量增加1,這個操作在某平臺上需要三條指令才能完成:
- 從內(nèi)存讀變量值到寄存器。
- 寄存器值加1.
- 將寄存器的值寫回到內(nèi)存。
這個時候很容易出現(xiàn)兩個進(jìn)程同時操作寄存器變量值的情況,導(dǎo)致最終結(jié)果不正確。
解決的辦法是引入互斥鎖(Mutex, Mutual Exclusive Lock),獲得鎖的線程可以完成“讀-修改-寫”的操作,然后釋放鎖給其它線程,沒有獲得鎖的線程只能等待而不能訪問共享數(shù)據(jù),這樣,“讀-修改-寫”的三步操作組成一個原子操作,要不都執(zhí)行,要不都不執(zhí)行,不會執(zhí)行到中間被打斷,也不會在其它處理器上并行做這個操作。
Mutex用pthread_mutex_t類型的變量表示,可以這樣初始化和銷毀:
1
2
3
4
5
|
#include <pthread.h> int pthread_mutex_destory(pthread_mutex_t *mutex); int pthread_mutex_int(pthread_mutex_t *mutex, const pthread_mutexattr_t *attr); pthread_mutex_t mutex = PTHEAD_MUTEX_INITIALIZER; |
返回值:成功返回0,失敗返回錯誤號。
用pthread_mutex_init函數(shù)初始化的Mutex可以用pthread_mutex_destroy銷毀。如果Mutex變量是靜態(tài)分配的(全局變量或static變量),也可以用宏定義PTHREAD_MUTEX_INITIALIZER來初始化,相當(dāng)于用pthread_mutex_init初始化并且attr參數(shù)為NULL。Mutex的加鎖和解鎖操作可以用下列函數(shù):
1
2
3
4
5
|
#include <pthread.h> int pthread_mutex_lock(pthread_mutex_t *mutex); int pthread_mutex_trylock(pthread_mutex_t *mutex); int pthread_mutex_unlock(pthread_mutex_t *mutex); |
返回值:成功返回0,失敗返回錯誤號。
一個線程可以調(diào)用pthread_mutex_lock獲得Mutex,如果這時另一個線程已經(jīng)調(diào)用pthread_mutex_lock獲得了該Mutex,則當(dāng)前線程需要掛起等待,直到另一個線程調(diào)用pthread_mutex_unlock釋放Mutex,當(dāng)前線程被喚醒,才能獲得該Mutex并繼續(xù)執(zhí)行。
我們用Mutex解決上面說的兩個線程同時對全局變量+1可能導(dǎo)致紊亂的問題:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
|
#include <pthread.h> #include <stdio.h> #include <stdlib.h> #define NLOOP 5000 int counter; pthread_mutex_t counter_mutex = PTHREAD_MUTEX_INITIALIZER; void *do_add_process( void *vptr) { int i, val; for (i = 0; i < NLOOP; i ++) { pthread_mutex_lock(&counter_mutex); val = counter; printf ( "%x:%d\n" , (unsigned int )pthread_self(), val + 1); counter = val + 1; pthread_mutex_unlock(&counter_mutex); } return NULL; } int main() { pthread_t tida, tidb; pthread_create(&tida, NULL, do_add_process, NULL); pthread_create(&tidb, NULL, do_add_process, NULL); pthread_join(tida, NULL); pthread_join(tidb, NULL); return 0; } |
這樣,每次運(yùn)行都能顯示到10000。如果去掉鎖機(jī)制,可能就會有問題。這個機(jī)制類似于Java的synchronized塊機(jī)制。
Condition Variable
線程間的同步還有這樣一種情況:線程A需要等某個條件成立才能繼續(xù)往下執(zhí)行,現(xiàn)在這個條件不成立,線程A就阻塞等待,而線程B在執(zhí)行過程中使這個條件成立了,就喚醒線程A繼續(xù)執(zhí)行。在pthread庫中通過條件變量(Conditiion Variable)來阻塞等待一個條件,或者喚醒等待這個條件的線程。Condition Variable用pthread_cond_t類型的變量表示,可以這樣初始化和銷毀:
1
2
3
4
5
|
#include <pthread.h> int pthread_cond_destory(pthread_cond_t *cond); int pthread_cond_init(pthead_cond_t *cond, const pthread_condattr_t *attr); pthread_cond_t cond = PTHREAD_COND_INITIALIZER; |
返回值:成功返回0,失敗返回錯誤號。
和Mutex的初始化和銷毀類似,pthread_cond_init函數(shù)初始化一個Condition Variable,attr參數(shù)為NULL則表示缺省屬性,pthread_cond_destroy函數(shù)銷毀一個Condition Variable。如果Condition Variable是靜態(tài)分配的,也可以用宏定義PTHEAD_COND_INITIALIZER初始化,相當(dāng)于用pthread_cond_init函數(shù)初始化并且attr參數(shù)為NULL。Condition Variable的操作可以用下列函數(shù):
1
2
3
4
5
6
|
#include <pthread.h> int pthread_cond_timedwait(pthread_cond_t *cond, pthread_mutex_t *mutex, const struct timespec *abstime); int pthread_cond_wait(pthread_cond_t *cond, pthread_mutex_t *mutex); int pthread_cond_broadcast(pthread_cond_t *cond); int pthread_cond_signal(pthread_cond_t *cond); |
可見,一個Condition Variable總是和一個Mutex搭配使用的。一個線程可以調(diào)用pthread_cond_wait在一個Condition Variable上阻塞等待,這個函數(shù)做以下三步操作:
- 釋放Mutex。
- 阻塞等待。
- 當(dāng)被喚醒時,重新獲得Mutex并返回。
pthread_cond_timedwait函數(shù)還有一個額外的參數(shù)可以設(shè)定等待超時,如果到達(dá)了abstime所指定的時刻仍然沒有別的線程來喚醒當(dāng)前線程,就返回ETIMEDOUT。一個線程可以調(diào)用pthread_cond_signal喚醒在某個Condition Variable上等待的另一個線程,也可以調(diào)用pthread_cond_broadcast喚醒在這個Condition Variable上等待的所有線程。
下面的程序演示了一個生產(chǎn)者-消費(fèi)者的例子,生產(chǎn)者生產(chǎn)一個結(jié)構(gòu)體串在鏈表的表頭上,消費(fèi)者從表頭取走結(jié)構(gòu)體。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
|
#include <stdio.h> #include <stdlib.h> #include <pthread.h> #include <unistd.h> struct msg { struct msg *next; int num; }; struct msg *head; pthread_cond_t has_product = PTHREAD_COND_INITIALIZER; pthread_mutex_t lock = PTHREAD_MUTEX_INITIALIZER; void * consumer( void *p) { struct msg *mp; for (;;) { pthread_mutex_lock(&lock); while (head == NULL) { pthread_cond_wait(&has_product, &lock); } mp = head; head = mp->next; pthread_mutex_unlock(&lock); printf ( "Consume %d\n" , mp->num); free (mp); sleep( rand () % 5); } } void * producer( void *p) { struct msg *mp; for (;;) { mp = ( struct msg *) malloc ( sizeof (*mp)); pthread_mutex_lock(&lock); mp->next = head; mp->num = rand () % 1000; head = mp; printf ( "Product %d\n" , mp->num); pthread_mutex_unlock(&lock); pthread_cond_signal(&has_product); sleep( rand () % 5); } } int main() { pthread_t pid, cid; srand ( time (NULL)); pthread_create(&pid, NULL, producer, NULL); pthread_create(&cid, NULL, consumer, NULL); pthread_join(pid, NULL); pthread_join(cid, NULL); return 0; } |