理解 Semaphore,從一個好的翻譯開始
Semaphore,對多線程有過了解的人都聽說過,一般我們解釋為“信號量”??墒?,這個單詞對我們來說還是比較陌生,它和另一個單詞 Singal(信號)什么關系呢?想要真正理解這個概念,必須得從它的翻譯開始。事實上,Semaphore 最好的翻譯應該為“信號計數量”,承認了這一點,想必你也清楚了:它和 Signal 不是一回事!

劍橋詞典翻譯,并不容易理解
信號:簡單來說就是消息,是由用戶、系統或者進程發送給目標進程的信息,用來通知目標進程某個狀態的改變或系統異常,對應的是異步的場景(我之前的文章有詳細介紹過)。
信號量:首先是一個變量,其次是計數器。它是多線程環境下使用的一種設施,信號量在創建時需要設置一個初始值,表示同時可以有幾個任務(線程)可以訪問某一塊共享資源。
- 一個任務要想訪問共享資源,前提是信號量大于0,當該任務成功獲得資源后,將信號量的值減 1;
- 若當前信號量的值小于 0,表明無法獲得信號量,該任務必須被掛起,等待信號量恢復為正值的那一刻;
- 當任務執行完之后,必須釋放信號量,對應操作就是信號量的值加 1。
另外,對信號量的操作(加、減)都是原子的?;コ怄i(Mutex)就是信號量初始值為 1 時的特殊情形,即同時只能有一個任務可以訪問共享資源區。

Semaphore 再理解
我們來設想這樣一個場景(上圖):假如北京的國家大劇院有一場免費的音樂會演出,可是現在正值疫情期間,劇院規定:劇院觀眾總人數要限制,但是允許大家中途退場,把票給其他人,其他人可以中途進場。于是,第一批先到的人從劇院門口票箱中取到了票,然后進場欣賞演出。后到的人就因為劇院滿了,在門口等待。過了一段時間,有人嫌節目太無聊了,提前退場了,退場時他把門票放回去了。這樣,其他人拿著這個人的票進場了。隨后,又有人退場了,但是他忘記把票放回去了。這也沒關系,大不了劇院內可容納的總人數少了一個罷了。
上面的例子中,音樂會現場就是一塊共享資源區,觀眾就是任務(線程),而票箱中的門票數就是信號量。信號量用作并發量限制,由于總的門票數是固定的,所以不會出現音樂廳被擠爆的情況。
上述的例子中,我們允許退場的觀眾把票帶走,這是為什么呢?因為劇院工作人員可以隨時在票箱里補充些門票呀(線程生產者)。說到這,你們是不是有點似曾相識呀?對啰,就是線程池,但還是有些不同,你們自己品味吧。
Semaphore 實操練習
信號量類型為 sem_t,類型及相關操作定義在頭文件 semaphore.h 中,
創建信號量
int sem_init(sem_t *sem, int pshared, unsigned int value);
信號量的值加 1
int sem_post(sem_t *sem);
信號量的值減 1
int sem_wait(sem_t *sem);
信號量銷毀
int sem_destroy(sem_t *sem);
具體參數含義及返回值,這里就不贅述了。下面展示了一個例子:
你總共有三種類型的下載任務(類型 id 為 1、2、3),每次從鍵盤讀取一種類型的任務進行下載,但是 CPU 最多可以同時執行 2 個下載任務(創建兩個線程)。
#include <stdio.h>
#include <pthread.h>
#include <semaphore.h>
#define MAXNUM (2)
sem_t semDownload;
pthread_t a_thread, b_thread, c_thread;
int g_phreadNum = 1;
void func1(void *arg)
{
// 等待信號量的值 > 0
sem_wait(&semDownload);
printf("============== Downloading taskType 1 ============== \n");
sleep(5);
printf("============== Finished taskType 1 ============== \n");
g_phreadNum--;
// 等待線程結束
pthread_join(a_thread, NULL);
}
void func2(void *arg)
{
sem_wait(&semDownload);
printf("============== Downloading taskType 2 ============== \n");
sleep(3);
printf("============== Finished taskType 2 ============== \n");
g_phreadNum--;
pthread_join(b_thread, NULL);
}
void func3(void *arg)
{
sem_wait(&semDownload);
printf("============== Downloading taskType 3 ============== \n");
sleep(1);
printf("============== Finished taskType 3 ============== \n");
g_phreadNum--;
pthread_join(c_thread, NULL);
}
int main()
{
// 初始化信號量
sem_init(&semDownload, 0, 0);
int taskTypeId;
while (scanf("%d", &taskTypeId) != EOF)
{
// 輸入 0, 測試程序是否能正常退出
if (taskTypeId == 0 && g_phreadNum <= 1)
{
break;
} else if (taskTypeId == 0)
{
printf("Can not quit, current running thread num is %d\n", g_phreadNum - 1);
}
printf("your choose Downloading taskType %d\n", taskTypeId);
// 線程數超過 2 個則不下載
if (g_phreadNum > MAXNUM)
{
printf("!!! You've reached the max number of threads !!!\n");
continue;
}
// 用戶選擇下載 Task
switch (taskTypeId)
{
case 1:
// 創建線程 1
pthread_create(&a_thread, NULL, func1, NULL);
// 信號量 + 1,進而觸發 func1 的任務
sem_post(&semDownload);
// 總線程數 + 1
g_phreadNum++;
break;
case 2:
pthread_create(&b_thread, NULL, func2, NULL);
sem_post(&semDownload);
g_phreadNum++;
break;
case 3:
pthread_create(&c_thread, NULL, func3, NULL);
sem_post(&semDownload);
g_phreadNum++;
break;
default:
printf("!!! error taskTypeId %d !!!\n", taskTypeId);
break;
}
}
// 銷毀信號量
sem_destroy(&semDownload);
return 0;
}
上述例子中,采用了 pthread_join() 的方式,即子線程合入主線程,主線程阻塞等待子線程結束,然后回收子線程資源。而線程加入還有另外一種方式:pthread_detach(),即主線程與子線程分離,主線程不用關注子線程什么時候結束,子線程結束后,資源自動回收。
程序運行結果如下:

還要注意一點:pthread.h 非 linux 系統的默認庫, gcc 編譯參數需要手動添加選項:-lpthread、-pthread.