在线看免费美女视频,下载美女视频免费下载

C語(yǔ)言分布式系統(tǒng)中的進(jìn)程標(biāo)識(shí)！

更新時(shí)間：2022-04-03 16:11:16作者：佚名

C語(yǔ)言分布式系統(tǒng)中的進(jìn)程標(biāo)識(shí)！

　　本文假定一臺(tái)機(jī)器 (host) 只有一個(gè) IP，不考慮 multihome 的情況。同時(shí)假定分布式系統(tǒng)中的每一臺(tái)機(jī)器都正確運(yùn)行了 NTP，各臺(tái)機(jī)器的時(shí)間大體同步。

　　“進(jìn)程 process”是操作系統(tǒng)的兩大基本概念之一，指的是在內(nèi)存中運(yùn)行的程序。在日常交流中，“進(jìn)程”這個(gè)詞通常不止這一個(gè)意思。有時(shí)候我們會(huì)說(shuō) “httpd 進(jìn)程”或者“mysqld 進(jìn)程”，指的其實(shí)是 program，而不一定是特指某一個(gè)“進(jìn)程”——某一次 fork() 系統(tǒng)調(diào)用的產(chǎn)物。一個(gè)“httpd 進(jìn)程”重啟了，它還是“一個(gè) httpd 進(jìn)程”。本文討論的是，如何為一個(gè)程序每次運(yùn)行的進(jìn)程取一個(gè)唯一標(biāo)識(shí)符。也就是說(shuō)，httpd 程序第一次運(yùn)行，進(jìn)程是 httpd_1，它原地重啟了，進(jìn)程是 httpd_2。

　　本文所指的“進(jìn)程標(biāo)識(shí)符”是用來(lái)唯一標(biāo)識(shí)一個(gè)程序的“一次運(yùn)行”的。每次啟動(dòng)一個(gè)進(jìn)程，這個(gè)進(jìn)程應(yīng)該被賦予一個(gè)唯一的標(biāo)識(shí)符，與當(dāng)前正在運(yùn)行的所有進(jìn)程都不同；不僅如此，它應(yīng)該與歷史上曾經(jīng)運(yùn)行過(guò)，目前已消亡的進(jìn)程也都不同（這兩條的直接推論是，與將來(lái)可能運(yùn)行的進(jìn)程也都不同）?！盀槊總€(gè)進(jìn)程命名”在分布式系統(tǒng)中有相當(dāng)大的實(shí)際意義，特別是在考慮 failover 的時(shí)候。因?yàn)橐粋€(gè)程序重啟之后的新進(jìn)程和它的“前世進(jìn)程”的狀態(tài)通常不一樣，凡是與它打交道的其他進(jìn)程(s)最好能通過(guò)它的進(jìn)程標(biāo)識(shí)符變更來(lái)很容易地判斷該程序已經(jīng)重啟，而采取必要的救災(zāi)措施，防止搭錯(cuò)話。

　　本文先假定每個(gè)服務(wù)端程序的端口是靜態(tài)分配的，在公司內(nèi)部有一個(gè)公用 wiki 來(lái)記錄端口和程序的對(duì)應(yīng)關(guān)系（然后通過(guò) NIS 或 DNS 發(fā)布）。比如端口 11211 始終對(duì)應(yīng) memcached，其他程序不會(huì)使用 11211 端口；3306 始終留給 mysqld；3690 始終留給 svnserve。在分布式系統(tǒng)的初級(jí)階段，這是通常的做法；到了高級(jí)階段，多半會(huì)用動(dòng)態(tài)分配端口號(hào)，因?yàn)槎丝谔?hào)只有 6 萬(wàn)多個(gè)，是稀缺資源，在公司內(nèi)部也有分配完的一天。本文只考慮 TCP 協(xié)議，不考慮 UDP 協(xié)議，“端口”都指的是 TCP 端口。

　　另外，我們假定在一臺(tái)機(jī)器上，一個(gè) listening port 同時(shí)只能由一個(gè)進(jìn)程使用，不考慮古老的 listen() + fork() 模型（多個(gè)進(jìn)程可以 accept 同一個(gè)端口上進(jìn)來(lái)的連接），關(guān)于這點(diǎn)陳碩已經(jīng)寫(xiě)的很多，見(jiàn)《Linux 新增系統(tǒng)調(diào)用的啟示》《多線程服務(wù)器的適用場(chǎng)合》。

　　錯(cuò)誤做法

　　在分布式系統(tǒng)中，如何指涉(refer to)某一個(gè)進(jìn)程呢，或者說(shuō)一個(gè)進(jìn)程如何取得自己的全局標(biāo)識(shí)符 (以下簡(jiǎn)稱 gpid)？容易想到的有兩種做法：

　　*ip:port （port 是這個(gè)進(jìn)程對(duì)外提供網(wǎng)絡(luò)服務(wù)的端口號(hào)，一般就是它的 tcp listening port）

　　*host:pid

　　而這兩種做法都有問(wèn)題。為什么？

　　如果進(jìn)程本身是無(wú)狀態(tài)的，或者重啟了也沒(méi)有關(guān)系，那么用 ip:port 來(lái)標(biāo)識(shí)一個(gè)“服務(wù)”是沒(méi)問(wèn)題的，比如常見(jiàn)的 httpd 和 memcached 都可以用它們的慣用 port （80 和 11211）來(lái)標(biāo)識(shí)。我們可以在其他程序里安全地引用(refer to)“運(yùn)行在 10.0.0.5:80 的那個(gè) http 服務(wù)器”，或者“10.0.0.6:11211 的 memcached”，就算這兩個(gè) service 重啟了，也不會(huì)有太惡劣的后果，大不了客戶端重試一下，或者自動(dòng)切換到備用地址。

　　如果服務(wù)是有狀態(tài)的，那么 ip:port 這種標(biāo)識(shí)方法就有大問(wèn)題，因?yàn)榭蛻舳藷o(wú)法區(qū)分從頭到尾和自己打交道的是一個(gè)進(jìn)程還是先后多個(gè)進(jìn)程。在開(kāi)發(fā)服務(wù)端程序的時(shí)候，為了能快速重啟，我們一般都會(huì)設(shè)置 SO_REUSEADDR，這樣的結(jié)果是前一秒鐘站在 10.0.0.7:8888 后面的進(jìn)程和后一秒鐘占據(jù) 10.0.0.7:8888 的進(jìn)程可能不相同——服務(wù)端程序快速重啟了。

　　比方說(shuō)，考慮一個(gè)類似 GFS 的分布式文件系統(tǒng)的 master，如果它僅以 ip:port 來(lái)標(biāo)識(shí)自己，然后它向 shadows （不是 chunk server）下達(dá)同步指令，那么 shadows 如何得知 master 是不是已經(jīng)重啟呢？發(fā)指令的是 master 的“前世”還是“今生”？是不是應(yīng)該拒絕“前世”的遺命？

　　如果考慮改成 host:pid 這種標(biāo)識(shí)方式會(huì)不會(huì)好一點(diǎn)？我認(rèn)為換湯不換藥，因?yàn)?pid 的狀態(tài)空間很小，重復(fù)的概率比較大。比如 Linux 的 pid 的最大值是 32768 （/proc/sys/kernel/pid_max），一個(gè)程序重啟之后，獲得與“前世”相同 pid 的概率是 1/32768?；蛟S有讀者不相信重啟之后 pid 會(huì)重復(fù)，因?yàn)?pid 是遞增的，遇到上限再回到目前空閑的最小 pid?？紤]一個(gè)服務(wù)端程序 A，它的 pid 是 1234，它已經(jīng)穩(wěn)定運(yùn)行了好幾天，這期間，pid 已經(jīng)增長(zhǎng)了幾個(gè)輪回（因?yàn)檫@臺(tái)機(jī)器時(shí)常會(huì)啟動(dòng)一些 scripts 執(zhí)行一些輔助工作）。在 A 崩潰的前一刻，最近被使用的 pid 已經(jīng)回到了 1232，當(dāng) A 崩潰之后，某個(gè)守護(hù)進(jìn)程啟動(dòng)一個(gè)腳本(pid = 1233)來(lái)清理 A 的 log，然后再重啟 A 程序；這樣一來(lái)，重啟之后的 A 程序的 pid 碰巧和它的前世相同，都是 1234。也就是說(shuō)，用 host:pid 不能唯一標(biāo)識(shí)進(jìn)程。

　　那么合在一起，用 ip:port:pid 呢？也不能做到唯一。它和 host:pid 面臨的問(wèn)題是一樣的，因?yàn)?ip:port 這部分在重啟之后不會(huì)變，pid 可能輪回。

　　我猜這時(shí)有人會(huì)想，建一個(gè)中心服務(wù)器，專門(mén)分配系統(tǒng)的 gpid 好了，每個(gè)進(jìn)程啟動(dòng)的時(shí)候向它詢問(wèn)自己的 gpid。這錯(cuò)得更遠(yuǎn)：這個(gè)全局 pid 分配器的 gpid 由誰(shuí)來(lái)定？如何保證它分配的 gpid 不重復(fù)（考慮這個(gè)程序也可能意外重啟）？它是不是成為系統(tǒng)的 single point of failure？如果要對(duì)該 gpid 分配器做容錯(cuò)，是不是面臨分布式系統(tǒng)的基本問(wèn)題：狀態(tài)遷移？

　　還有一種辦法，用一個(gè)足夠強(qiáng)的隨機(jī)數(shù)做 gpid，這樣一來(lái)確實(shí)不會(huì)重復(fù)，但是這個(gè) gpid 本身也沒(méi)有多大額外的意義，不便于管理和維護(hù)（比方說(shuō)根據(jù) gpid 找到是哪個(gè)機(jī)器上運(yùn)行的哪個(gè)進(jìn)程）。

　　正確做法：以四元組 ip:port:start_time:pid 作為分布式系統(tǒng)中進(jìn)程的 gpid，其中 start_time 是 64-bit 整數(shù)，表示進(jìn)程的啟動(dòng)時(shí)刻（UTC 時(shí)區(qū)，muduo::Timestamp）。理由如下：

　　*容易保證唯一性。如果程序短時(shí)間重啟，那么兩個(gè)進(jìn)程的 pid 必定不重復(fù)（還沒(méi)有走完一個(gè)輪回：就算每秒創(chuàng)建 1000 個(gè)進(jìn)程，也要 30 多秒才會(huì)輪回，而以這么高的速度創(chuàng)建進(jìn)程的話，服務(wù)器已基本癱瘓了。）；如果程序運(yùn)行了相當(dāng)長(zhǎng)一段時(shí)間再重啟，那么兩次啟動(dòng)的 start_time 必定不重復(fù)。（見(jiàn)下文關(guān)于時(shí)間重復(fù)的解釋）

　　*產(chǎn)生這種 gpid 的成本很低（幾次低成本系統(tǒng)調(diào)用），沒(méi)有用到全局服務(wù)器，不存在 single point of failure。

本文標(biāo)簽：語(yǔ)言標(biāo)簽簡(jiǎn)介軟件

上一篇：如何學(xué)習(xí)軟件開(kāi)發(fā)？軟件開(kāi)發(fā)學(xué)習(xí)流程是怎么樣的？

下一篇：優(yōu)化C代碼常用的五招！

国产chinesehd精品酒店,邱淑贞aa极毛片,国产在线色视频,玖玖爱zh综合伊人久久

C語(yǔ)言分布式系統(tǒng)中的進(jìn)程標(biāo)識(shí)！

相關(guān)文章

為您推薦

WPS Office手機(jī)版如何手寫(xiě)簽名

WPS Office手機(jī)版最近文檔如何刪除

WPS Office手機(jī)版怎么找回丟失的文檔

手機(jī)版WPS（手機(jī)版wps怎么首行縮進(jìn)2字符）

手機(jī)版WPS（手機(jī)版wps怎么首行縮進(jìn)2字符）

手機(jī)版WPS 手機(jī)版wps怎么首行縮進(jìn)2字符

熱門(mén)文章

熱門(mén)推薦

最新文章