1、前言
在《WiMinet 評(píng)說 1.2:多跳無線網(wǎng)絡(luò)的現(xiàn)狀》一文中,我們提到:在室外長(zhǎng)距離的無線自組織網(wǎng)絡(luò)中,由于節(jié)點(diǎn)之間的鏈路損耗較大,其鏈路預(yù)算相對(duì)不足,其包誤碼率PER會(huì)相應(yīng)升高,也就是丟包概率 p 會(huì)比較大;而在一個(gè)大規(guī)模網(wǎng)絡(luò)中,某些分支節(jié)點(diǎn)的通訊鏈路又會(huì)比較深,也就是網(wǎng)絡(luò)跳數(shù) n 比較大,在這種情況下其通訊成功率Pn自然也就顯著下降了,人們的切身感受就是這個(gè)鏈路不太穩(wěn)定。
此時(shí)人們的第一反應(yīng)自然是上 TCP 算法,在發(fā)送節(jié)點(diǎn)啟用 TCP Client 算法,在接收點(diǎn)啟用 TCP Server 算法,實(shí)現(xiàn)端到端的控制,這樣不就可以解決多跳無線通訊網(wǎng)絡(luò)的可靠性了么?我們今天就來深入討論一下這個(gè)問題。
2、多跳網(wǎng)絡(luò)
很顯然在一個(gè)真實(shí)的無線通訊系統(tǒng)中,每一個(gè)節(jié)點(diǎn)都是具備雙向收發(fā)能力的,但是為了更加清晰的描述數(shù)據(jù)流向,我們將原始數(shù)據(jù)的發(fā)出者定義為發(fā)射機(jī),將目標(biāo)數(shù)據(jù)的接受者定義為接收機(jī);如下圖所示,我們定義左邊紅色的“鐵塔”為發(fā)射機(jī),右邊藍(lán)色的“鍋蓋”為接收機(jī)。
圖1-發(fā)射機(jī)與接收機(jī)
在一個(gè)較大規(guī)模的無線通訊網(wǎng)絡(luò)中,中繼通常有兩種存在形式,一種是獨(dú)立的中繼器,通常其硬件配置較高,性能也比較強(qiáng)勁,并安裝有多根天線;另外一種是普通的數(shù)據(jù)節(jié)點(diǎn)本身承擔(dān)數(shù)據(jù)轉(zhuǎn)發(fā)的功能,這種節(jié)點(diǎn)成本較低,通常僅僅配置一根天線。無論其硬件配置和工作原理如何,它們都可以承擔(dān)數(shù)據(jù)轉(zhuǎn)發(fā)的功能,為了更加直觀的描述中繼的工作機(jī)制,我們以雙天線的中繼器為例。
圖2-多跳無線中繼
在多數(shù)情況下,負(fù)責(zé)參數(shù)通訊的還有外部的用戶系統(tǒng),比如連接數(shù)據(jù)庫的上位機(jī)應(yīng)用程序和連接現(xiàn)場(chǎng)工業(yè)傳感器的嵌入式設(shè)備;通常負(fù)責(zé)發(fā)起數(shù)據(jù)請(qǐng)求的是上位機(jī)應(yīng)用程序,二者以RJ45以太網(wǎng)線或者RS232電纜連接。
圖3-上位機(jī)應(yīng)用軟件
負(fù)責(zé)采集數(shù)據(jù)并回傳的是嵌入式設(shè)備,二者以RS232電纜,TTL電平的串口或者GPIO端口直接相連。
圖4-下位機(jī)現(xiàn)場(chǎng)設(shè)備
3、業(yè)務(wù)流程與運(yùn)作機(jī)制
按照我們之前的約定,我們選定網(wǎng)絡(luò)中一個(gè)具有6跳的(5個(gè)中繼)分支鏈路,在該鏈路上一個(gè)標(biāo)準(zhǔn)的通訊業(yè)務(wù)流程通常如下:
- 上位機(jī)系統(tǒng)發(fā)起數(shù)據(jù)請(qǐng)求
- 數(shù)據(jù)請(qǐng)求通過有線電纜傳遞給發(fā)射機(jī)
- 發(fā)射機(jī)將數(shù)據(jù)發(fā)送給1號(hào)中繼
- 數(shù)據(jù)依次在中繼1→2→3→4→5之間傳遞,最后到達(dá)接收機(jī)
- 接收機(jī)將數(shù)據(jù)通過有線電纜傳遞給嵌入式系統(tǒng)
- 嵌入式系統(tǒng)采集數(shù)據(jù)
注意到,這里僅僅是數(shù)據(jù)的下行請(qǐng)求過程,在嵌入式系統(tǒng)完成了數(shù)據(jù)的采集之后,就會(huì)將其作為應(yīng)答回傳給上位機(jī)系統(tǒng),其上行通訊流程剛好和下行傳輸完全相反:
- 嵌入式系統(tǒng)送出采集到的數(shù)據(jù)
- 數(shù)據(jù)應(yīng)答通過有線電纜傳送給接收機(jī)
- 接收機(jī)將數(shù)據(jù)發(fā)送給5號(hào)中繼
- 數(shù)據(jù)依次在中繼5→4→3→2→1之間傳遞,最后到達(dá)發(fā)射機(jī)
- 發(fā)射機(jī)將數(shù)據(jù)通過有線電纜傳遞給上位機(jī)系統(tǒng)
- 上位機(jī)系統(tǒng)完成數(shù)據(jù)的存儲(chǔ),計(jì)算和顯示
4、UDP多跳傳輸模型
我們都知道,有線通訊由于在封閉的通道中運(yùn)行,其錯(cuò)誤率通常在 10-9~10-12,可靠性是非常高的,我們基本不用考慮丟包的問題。這里為了敘述方便,我們將上位機(jī)應(yīng)用程序的功能合并到發(fā)射機(jī)中去,將連接工業(yè)傳感器的嵌入式設(shè)備的功能合并到接收機(jī)中去,這樣簡(jiǎn)化之后的模型就是下圖。
圖5-UDP多跳傳輸模型
在該模型中,每一個(gè)角色的基本工作原理如下:
- 發(fā)射機(jī):產(chǎn)生數(shù)據(jù)請(qǐng)求,發(fā)送給中繼1,然后轉(zhuǎn)入接收狀態(tài),等待來自目標(biāo)節(jié)點(diǎn)(接收機(jī))的應(yīng)答數(shù)據(jù);如果在指定的時(shí)間之內(nèi)收到了應(yīng)答數(shù)據(jù)則代表通訊成功;如果沒有則重新發(fā)送請(qǐng)求并增加計(jì)數(shù)器;當(dāng)計(jì)數(shù)器到達(dá)某個(gè)限定數(shù)值則認(rèn)定通訊失敗。
- 接收機(jī):平時(shí)處于接收等待狀態(tài),一旦從中繼5接收到了來自發(fā)射機(jī)的請(qǐng)求數(shù)據(jù),則立刻生成應(yīng)答數(shù)據(jù),并交給中繼5。
- 中繼器:按照?qǐng)?bào)文約定的指定的傳輸方向,復(fù)制報(bào)文并以重新發(fā)送給下一個(gè)接收節(jié)點(diǎn),包括中繼,發(fā)射機(jī)和接收機(jī)。
上圖是丟包概率 p = 10% 的時(shí)候的一種效果模擬圖。這里設(shè)定了5次數(shù)據(jù)重傳,從該圖我們看出來每一次的通訊丟包情況都不同:
- 新數(shù)據(jù)請(qǐng)求,在發(fā)射機(jī)到中繼1的下行鏈路上就丟失了
- 第1次重傳,在中繼2到中繼3的下行鏈路上丟失了
- 第2次重傳,下行鏈路各跳全部成功,接收機(jī)正確的收到了數(shù)據(jù),并生成了應(yīng)答,但是應(yīng)答數(shù)據(jù)在中繼5→中繼4的上行鏈路上丟失了
- 第3次重傳,在中繼3到中繼4的下行鏈路上丟失了
- 第4次重傳,下行鏈路各跳全部成功,接收機(jī)正確的收到了數(shù)據(jù),并生成了應(yīng)答,但是應(yīng)答數(shù)據(jù)在中繼2→中繼1的上行鏈路上丟失了
- 第5次重傳,在在中繼5到接收機(jī)的下行鏈路上丟失了
- 重傳計(jì)數(shù)器到達(dá)極限,應(yīng)用程序判定當(dāng)前鏈路不穩(wěn)定,通訊失?。?/li>
5、總結(jié)
當(dāng)然有的讀者心里會(huì)想,這個(gè)效果模擬圖太過于極端,上述流程中有好幾次差一點(diǎn)就通訊成功了呢,就差一口氣!如果我們加大嘗試的次數(shù),說不定就成功了呢?
事實(shí)上在大多數(shù)情況下,加大嘗試次數(shù),通訊成功率的確會(huì)有一定的改善,但無法從根本上消除問題。考慮到有線鏈路的和無線多跳的通訊延遲,再疊加上目標(biāo)設(shè)備的數(shù)據(jù)采集行為,下行或者上行鏈路的傳輸時(shí)間可能高達(dá)數(shù)百毫秒;在真實(shí)的環(huán)境中,還要考慮到各種系統(tǒng)延遲和等待操作,比如Windows,Linux等主流桌面操作系統(tǒng)的調(diào)度延遲,各級(jí)無線節(jié)點(diǎn)的單片機(jī)延遲,這個(gè)時(shí)間往往還需要進(jìn)一步加大,最終這個(gè)總的時(shí)間往往高達(dá)數(shù)秒甚至幾十秒,在一個(gè)有幾百個(gè)節(jié)點(diǎn)的數(shù)據(jù)采集系統(tǒng)中,系統(tǒng)整體掃描一遍,耗時(shí)將會(huì)比較長(zhǎng)了。
從上述分析可以看出,端到端的重傳機(jī)制在跳數(shù)較深的無線自組織網(wǎng)絡(luò)中難以保證足夠的可靠性,即便犧牲延時(shí),加大重傳次數(shù),效果也不會(huì)有根本性的改善。那么問題來了!我們要怎么做才可以獲得理想的可靠性與實(shí)時(shí)性呢?敬請(qǐng)關(guān)注后續(xù)系列文章的深入解讀。