加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • █ 斷網(wǎng)的原因分析
    • █ 真正的原因
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

都2022年了,為什么還有這么多網(wǎng)絡(luò)故障?

2022/01/13
616
閱讀需 11 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

故障年年有,今年特別早。

前幾天,我在寫(xiě)《2022年通信行業(yè)十大看點(diǎn)》的時(shí)候,就提到了網(wǎng)絡(luò)安全穩(wěn)定的重要性。沒(méi)想到,這還不到一個(gè)禮拜,國(guó)內(nèi)第一個(gè)斷網(wǎng)事件就誕生了。

根據(jù)媒體報(bào)道,1月12日凌晨,有大量用戶反映某運(yùn)營(yíng)商服務(wù)斷網(wǎng)?;诰W(wǎng)友反饋的坐標(biāo)來(lái)看,包括北京、廣州、杭州、長(zhǎng)春、烏魯木齊等地,均出現(xiàn)了斷網(wǎng)問(wèn)題。

據(jù)悉,此次大規(guī)模斷網(wǎng)事件,導(dǎo)致47%的該運(yùn)營(yíng)商用戶無(wú)法訪問(wèn)網(wǎng)絡(luò),骨干網(wǎng)受到影響,具體表現(xiàn)為路由追蹤無(wú)信息。

本次斷網(wǎng)發(fā)生在深夜,且很快得到了恢復(fù)(不到半小時(shí)),客觀來(lái)說(shuō),影響不大。

但是,斷網(wǎng)的原因卻遲遲未能公布(估計(jì)不會(huì)公布了)。

這次斷網(wǎng),不禁讓人深思——都2022年了,運(yùn)營(yíng)商和設(shè)備商每天都把技術(shù)吹得天花亂墜,為什么我們的網(wǎng)絡(luò)還是會(huì)斷?

今天,小棗君就簡(jiǎn)單和大家聊聊這個(gè)話題。

█ 斷網(wǎng)的原因分析

前段時(shí)間,西安一碼通宕機(jī)的時(shí)候,幾乎所有人都把關(guān)注目光放在“單一來(lái)源采購(gòu)”和“項(xiàng)目轉(zhuǎn)包”上。

這個(gè)很好理解,中國(guó)改革開(kāi)放發(fā)展到現(xiàn)在,雖然一直在加強(qiáng)法制化建設(shè),但始終未能徹底根絕腐敗現(xiàn)象和灰色交易。

我們?cè)谌粘9ぷ髦?,也?jīng)常見(jiàn)到甚至參與過(guò)類似的項(xiàng)目——高價(jià)中標(biāo),然后層層轉(zhuǎn)包,最后一個(gè)千萬(wàn)級(jí)的項(xiàng)目,很可能是一個(gè)大學(xué)生團(tuán)隊(duì)完成的。

軟件行業(yè)這種現(xiàn)象略見(jiàn)不鮮,于是人們就會(huì)覺(jué)得,通信行業(yè)出現(xiàn)問(wèn)題,是不是也和項(xiàng)目轉(zhuǎn)包或者低價(jià)中標(biāo)有關(guān)?

其實(shí),通信行業(yè)的情況,和IT行業(yè)還是有些區(qū)別的。

通信項(xiàng)目,尤其是面向三大運(yùn)營(yíng)商的公共通信網(wǎng)絡(luò)項(xiàng)目,對(duì)安全性和可靠性的要求極高。

公共通信網(wǎng)絡(luò)(手機(jī)網(wǎng)絡(luò)、寬帶網(wǎng)絡(luò))承載著海量的用戶,支撐國(guó)民經(jīng)濟(jì)各個(gè)領(lǐng)域(金融、制造、交通)的發(fā)展,對(duì)于社會(huì)穩(wěn)定意義重大。各個(gè)運(yùn)營(yíng)商身負(fù)非常嚴(yán)格的網(wǎng)絡(luò)安全運(yùn)行考核指標(biāo),一旦出現(xiàn)問(wèn)題,不是扣工資那么簡(jiǎn)單,而是領(lǐng)導(dǎo)下課,甚至瀆職入獄。

所以,對(duì)于通信網(wǎng)絡(luò)主設(shè)備和核心服務(wù)的采購(gòu),運(yùn)營(yíng)商非常嚴(yán)謹(jǐn)和認(rèn)真。能夠中標(biāo)的,都是華為、中興、愛(ài)立信、諾基亞這樣的大型企業(yè)。

運(yùn)營(yíng)商那么重視,設(shè)備商就更不用說(shuō)了。在目前激烈的市場(chǎng)競(jìng)爭(zhēng)下,設(shè)備商們?cè)贀搁T(mén),也不敢在安全上松懈。一旦出事,大領(lǐng)導(dǎo)就要屁顛屁顛去道歉。一旦出大事,這個(gè)省的份額基本上就是完蛋,卷鋪蓋走人。

所以,通信網(wǎng)絡(luò)設(shè)備的采購(gòu),尤其是集團(tuán)層面的集采,貓膩空間有限。目前,貓膩較多的,或者說(shuō)存在低價(jià)競(jìng)爭(zhēng)、灰色交易的,是一些中小型的采購(gòu)。大家可以去運(yùn)營(yíng)商的采購(gòu)網(wǎng)站看,每天都有幾十個(gè)采購(gòu)項(xiàng)目掛出來(lái),什么辦公樓裝修啊,顯示屏采購(gòu)啊,信息系統(tǒng)運(yùn)維啊,之類的。

通信圈里很多人抱怨運(yùn)營(yíng)商壓價(jià),其實(shí)運(yùn)營(yíng)商壓價(jià)的項(xiàng)目,主要是運(yùn)維、代運(yùn)維、站點(diǎn)勘察之類的體力勞動(dòng)項(xiàng)目。甲方會(huì)通過(guò)施工標(biāo)準(zhǔn)來(lái)卡供應(yīng)商。

既要低價(jià),又要符合標(biāo)準(zhǔn),就看乙方供應(yīng)商的本事。硬件和物料是明的,不好偷工減料,于是,就把目光放在員工身上,大幅克扣合作方員工的工資和獎(jiǎng)金,以此達(dá)到壓低成本的目的。

說(shuō)起來(lái)大家可能不信,有設(shè)備商在招外包合作的時(shí)候,明確要求了給外包員工的薪資比例。例如設(shè)備商給分包商1萬(wàn),那么,分包商必須承諾,至少要給員工7000,以此保證底層員工的積極性和態(tài)度。

為了保證分包商員工不瞎搞,設(shè)備商和運(yùn)營(yíng)商還專門(mén)制定了大量的流程制度和行為規(guī)范,文檔也是不斷地checklist,對(duì)操作步驟嚴(yán)格管控,防止出事。

前幾年廣西那個(gè)故障,就是外包員工誤操作,導(dǎo)致某設(shè)備商賠了幾個(gè)億。所以,設(shè)備商不會(huì)為了省那么幾個(gè)錢(qián),在核心環(huán)節(jié)摳成本。

說(shuō)來(lái)說(shuō)去,我想表達(dá)的意思就是——通信網(wǎng)絡(luò)因?yàn)閷訉愚D(zhuǎn)包、偷工減料導(dǎo)致出現(xiàn)重大網(wǎng)絡(luò)的可能性,極低極低。運(yùn)營(yíng)商、設(shè)備商、分包商,都不敢拿網(wǎng)絡(luò)安全當(dāng)兒戲。

█ 真正的原因

那么問(wèn)題來(lái)了,通信網(wǎng)絡(luò)出現(xiàn)重大故障的主要原因,究竟是什么呢?

其實(shí)還是技術(shù)原因。

我們搞技術(shù)的通信人都知道,現(xiàn)在的通信網(wǎng)絡(luò)是極為健壯的,即使你想故意搞癱它,都很難。

通信網(wǎng)絡(luò)在設(shè)計(jì)之初,就有無(wú)數(shù)的專家進(jìn)行架構(gòu)設(shè)計(jì)和評(píng)審,考慮各種冗余和容災(zāi)方案。為了避免癱局,所有的單板都是主備兩塊。再往上,網(wǎng)元也是容災(zāi)的,要么pool池,要么1+1或1:1備份。傳輸設(shè)備就更不用說(shuō),各種環(huán)型組網(wǎng),各種主備保護(hù),就是為了應(yīng)對(duì)設(shè)備故障或意外情況(地震、水災(zāi)、恐襲等)。

電子設(shè)備是不穩(wěn)定的,CPU、內(nèi)存、主板、硬盤(pán)、強(qiáng)弱電,都有可能故障。公共通信網(wǎng)絡(luò)要實(shí)現(xiàn)99.9999%以上的可靠性,必須做容災(zāi)備份。說(shuō)白了,就是砸錢(qián)??瓷先ナ且惶自O(shè)備,其實(shí)后面是一堆設(shè)備。

但是,越復(fù)雜的網(wǎng)絡(luò),其中的隱患就越難以察覺(jué)。目前,我們經(jīng)歷2/3/4/5G的發(fā)展,網(wǎng)絡(luò)變得太過(guò)臃腫和復(fù)雜。網(wǎng)絡(luò)的開(kāi)放化,也導(dǎo)致了廠商的魚(yú)龍混雜。

舊設(shè)備舍不得淘汰,新設(shè)備(新技術(shù))剛剛上線,是混亂的高發(fā)期。

運(yùn)維人員對(duì)設(shè)備和網(wǎng)絡(luò)的缺乏了解,信息的不對(duì)稱,導(dǎo)致了應(yīng)對(duì)突發(fā)局面的慌亂和倉(cāng)促。

說(shuō)句實(shí)在話,目前運(yùn)營(yíng)商的一些員工,在技術(shù)上無(wú)法做到及時(shí)的技能更新,對(duì)設(shè)備商依賴越來(lái)越大,正在喪失對(duì)技術(shù)的控制和主導(dǎo)權(quán)。

少部分的運(yùn)營(yíng)商基層技術(shù)牛人,因?yàn)槁殬I(yè)發(fā)展的原因,要么升職去做管理了,要么躺平或離職了,青黃不接,沒(méi)辦法和設(shè)備商工程師進(jìn)行對(duì)等溝通,影響了故障的緊急恢復(fù)。沒(méi)有造成二次傷害,就已經(jīng)不錯(cuò)了。

全網(wǎng)級(jí)的重大故障,要么是核心網(wǎng)的鍋,要么是傳輸網(wǎng)的鍋。現(xiàn)在出故障,想都不用想,要么是骨干網(wǎng)路由掛了,要么是光纖斷了,要么就是DNS、鑒權(quán)這樣的基礎(chǔ)服務(wù)掛了。連FACEBOOK和GOOGLE這樣的頂級(jí)技術(shù)巨頭,都會(huì)在BGP這樣的基礎(chǔ)路由協(xié)議上栽跟頭,你說(shuō)還有什么不可能發(fā)生?

我們總吹牛,說(shuō)自己控制了網(wǎng)絡(luò)。其實(shí),一線技術(shù)人員都知道,很多技術(shù)上的事情,都是玄學(xué)。你根本不知道它為什么會(huì)好,也根本不知道它為什么會(huì)壞。

網(wǎng)絡(luò)出現(xiàn)故障的可能性太多了,蝴蝶效應(yīng)也非常明顯。我們國(guó)內(nèi)的工程質(zhì)量把關(guān)很嚴(yán)格,還好一些。很多海外項(xiàng)目,簡(jiǎn)直讓人抓狂。

舉個(gè)例子,曾經(jīng)在印度的一個(gè)項(xiàng)目,本地員工中繼線接錯(cuò)了,主用對(duì)的,備用錯(cuò)了。結(jié)果,傳輸網(wǎng)絡(luò)一個(gè)閃斷,主用切備用,癱了。線癱了就癱了唄,結(jié)果數(shù)據(jù)溢出,把傳輸設(shè)備沖癱了。傳輸設(shè)備癱了,導(dǎo)致整網(wǎng)信令擁塞,又把MGW媒體網(wǎng)關(guān)(兼做信令網(wǎng)關(guān))沖癱了,一路癱下去,一個(gè)邦(相當(dāng)于國(guó)內(nèi)一個(gè)?。┚瓦@么斷網(wǎng)了。你說(shuō)神不神奇?

我們作為技術(shù)人,要對(duì)技術(shù)有敬畏之心。我們對(duì)技術(shù)的掌握,遠(yuǎn)遠(yuǎn)沒(méi)有到爐火純青的地步。所以,完全杜絕網(wǎng)絡(luò)故障,是不可能的。常在河邊走,哪有不濕鞋。出來(lái)混,還是要看點(diǎn)運(yùn)氣。

從技術(shù)的長(zhǎng)遠(yuǎn)發(fā)展來(lái)看,現(xiàn)在都講網(wǎng)絡(luò)的自動(dòng)駕駛(和開(kāi)車沒(méi)關(guān)系,是網(wǎng)絡(luò)自己管理網(wǎng)絡(luò)的意思),講AI智能化運(yùn)維。其實(shí)我覺(jué)得,AI輔助運(yùn)維應(yīng)該可行,但是全面接管的話,還是蠻遙遠(yuǎn)的。

目前,我們的通信網(wǎng)絡(luò)過(guò)于復(fù)雜,人員水平層次不齊,在沒(méi)有外部主動(dòng)攻擊的情況下,我們都無(wú)法保證網(wǎng)絡(luò)的100%安全。一旦發(fā)生了敵對(duì)勢(shì)力對(duì)網(wǎng)絡(luò)的超限戰(zhàn),會(huì)發(fā)生什么,誰(shuí)也不知道。

客觀發(fā)生的情況我們控制不住,但是,主觀的預(yù)防行為我們還是可以做的。

一方面,加強(qiáng)對(duì)技術(shù)人員的尊重,給予合適的待遇,規(guī)劃技術(shù)線的跑道,有利于穩(wěn)定技術(shù)人員隊(duì)伍。

另一方面,及時(shí)對(duì)員工進(jìn)行技術(shù)培訓(xùn)和實(shí)踐訓(xùn)練,彌補(bǔ)技術(shù)差異,有利于故障的快速恢復(fù)。

第三,容災(zāi)演練要落到實(shí)處,少搞貓膩,想方設(shè)法多設(shè)計(jì)一些極限的緊急情況,完善容災(zāi)預(yù)案,會(huì)有很大幫助。

第四,簡(jiǎn)化網(wǎng)絡(luò)架構(gòu)設(shè)計(jì),加速舊設(shè)備的淘汰,實(shí)現(xiàn)網(wǎng)絡(luò)極簡(jiǎn),有利于減小故障發(fā)生的風(fēng)險(xiǎn)。

好了,以上就是小棗君關(guān)于網(wǎng)絡(luò)故障的一些想法,歡迎大家補(bǔ)充、拍磚。

2022沒(méi)有開(kāi)個(gè)好頭,希望后面大家平平安安,該拜還是多拜拜。

謝謝!

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

通信行業(yè)知名新媒體鮮棗課堂創(chuàng)始人,通信行業(yè)資深專家、行業(yè)分析師、自媒體作者,《智聯(lián)天下:移動(dòng)通信改變中國(guó)》叢書(shū)作者。通信行業(yè)13年工作經(jīng)驗(yàn),曾長(zhǎng)期任職于中興通訊股份有限公司,從事2/3/4G及5G相關(guān)技術(shù)領(lǐng)域方面的研究,曾擔(dān)任中興通訊核心網(wǎng)產(chǎn)品線產(chǎn)品經(jīng)理、能力提升總監(jiān)、中興通訊學(xué)院二級(jí)講師、中興通訊高級(jí)主任工程師,擁有豐富的行業(yè)經(jīng)驗(yàn)和積累。