加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • █ 通信的三個(gè)層級(jí)
    • █ 語(yǔ)義通信的特點(diǎn)
    • █ 語(yǔ)義通信系統(tǒng)的架構(gòu)
    • █ 語(yǔ)義通信面臨的挑戰(zhàn)
    • █ 語(yǔ)義通信的研究進(jìn)展
    • █ 結(jié)語(yǔ)
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

到底什么是語(yǔ)義通信?語(yǔ)義通信的特點(diǎn) 語(yǔ)義通信系統(tǒng)的架構(gòu)

2023/08/18
4893
閱讀需 15 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

大家好,我是小棗君。

今天這篇文章,我們來(lái)聊一個(gè)非??岬脑掝}——語(yǔ)義通信。

大家都知道,自從信息革命爆發(fā)以來(lái),我們的信息量(數(shù)據(jù)量)就在不斷膨脹。

文字、圖片、音頻、視頻……越來(lái)越多的數(shù)據(jù)在不斷產(chǎn)生,不僅占據(jù)著我們的硬盤空間,也充斥著整個(gè)通信網(wǎng)絡(luò)

這些數(shù)據(jù)讓我們的工作和生活更加便利,也推動(dòng)著社會(huì)的進(jìn)步和發(fā)展。

進(jìn)入21世紀(jì)后,在云計(jì)算、大數(shù)據(jù)物聯(lián)網(wǎng)人工智能的共同刺激下,數(shù)據(jù)的增長(zhǎng)趨勢(shì)更加猛烈。

根據(jù)IDC的報(bào)告,到2025年,全球數(shù)據(jù)總量將達(dá)到175ZB,約等于1750億TB。

而ITU則預(yù)測(cè),全球移動(dòng)數(shù)據(jù)流量的年增長(zhǎng)速率將會(huì)在2030年達(dá)到55%。2030年的數(shù)據(jù)流量,將是2020年的100倍。

面對(duì)如此巨大的流量增長(zhǎng),人類現(xiàn)有的通信技術(shù)手段,已經(jīng)疲于招架。

1948年,祖師爺克勞德·香農(nóng)(Claude Elwood Shannon)發(fā)表了那篇經(jīng)典論文——《A Mathematics Theory of Communication(通信的數(shù)學(xué)理論)》,標(biāo)志著信息論的誕生。

后來(lái),1949年,他又發(fā)表了《Communication in the Presence of Noise(噪聲下的通信)》,闡明了通信的基本問(wèn)題,給出了通信系統(tǒng)的模型,以及著名的香農(nóng)公式。

從那之后,我們就一直在信息論和香農(nóng)公式的基礎(chǔ)上,進(jìn)行通信技術(shù)的研究。

經(jīng)過(guò)70多年的積累,我們的通信技術(shù)已經(jīng)無(wú)限接近于香農(nóng)極限。以huffman編碼、算法編碼為代表的信源編碼技術(shù),把信源數(shù)據(jù)壓縮到了極致。而以LDPC碼、極化碼為代表的信道編碼技術(shù),把信道也利用到了極致。

接下來(lái),該怎么辦呢?面對(duì)萬(wàn)物智聯(lián)時(shí)代的數(shù)據(jù)洪流,我們的優(yōu)質(zhì)頻譜資源越來(lái)越少,硬件和能耗成本越來(lái)越高,該如何應(yīng)對(duì)?

通信的三個(gè)層級(jí)

大家不妨冷靜思考一下。

一直以來(lái),我們?cè)谕ㄐ偶夹g(shù)上所做的努力,似乎都在做一件事情——把攜帶信息的符號(hào),完整、準(zhǔn)確、快速地從信源發(fā)送到信宿。

這就好像一個(gè)勤勞的快遞員,他的唯一使命,就是把寄件人交給他的貨物,完好無(wú)損且快速地,送到收件人的手上。

那么,當(dāng)貨物實(shí)在太多,快遞員真的已經(jīng)拿不動(dòng)的時(shí)候,他會(huì)不會(huì)蹦出這么一個(gè)念頭——這些貨物,真的有必要全送嗎?

大家或者也會(huì)有這樣的經(jīng)歷:

你想在網(wǎng)上搜索一部好看的電影。你挑了一部,花了好久的時(shí)間,終于下載完成,結(jié)果,你打開一看,根本不是自己喜歡的。于是,你就只能刪掉它。

網(wǎng)絡(luò)辛苦完成的數(shù)據(jù)傳輸工作,沒(méi)有發(fā)揮價(jià)值。你的時(shí)間,也浪費(fèi)了。

是的,在這里,我們就會(huì)想到——通信的終極奧義,究竟是什么?

事實(shí)上,早在現(xiàn)代通信理論奠基之際,先賢們就考慮到了這個(gè)問(wèn)題。

1938年,美國(guó)哲學(xué)家查爾斯·莫里斯(Charles William Morris)提出了符號(hào)論。他指出,符號(hào)應(yīng)該包括了語(yǔ)法-語(yǔ)義-語(yǔ)用三元概念。

克勞德·香農(nóng)提出信息論后,和沃倫·韋弗(Warren Weaver)一起對(duì)自己的理論和模型進(jìn)行延展完善。他們合著了一本書,名字仍然叫《通信的數(shù)學(xué)理論》。

他們倆當(dāng)時(shí)就意識(shí)到,語(yǔ)義在通信中的重要性。于是,他們提出了通信的3個(gè)級(jí)別,即Level A/B/C。

Level A:語(yǔ)法通信,解決技術(shù)問(wèn)題,即通信符號(hào)如何保證正確傳輸;
Level B:語(yǔ)義通信,解決語(yǔ)義問(wèn)題,即發(fā)送的符號(hào)如何傳遞確切的含義;
Level C:語(yǔ)用通信,解決有效性問(wèn)題,即接收的含義如何以期望的方式影響系統(tǒng)行為。

長(zhǎng)期以來(lái),經(jīng)典信息論局限在語(yǔ)法信息傳輸層次,即Level A。也就是說(shuō),我們一直在研究怎么把數(shù)據(jù)傳過(guò)去。

如今,在傳統(tǒng)通信已經(jīng)進(jìn)入瓶頸的情況下,我們就可以考慮一下——是不是可以在語(yǔ)義通信上,尋找突破點(diǎn)。

語(yǔ)義通信的特點(diǎn)

語(yǔ)義通信(Semantic Communication),是以任務(wù)為主體,“先理解,后傳輸”的通信方式。

它會(huì)對(duì)原始信號(hào)進(jìn)行有選擇的特征提取、壓縮和傳輸,然后再利用語(yǔ)義層面信息進(jìn)行通信。

如果我們把傳統(tǒng)通信看成是形式通信的話,那么,語(yǔ)義通信就是“達(dá)意通信”、“內(nèi)容通信”。

換句話說(shuō):“不能傻干活,要多動(dòng)腦子?!?/p>

通信的真正目的是什么,是讓對(duì)方了解自己的意思。說(shuō)話,只是一種表達(dá)方式。話的本身,也是為了表達(dá)意思。那么,就沒(méi)有必要進(jìn)抓著這句話不放,而是看如何更高效地傳達(dá)意思。

從學(xué)術(shù)上來(lái)說(shuō),降低接收者對(duì)信息的不確定性,或者說(shuō),使接收到的信息熵減少至0,讓接收者正確理解發(fā)送者的信息內(nèi)容,就是“達(dá)意”通信。

大家平時(shí)溝通交流,也會(huì)注意到:對(duì)于陌生人,你需要千叮嚀萬(wàn)囑咐,確保自己的意思被理解。而對(duì)于你很親近的人,有時(shí)候,一個(gè)眼神就足夠了。不是嗎?

語(yǔ)義通信和傳統(tǒng)信源編碼的區(qū)別在哪里呢?

傳統(tǒng)信源編碼是對(duì)信息本身的壓縮,它尋找數(shù)據(jù)的規(guī)律,通過(guò)算法進(jìn)行數(shù)據(jù)精簡(jiǎn)。而語(yǔ)義通信,重在“理解和消化”,講究的是“智能”。

語(yǔ)義通信系統(tǒng)的架構(gòu)

語(yǔ)義通信可以顯著降低數(shù)據(jù)流量,提高通信效率。那么,它究竟是如何工作的呢?

語(yǔ)義通信目前還處于早期研究階段,不同的研究團(tuán)隊(duì),有不同的語(yǔ)義通信架構(gòu)設(shè)計(jì)。

而且,針對(duì)不同類型的通信(文本通信、圖像通信、音視頻通信等),不同目的的通信(是否有特定任務(wù)),也會(huì)有不同的語(yǔ)義通信模型和架構(gòu)。

早期的一種模型,是在傳統(tǒng)經(jīng)典通信系統(tǒng)上疊加語(yǔ)義通信。

在發(fā)送端,信源產(chǎn)生的信息首先送入語(yǔ)義提取模塊,產(chǎn)生語(yǔ)義表征序列。接著,送入語(yǔ)義信源編碼器,對(duì)語(yǔ)義特征壓縮編碼。然后,送入信道編碼器。最后,進(jìn)入傳輸信道。

在接收端,先信道譯碼,再語(yǔ)義譯碼。得到的語(yǔ)義表征序列,送入語(yǔ)義恢復(fù)與重建模塊,最終得到信源數(shù)據(jù)。

中間那段信道部分,就是傳統(tǒng)經(jīng)典通信來(lái)實(shí)現(xiàn)。

另一種現(xiàn)在比較有代表的模型,是信源信道聯(lián)合編碼。這種方式,更有整體性,全盤思考。

大家能看出來(lái),相比傳統(tǒng)通信,語(yǔ)義通信多了一個(gè)知識(shí)庫(kù)。其實(shí),有的模型并沒(méi)有知識(shí)庫(kù),直接在語(yǔ)義編碼器上硬剛。

更多的系統(tǒng)模型,是基于知識(shí)庫(kù)的。系統(tǒng)模型的性能和準(zhǔn)確率,高度依賴于知識(shí)庫(kù)。

知識(shí)庫(kù)就有點(diǎn)像密碼本。如果兩端的知識(shí)庫(kù)不一致,那么,語(yǔ)義通信是無(wú)法正常工作的。

知識(shí)庫(kù)又不像密碼本那樣,內(nèi)容固定且形式單一。知識(shí)庫(kù)由很多的語(yǔ)義知識(shí)圖譜組成,分為多個(gè)層級(jí),可以對(duì)現(xiàn)實(shí)世界中的實(shí)體、概念、屬性以及它們之間的關(guān)系進(jìn)行建模。

基于知識(shí)庫(kù),進(jìn)行語(yǔ)義理解,就需要前面我們所說(shuō)的“智能”。

誰(shuí)最適合干這個(gè)活?當(dāng)然是AI人工智能

簡(jiǎn)單來(lái)說(shuō),就是讓AI來(lái)完成語(yǔ)義理解的工作。語(yǔ)義編碼與譯碼模塊基于海量數(shù)據(jù)訓(xùn)練的知識(shí)庫(kù),通過(guò)深度學(xué)習(xí)網(wǎng)絡(luò)來(lái)擬合語(yǔ)義的特征,可以高效提取與重建語(yǔ)義信息。

這也是為什么,最近十幾年來(lái),語(yǔ)義通信開始重新被提及的原因。

早在1956年,法國(guó)物理學(xué)家L.布里淵(L.Brillouin)就指出,經(jīng)典信息論忽略語(yǔ)義通信,是因?yàn)楣こ绦枰ㄒ冉鉀Q基本需求),并不意味著人們要永遠(yuǎn)忽視語(yǔ)義信息。

如今,一方面?zhèn)鹘y(tǒng)信息論遇到瓶頸,另一方面AI人工智能技術(shù)日益成熟,所以,我們重提語(yǔ)義通信的時(shí)機(jī)就成熟了。

特別值得一提的是,AI人工智能可以幫助語(yǔ)義通信,反過(guò)來(lái),語(yǔ)義通信,也非常適合人工智能的發(fā)展。

大家應(yīng)該能夠理解:同類型主體之間的通信,往往容易簡(jiǎn)化。就像人和人之間,通信肯定比人和牛之間簡(jiǎn)單。

未來(lái),我們正在朝著智能化的方向發(fā)展,AI人工智能批量應(yīng)用之后,就會(huì)有很多的智能體。這些智能體之間,就會(huì)有大量的通信需求。而語(yǔ)義通信,本身就是AI在進(jìn)行“翻譯”,對(duì)于智能體通信,肯定會(huì)有更大的優(yōu)勢(shì)。

語(yǔ)義通信面臨的挑戰(zhàn)

語(yǔ)義通信的發(fā)展前景,行業(yè)是一致看好的。但是,想要讓這項(xiàng)技術(shù)投入實(shí)用,真正發(fā)揮價(jià)值,并不容易。

首先,語(yǔ)義通信的基礎(chǔ)理論體系,并不完善。

香農(nóng)的信息論,給傳統(tǒng)語(yǔ)法信息奠定了理論基礎(chǔ)。他用一個(gè)簡(jiǎn)單的對(duì)數(shù)公式,就把信息(熵)明確定義出來(lái);用香農(nóng)公式,又把語(yǔ)法通信的信道容量邊界也劃定了。

對(duì)于語(yǔ)義通信,還沒(méi)有人完成這兩項(xiàng)重要工作。相對(duì)于語(yǔ)法通信,語(yǔ)義通信缺失嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)表征,沒(méi)有扎實(shí)的理論依據(jù)。

語(yǔ)義通信的信息度量方式,目前也沒(méi)有特別明確。

傳統(tǒng)語(yǔ)法通信有誤碼率、丟包率之類的指標(biāo),用于衡量服務(wù)質(zhì)量。語(yǔ)義通信關(guān)注“達(dá)意”,不關(guān)注“精準(zhǔn)傳輸”,所以,這些指標(biāo)都用不了。

在語(yǔ)義通信中,只能會(huì)采用宏觀的任務(wù)完成質(zhì)量或語(yǔ)義準(zhǔn)確率,來(lái)進(jìn)行系統(tǒng)性能評(píng)估。

說(shuō)到準(zhǔn)確率,這是語(yǔ)義通信的第二個(gè)大問(wèn)題。

以目前現(xiàn)有的技術(shù),即便是用上了AI人工智能,仍然無(wú)法做到完美的準(zhǔn)確率。語(yǔ)義的識(shí)別與恢復(fù),比想象中難得多。

第三個(gè)問(wèn)題,是適用場(chǎng)景問(wèn)題

通信是一件復(fù)雜工作。數(shù)據(jù)是多樣化的,有結(jié)構(gòu)化數(shù)據(jù),也有非結(jié)構(gòu)化數(shù)據(jù)。文字、圖片、音視頻,還有一些特定的通信任務(wù),混在一起,很難借助一個(gè)有范圍限制性的知識(shí)庫(kù),進(jìn)行語(yǔ)義提取。

例如,我們采用工業(yè)制造場(chǎng)景的知識(shí)庫(kù),去進(jìn)行農(nóng)林牧漁場(chǎng)景的語(yǔ)義通信,肯定不行。但是,通信場(chǎng)景的邊界,又該如何精確劃分?

知識(shí)庫(kù)還涉及到第四個(gè)問(wèn)題,那就是安全問(wèn)題

在現(xiàn)實(shí)情況下,如何維持兩份高度一致的知識(shí)庫(kù)?如果對(duì)知識(shí)庫(kù)進(jìn)行傳遞,會(huì)不會(huì)泄密?如何保障知識(shí)庫(kù)不被入侵和擾亂?

總而言之,語(yǔ)義通信面臨的挑戰(zhàn)還有很多。這些還都是理論研究上的問(wèn)題,將來(lái)如果產(chǎn)業(yè)化,問(wèn)題還會(huì)更多。

語(yǔ)義通信的研究進(jìn)展

前面說(shuō)了,語(yǔ)義通信目前還處于早期研究階段。2010年至今,這個(gè)概念的研究熱度是越來(lái)越高的。

在國(guó)內(nèi),很多高校都進(jìn)行了一些語(yǔ)義通信模型的搭建,并取得了初步進(jìn)展。

最有代表性的,是北郵張平院士及他的團(tuán)隊(duì)。

2022年左右,他們針對(duì)6G的智簡(jiǎn)演進(jìn)需求,提出了一種新的語(yǔ)義信息表征模型——語(yǔ)義基(Seb)。

語(yǔ)義基是語(yǔ)義信息的基本組織單元,類似于香農(nóng)在傳統(tǒng)信息論體系中的比特(Bit)。它以更為結(jié)構(gòu)化、簡(jiǎn)約化、彈性化的方式對(duì)信息進(jìn)行組織,為描述涉及網(wǎng)絡(luò)意圖的語(yǔ)義信息提供了新的視角。

他們還提出了面向6G的“一面三層(語(yǔ)義智能平面、語(yǔ)義物理承載層、語(yǔ)義網(wǎng)絡(luò)協(xié)議層、語(yǔ)義應(yīng)用意圖層)”智簡(jiǎn)網(wǎng)絡(luò)協(xié)議架構(gòu),為語(yǔ)義通信的研究提供了重要參考。

除了高校之外,部分企業(yè)也參與到語(yǔ)義通信的研究和實(shí)踐中。

中國(guó)移動(dòng)為例,他們和清華大學(xué)合作,搞了一個(gè)面向人臉場(chǎng)景的會(huì)話視頻語(yǔ)義傳輸方案,在中移平安鄉(xiāng)村網(wǎng)絡(luò)中進(jìn)行應(yīng)用,效果不錯(cuò)。

相比于傳統(tǒng)H.264編碼,針對(duì)人臉場(chǎng)景,語(yǔ)義通信在相同用戶體驗(yàn)下將碼率降低為10-20%,即降低到3KB也能獲清晰流暢體驗(yàn)。

結(jié)語(yǔ)

總而言之,語(yǔ)義通信技術(shù),擁有巨大的研究潛力。

它是通信系統(tǒng)設(shè)計(jì)思想、理念的一次重大變革,很可能徹底顛覆我們現(xiàn)有的信息通信技術(shù)體系。

面向未來(lái),語(yǔ)義通信到底是騾子是馬,就讓時(shí)間來(lái)告訴我們答案吧。

參考資料:

面向未來(lái)的語(yǔ)義通信:基本原理與實(shí)現(xiàn)方法,張平等,《通信學(xué)報(bào)》;邁向6G智簡(jiǎn)網(wǎng)絡(luò)——基于語(yǔ)義通信的網(wǎng)絡(luò)新范式,張平等,《Engineering》;語(yǔ)義通信:原理與挑戰(zhàn),秦志金等;語(yǔ)義通訊——智能時(shí)代的產(chǎn)物,石光明等;面向萬(wàn)物智聯(lián)的語(yǔ)義通信網(wǎng)絡(luò),石光明等,《物聯(lián)網(wǎng)學(xué)報(bào)》;面向6G的語(yǔ)義通信,牛凱等,《移動(dòng)通信》;基于信息論的語(yǔ)義通信:理論與挑戰(zhàn),施雨軒等,《中興通訊》;面向6G的語(yǔ)義通信系統(tǒng),王碧舳等,《移動(dòng)通信》;

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
KSZ9031MNXIA-TR 1 Microchip Technology Inc DATACOM, ETHERNET TRANSCEIVER, QCC64
$41.55 查看
LAN8710A-EZC-ABC 1 Microchip Technology Inc Ethernet Transceiver

ECAD模型

下載ECAD模型
$1.55 查看
TJA1042T/3,118 1 NXP Semiconductors TJA1042 - High-speed CAN transceiver with Standby mode SOIC 8-Pin

ECAD模型

下載ECAD模型
$1.51 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

通信行業(yè)知名新媒體鮮棗課堂創(chuàng)始人,通信行業(yè)資深專家、行業(yè)分析師、自媒體作者,《智聯(lián)天下:移動(dòng)通信改變中國(guó)》叢書作者。通信行業(yè)13年工作經(jīng)驗(yàn),曾長(zhǎng)期任職于中興通訊股份有限公司,從事2/3/4G及5G相關(guān)技術(shù)領(lǐng)域方面的研究,曾擔(dān)任中興通訊核心網(wǎng)產(chǎn)品線產(chǎn)品經(jīng)理、能力提升總監(jiān)、中興通訊學(xué)院二級(jí)講師、中興通訊高級(jí)主任工程師,擁有豐富的行業(yè)經(jīng)驗(yàn)和積累。