█ 到底什么是AI?
AI,是artificial intelligence的縮寫。
Artificial,很多同學(xué)認(rèn)字認(rèn)半邊,會以為是藝術(shù)(art)的什么形容詞。其實不然,artificial的意思就是“人工的、人造的”,和natural(天然的)是反義詞。
Intelligence,這個不容易認(rèn)錯,是“智能”的意思。英特爾(Intel)公司的名字,就是基于這個詞的前五個字母。
結(jié)合起來,AI,就是“人工的、人造的智能”,用人為的手段,創(chuàng)造智能。
關(guān)于AI的定義,行業(yè)里有很多種說法。比較學(xué)術(shù)化的一種,是這么說的:
AI,是研究、開發(fā)用于模擬、延伸和擴展人的智能行為的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門綜合性科學(xué)。
這個定義很拗口,看得都頭大。
其實,對于AI,我們可以拆解來看。
首先,AI的本質(zhì)屬性,是一門科學(xué),是一個技術(shù)領(lǐng)域。
它涉及到了計算機科學(xué)、數(shù)學(xué)、統(tǒng)計學(xué)、哲學(xué)、心理學(xué)等多種學(xué)科的知識,但總體上,歸類于計算機學(xué)科之下。
其次,AI的研究目的,是讓一個“系統(tǒng)”具備智能。
這個“系統(tǒng)”,可以是一套軟件程序,也可以是一臺計算機,甚至是一個機器人。
第三,什么樣的水平,才叫做真正的智能。
這是問題的關(guān)鍵。目前看來,能夠像人一樣感知、理解、思考、判斷、決策,就是實現(xiàn)了人工智能。
配合機器人、機械臂等物理載體,AI也可以實現(xiàn)行動能力。
綜合以上三點,理解AI的定義就比較容易了。
█ AI和普通計算機有什么區(qū)別?
AI,目前仍然是基于計算機的基本玩法,采用的是半導(dǎo)體芯片技術(shù)(所以經(jīng)常會被稱為“硅基”),以及計算機的一些體系和平臺。
那么,它和傳統(tǒng)的計算機程序,有什么區(qū)別呢?
傳統(tǒng)的計算機程序,就是一個規(guī)則的集合。程序員通過代碼告知計算機規(guī)則,計算機根據(jù)規(guī)則,對輸入數(shù)據(jù)進行判斷和處理。
例如經(jīng)典的“if……else……(如果……否則……)”語句——“如果大于65歲,就退休。否則,繼續(xù)上班”。
然后,計算機程序會根據(jù)這個規(guī)則,對所有輸入年齡數(shù)據(jù)進行判斷和處理。
但是,在現(xiàn)實生活中,很多要素(例如圖像和聲音)是極為復(fù)雜和多樣的,我們很難給出固定的規(guī)則,讓計算機實現(xiàn)高準(zhǔn)確率的判斷和處理。
例如,判斷一只狗是不是狗。
狗有很多品種,每種狗有不同的顏色、體型、五官特征。狗在不同的時間,也有不同的表情、姿勢。狗還會處于不同的背景環(huán)境下。
所以,計算機通過攝像頭捕捉到的狗的影像,是無窮盡的。很難通過有限數(shù)量的規(guī)則,去幫助計算機做出判斷。
想要讓計算機實現(xiàn)像人一樣的智能,不能采用簡單的規(guī)則驅(qū)動,而是應(yīng)該像教孩童一樣,不斷輸入數(shù)據(jù)和答案,讓他自行總結(jié)特征,形成自己的判斷規(guī)則。
換言之,在經(jīng)典的程序設(shè)計中,人們輸入的是規(guī)則(即程序)和數(shù)據(jù),系統(tǒng)輸出的是答案。
而AI的計算過程,分為兩個步驟:
第一個步驟,輸入的是數(shù)據(jù)和預(yù)期得到的答案,系統(tǒng)輸出的是規(guī)則。
第二個步驟,將輸出的規(guī)則應(yīng)用于新的數(shù)據(jù),然后再輸出答案。
第一步,我們可以稱之為“訓(xùn)練”。第二步,才是真正“干活”。
這就是傳統(tǒng)計算程序和現(xiàn)在主流AI技術(shù)的一個典型區(qū)別。(注意,我說的是“現(xiàn)在主流AI”。有一些“歷史AI”和“非主流AI”,玩法不一樣。不能一概而論。)
█ AI,有哪些類別?
前面說了,人工智能是一個非常龐大的科學(xué)領(lǐng)域。
從1950年代正式誕生以來,圍繞人工智能,已經(jīng)有很多科學(xué)家進行了大量的研究,也輸出了很多非常了不起的成果。
這些研究,根據(jù)思路方向的不同,被分為了很多種學(xué)派。比較有代表性的,是符號主義學(xué)派、聯(lián)結(jié)主義學(xué)派、行為主義學(xué)派。
這些學(xué)派并沒有對錯之分,相互之間也有一些交叉融合。
早期的時候(1960-1990),符號主義(以專家系統(tǒng)、知識圖譜為代表)是主流。后來,從1980年開始,聯(lián)結(jié)主義(以神經(jīng)網(wǎng)絡(luò)為代表)崛起,一直到現(xiàn)在,都是主流。
將來,也許有新的技術(shù)崛起,形成新的學(xué)派,也不一定。
除了方向路線之外,我們也可以從智能水平以及應(yīng)用領(lǐng)域等方面對AI進行分類。
按智能水平,可以分為:弱人工智能(Weak AI)、強人工智能(Strong AI)、超人工智能(Super AI)。
弱人工智能只專精于單一任務(wù)或一組相關(guān)的任務(wù),不具備通用智能能力。我們目前就處于這個階段。
強人工智能更厲害一些,具有一定的通用智能能力,能夠理解、學(xué)習(xí)并應(yīng)用于各種不同的任務(wù)。這個還處于理論和研究階段,還沒落地。
超人工智能當(dāng)然是最強的。它在幾乎所有方面都超過人類智能,包括創(chuàng)造力、社交技能等。超人工智能是未來的終極形態(tài),我們假設(shè)它能夠?qū)崿F(xiàn)。
關(guān)于按應(yīng)用領(lǐng)域的AI分類,我們待會再說。
█ 什么是機器學(xué)習(xí)?
其實我們前面介紹規(guī)則總結(jié)的時候,其實已經(jīng)提到了機器學(xué)習(xí)。
機器學(xué)習(xí)的核心思想,是構(gòu)建一個可以從數(shù)據(jù)中學(xué)習(xí)的模型,并利用這個模型來進行預(yù)測或決策。
機器學(xué)習(xí)不是一個具體的模型或算法。它包括了很多種類型,例如:
監(jiān)督學(xué)習(xí):算法從帶有標(biāo)簽的數(shù)據(jù)集中學(xué)習(xí),即每個訓(xùn)練樣本都有一個已知的結(jié)果。
無監(jiān)督學(xué)習(xí):算法從沒有標(biāo)簽的數(shù)據(jù)集中學(xué)習(xí)。
半監(jiān)督學(xué)習(xí):結(jié)合了少量的帶標(biāo)簽數(shù)據(jù)和大量的未帶標(biāo)簽數(shù)據(jù)進行訓(xùn)練。
強化學(xué)習(xí):通過試錯的方式,學(xué)習(xí)哪些行為可以獲得獎勵,哪些行為會導(dǎo)致懲罰。
█?什么是深度學(xué)習(xí)?
深度學(xué)習(xí),具體來說,是深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)。
深度學(xué)習(xí)是機器學(xué)習(xí)的一個重要分支。機器學(xué)習(xí)底下有一條“神經(jīng)網(wǎng)絡(luò)”路線,而深度學(xué)習(xí),是加強版的“神經(jīng)網(wǎng)絡(luò)”學(xué)習(xí)。
神經(jīng)網(wǎng)絡(luò)是聯(lián)結(jié)主義的代表。顧名思義,這個路線是模仿人腦的工作原理,建立神經(jīng)元之間的聯(lián)結(jié)模型,以此實現(xiàn)人工神經(jīng)運算。
深度學(xué)習(xí)所謂的“深度”,是神經(jīng)網(wǎng)絡(luò)中“隱藏層”的層級。
經(jīng)典機器學(xué)習(xí)算法使用的神經(jīng)網(wǎng)絡(luò),具有輸入層、一個或兩個“隱藏層”和一個輸出層。
深度學(xué)習(xí)算法使用了更多的“隱藏層”(數(shù)百個)。它的能力更加強大,讓神經(jīng)網(wǎng)絡(luò)能夠完成更困難的工作。
機器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的關(guān)系,通過下面的圖可以看出:
█ 什么是卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)?
神經(jīng)網(wǎng)絡(luò)從1980年代開始崛起之后,就形成了很多的模型和算法。不同的模型和算法,有著各自的特性和功能。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN),是1990年代左右誕生的比較知名的神經(jīng)網(wǎng)絡(luò)模型。
它們的具體工作原理比較復(fù)雜。反正大家記?。?/p>
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種用于處理具有類似網(wǎng)格結(jié)構(gòu)的數(shù)據(jù)(例如圖像和視頻)的神經(jīng)網(wǎng)絡(luò)。所以,它通常用于計算機視覺中,可以用來圖像識別和圖像分類。
而循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是一種用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),例如語言模型和時間序列預(yù)測。所以,它通常用于自然語言處理和語音識別。
█?什么是transformer?
transformer也是一個神經(jīng)網(wǎng)絡(luò)模型。它比卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)更加年輕(2017年由谷歌研究團隊提出),也更加強大。
作為非專業(yè)人士,不需要去研究它的工作原理,只需要知道:
1、它是一種深度學(xué)習(xí)模型;2、它使用了一種名為自注意力(self-attention)的機制;3、它有效解決了卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的瓶頸(局限性)問題;4、它很適合自然語言處理(NLP)任務(wù)。相比循環(huán)神經(jīng)網(wǎng)絡(luò),它的計算可以高度并行化,簡化了模型架構(gòu),訓(xùn)練效率也大大提升;5、它也被擴展到了其他領(lǐng)域,如計算機視覺和語音識別。6、現(xiàn)在我們經(jīng)常提到的大模型,幾乎都是以transformer為基礎(chǔ)。
█?什么是大模型?
這兩年AI火,就是因為大模型火。那么,什么是大模型?
大模型,是具有龐大參數(shù)規(guī)模和復(fù)雜計算結(jié)構(gòu)的機器學(xué)習(xí)模型。
參數(shù),是指在模型訓(xùn)練過程中,學(xué)習(xí)和調(diào)整的變量。參數(shù)定義了模型的行為、性能、實現(xiàn)的成本以及對計算資源的需求。簡單來說,參數(shù)是模型內(nèi)部用來做出預(yù)測或決策的部分。
大模型,通常擁有數(shù)百萬至數(shù)十億的參數(shù)。相對應(yīng)的,參數(shù)少的,就是小模型。對一些細(xì)分的領(lǐng)域或場景,小模型也夠用。
大模型需要依賴大規(guī)模數(shù)據(jù)進行訓(xùn)練,對算力資源的消耗極大。
大模型有很多種類別。通常所說的大模型,主要是指語言大模型(以文本數(shù)據(jù)進行訓(xùn)練)。但實際上,還有視覺大模型(以圖像數(shù)據(jù)進行訓(xùn)練),以及多模態(tài)大模型(文本和圖像都有)。
絕大多數(shù)大模型的基礎(chǔ)核心結(jié)構(gòu),都是Transformer及其變體。
按應(yīng)用領(lǐng)域,大模型可以分為通用大模型和行業(yè)大模型。
通用大模型的訓(xùn)練數(shù)據(jù)集更加廣泛,覆蓋的領(lǐng)域更加全面。行業(yè)大模型,顧名思義,訓(xùn)練數(shù)據(jù)來自特定行業(yè),應(yīng)用于專門的領(lǐng)域(例如金融、醫(yī)療、法律、工業(yè))。
█?GPT的本質(zhì)是什么?
GPT-1、GPT-2……GPT-4o,等等,都是美國OpenAI這家公司推出的語言大模型,同樣都是基于Transformer架構(gòu)。
GPT的全稱,叫做Generative Pre.trained Transformer,生成式-預(yù)訓(xùn)練-Transformer。
Generative(生成式),表示該模型能夠生成連續(xù)的、有邏輯的文本內(nèi)容,比如完成對話、創(chuàng)作故事、編寫代碼或者寫詩寫歌等。
這里剛好提一下,現(xiàn)在常說的AIGC,就是AI Generated Content,人工智能生成內(nèi)容。內(nèi)容,可以是文本、圖像、音頻、視頻等。
GPT系列面向文本,谷歌也推出過競品BERT。
文生圖,比較有代表性的是DALL·E(也來自O(shè)penAI)、Midjourney(知名度大)和Stable Diffusion(開源)。
文生音頻(音樂),有Suno(OpenAI)、Stable Audio Open(由Stability.ai開源)、Audiobox(Meta)。
文生視頻,有Sora(OpenAI)、Stable Video Diffusion(由Stability.ai開源)、Soya(開源)。圖也可以生視頻,例如騰訊的Follow-Your-Click。
AIGC是一個“應(yīng)用維度”的定義,它不是一個具體的技術(shù)或模型。AIGC的出現(xiàn),擴展了AI的功能,打破了此前AI主要用于識別的功能限制,拓寬了應(yīng)用場景。
好了,繼續(xù)解釋GPT的第二個字母——Pre.trained。
Pre.trained(預(yù)訓(xùn)練),表示該模型會先在一個大規(guī)模未標(biāo)注文本語料庫上進行訓(xùn)練,學(xué)習(xí)語言的統(tǒng)計規(guī)律和潛在結(jié)構(gòu)。
通過預(yù)訓(xùn)練,模型才有了一定的通用性。訓(xùn)練的數(shù)據(jù)越龐大(如網(wǎng)頁文本、新聞等),模型的能力就越強。
大家對于AI的關(guān)注熱潮,主要源于2023年初的ChatGPT爆火。
ChatGPT的chat,是聊天的意思。ChatGPT是OpenAI基于GPT模型開發(fā)的一個AI對話應(yīng)用服務(wù)(也可以理解為GPT-3.5)。
通過這個服務(wù),人們才可以親身體驗到GPT模型的強大,有利于技術(shù)的宣傳和推廣。
事實證明,OpenAI的策略成功了。ChatGPT充分吸引了公眾關(guān)注度,也成功推動了AI領(lǐng)域的發(fā)展熱潮。
█?AI,究竟能做什么?
AI的作用,極為廣泛。
概括來說,AI和傳統(tǒng)計算機系統(tǒng)相比,能提供的拓展能力,包括:圖像識別、語音識別、自然語言處理、具身智能等方面。
圖像識別,有時候也被歸類為計算機視覺(Computer Vision,CV),讓計算機具備理解和處理圖像和視頻的能力。常見的是攝像頭、工業(yè)質(zhì)檢、人臉識別之類的。
語音識別,就是理解和處理音頻,獲得音頻所搭載的信息。常見的是手機語音助手、電話呼叫中心、聲控智能家居之類的,多用于交互場景。
自然語言處理,前面介紹過,就是使計算機能夠理解和處理自然語言,知道我們到底在說什么。這個很火,多用于創(chuàng)造性的工作,例如寫新聞稿、寫書面材料、視頻制作、游戲開發(fā)、音樂創(chuàng)作等。
具身智能,就是把人工智能搭載在一個物理形態(tài)(“身體”)上,通過與環(huán)境互動,來獲得和展示智能。
帶AI的機器人,屬于具身智能。
斯坦福大學(xué)年初推出的“Mobile ALOHA”,就是一個典型的家用具身機器人。它可以炒菜、煮咖啡甚至逗貓,火爆全網(wǎng)。
值得一提的是,并不是所有的機器人,都是人形機器人。也不是所有的機器人,都用到了AI。
AI特別擅長對海量數(shù)據(jù)進行處理,一方面通過海量數(shù)據(jù)進行學(xué)習(xí)和訓(xùn)練,另一方面,基于新的海量數(shù)據(jù),完成人工無法完成的工作?;蛘哒f,找到海量數(shù)據(jù)中潛在的規(guī)律。
目前AI在社會各個垂直行業(yè)的應(yīng)用,主要是圍繞上面的能力進行延展。
我們舉一些常見的例子。
在醫(yī)療領(lǐng)域,AI已經(jīng)可以用于分析X光片、CT掃描、MRI圖像等,幫助識別識別異常區(qū)域,甚至做出診斷判斷。AI還可以用于識別組織切片中的細(xì)胞變異,輔助病理學(xué)家進行癌癥篩查和其他疾病的診斷。
AI還可以分析患者的基因組數(shù)據(jù),確定最適合的治療方案。AI也可以根據(jù)患者的病史和生理指標(biāo),輔助預(yù)測病情趨勢。
在藥品研發(fā)方面,AI可以幫助模擬化學(xué)成分的相互作用,縮短新藥研發(fā)周期。
發(fā)生嚴(yán)重的公共衛(wèi)生事件時,AI可以分析流行病數(shù)據(jù),預(yù)測疾病傳播的趨勢。
在金融領(lǐng)域,AI可以實時監(jiān)測市場動態(tài),識別潛在的市場風(fēng)險,并制定相應(yīng)的風(fēng)險對沖策略。
AI還可以通過分析借款人的信用記錄、收入情況、消費行為等多維度數(shù)據(jù),評估信貸風(fēng)險。當(dāng)然,AI也可以結(jié)合投資者的個人財務(wù)情況、風(fēng)險偏好和收益目標(biāo),提供最合適的投資組合建議。
類似的例子實在是數(shù)不勝數(shù)。在工業(yè)制造、教育文旅、商業(yè)零售、農(nóng)林牧漁、公共安全、政府治理等幾乎所有領(lǐng)域,AI都已經(jīng)有了實際的落地場景和案例。
AI正在改變社會,改變我們每一個人的工作和生活。
█ 我們應(yīng)該如何看待AI?
AI的商業(yè)和社會價值,是毋庸置疑的。它的崛起趨勢,也是不可阻擋的。
從企業(yè)的角度來說,AI能夠自動化重復(fù)性、繁瑣的任務(wù),提高生產(chǎn)效率和質(zhì)量,同時降低生產(chǎn)成本和人力成本。
對于制造業(yè)和服務(wù)業(yè)來說,這個優(yōu)勢至關(guān)重要,直接影響了企業(yè)的競爭力,甚至是生存。
從政府的角度來說,AI不僅可以提升治理效率,也能夠帶來新的商業(yè)模式、產(chǎn)品和服務(wù),刺激經(jīng)濟。
強大的AI,也是一種國家競爭力。在科技博弈和國防事業(yè)方面,如果AI技術(shù)不如別人,可能會帶來嚴(yán)重后果。
從個人的角度來說,AI可以幫助我們完成一些工作,也可以提升我們的生活品質(zhì)。
從整個人類的角度來說,AI在疾病治療、災(zāi)害預(yù)測、氣候預(yù)測、消滅貧窮方面,也可以發(fā)揮重要的作用。
但事物都是有兩面性的。AI作為工具,既有利,也有弊。
最現(xiàn)實的一個弊,就是可能會威脅到大量的人類工作崗位,導(dǎo)致大量失業(yè)。根據(jù)麥肯錫的研究,到2030年至2060年之間,大約50%的職業(yè)可能會逐步被AI取代,特別是對于知識工作者而言。
除此之外,AI被用于發(fā)動戰(zhàn)爭、欺詐(模仿聲音或換臉,進行詐騙)、侵犯公民權(quán)益(信息過度采集、侵犯隱私)。
如果只有少數(shù)公司擁有先進的AI技術(shù),可能會加劇社會的不公平現(xiàn)象。AI的算法偏見,也可能導(dǎo)致不公平。
AI變得越來越強大,也會讓人們產(chǎn)生對AI的依賴,失去獨立思考和解決問題的能力。AI的強大創(chuàng)造力,有可能讓人類失去創(chuàng)造的動力和信心。
圍繞AI的發(fā)展,還有安全(數(shù)據(jù)泄露、系統(tǒng)崩潰)、道德倫理等一系列問題。
所有這些問題,我們目前都沒有靠譜的解決方案。所以,只能在發(fā)展AI的過程中,一點點去探索、思考和解決。對于AI的警惕和防范之心,是一定要有的。
作為我們普通人,目前最現(xiàn)實的做法,就是先了解它、學(xué)習(xí)它。先學(xué)會使用常見的AI工具和平臺,幫助自己提升工作效率,改善生活品質(zhì)。
有句話說的好:“未來,淘汰你的不是AI,而是掌握了AI的人”。與其焦慮,不如勇敢面對和積極擁抱,盡早掌握主動權(quán)。
好啦,以上就是今天文章的全部內(nèi)容。對于一個普通人來說,知道這些AI常識,就是擁抱AI的第一步。至少和別人聊天的時候,談到AI,就不會一頭霧水了。
感謝大家的耐心閱讀,我們下期再見!