Twitter上有人對比了ChatGPT、instagram、spotify、Facebook、netflix、twitter,收獲百萬、1億用戶所花的時間,其中,ChatGPT以火箭躥升之姿光速登頂,業(yè)內人士評論“Something different is happening”、“它不是一個新產品、而是一個新物種”。
科技界這種盛況并不多見,上一次還是iPhone問世?ChatGPT霸屏的這段時間,相關概念股群魔亂舞,創(chuàng)業(yè)公司爭做“中國版的Open AI”……一個核心的問題浮出水面:ChatGPT會不會固化AI產業(yè)格局,強者恒強?如果這是一場巨頭的游戲,國內的中小企業(yè)該怎么玩?
會否加劇“強者恒強”的兩極局面?
從硅谷到中國,ChatGPT的熱度有增無減,但主要玩家都是巨頭。目前國內有能力競逐的也都是行業(yè)翹楚:百度文心一言、騰訊HunYuan-NLP 1T大模型、阿里“通義”大模型、華為盤古大模型、中科院自動化研究所“紫東·太初”等。當AI闊步進入大模型時代,走在前列的巨頭會不會把追逐者遠遠甩開?
曾任華為系NLP企業(yè)首席科學家、現任千芯科技董事長陳巍認為,可以從企業(yè)和國家整體產業(yè)兩個層面來看。
目前ChatGPT這類大模型領域確實有一定的馬太效應,跑在前面的企業(yè)玩家具備完整的算法、數據和算力優(yōu)勢,后發(fā)者想要追趕確實有較大難度。但是對企業(yè)來說,未必就是強者恒強。例如OpenAI在ChatGPT這類問答型NLP算法曾一度落后于Google BERT,但現在又開始重新領跑。這其中少數研發(fā)人員的智慧、天賦,以及破釜沉舟般的專注,實際上是決定勝負的關鍵。
“而資金或者攢局恐怕無法代替技術,比如微軟自己做小冰,最后也要讓位于ChatGPT”, 陳巍談到,“如果國內的技術偏執(zhí)狂人能夠領悟或訓練出更高水平的模型,在算法或訓練方法上形成降維打擊,超越OpenAI也不是不可能?!?/p>
再從各國產業(yè)發(fā)展而言,由于AI領先的國家確實具備了系統(tǒng)化且領先的AI技術人群和豐富的算力基礎(大算力芯片),已經在教育-研究-產品-需求上形成完整閉環(huán),一旦在ChatGPT這類大模型上拉開差距,很可能形成兩極分化的國力競爭格局,甚至形成“強者恒強”的局面。
面對ChatGPT沖擊波,中小企業(yè)的機會在哪里?
近期不少人給ChatGPT算經濟賬,國盛證券以英偉達A100芯片、DGXA100服務器、現階段每日2500萬訪問量等假設為基礎,估算得出:在初始算力投入上,為滿足ChatGPT當前千萬級用戶的咨詢量,投入成本約為8億美元,對應約4000臺服務器。
反觀國內AI中小企業(yè),他們既撐不起全棧式的AI研發(fā),也無力為高昂的算力買單。那么在大模型快速發(fā)展、走向商用的過程中,他們的發(fā)展機會主要有哪些?如果只能接入巨頭的生態(tài)求生存,會不會產生同質化競爭?
陳巍表示,對于做NLP算法的中小創(chuàng)業(yè)企業(yè)來說,初期確實可能會遇到比較大的打擊。因為ChatGPT這類應用,把這些公司之前的積累基本拉平到同一檔位上,甚至可能早期的一些投入基本打水漂了。
不過,中小企業(yè)有自身的靈活優(yōu)勢,船小好掉頭,可以基于ChatGPT這類應用,針對細分垂域做專用的領域模型(例如做ChatGPT+領域模型的混合模型)。而對于巨頭來說,由于細分領域眾多,即便分散兵力、撒胡椒面也未必劃算。他強調,ChatGPT是通識智能、千人一面,目前并不具有個性特征、情感和某些特定領域專家知識,國內的中小NLP企業(yè)反而可以充分借助ChatGPT帶來的通識和多輪對話能力提升來拓展更多客戶。
“國內中小企業(yè)說不定能誕生有高超天賦的NLP人才,未必不能打造出類似當年TMD(今日頭條、美團、滴滴)在BAT(百度、阿里、騰訊)之后成為新巨頭的故事。因為巨頭內部有嚴格的季度ROI考核,對于ChatGPT這類需要多年冷板凳的研發(fā)項目不是太友好,頂尖項目在巨頭內部發(fā)展未必好”,陳巍從研發(fā)方面指出了中小企業(yè)的可能性。
其次,對于做NLP應用的中小創(chuàng)業(yè)企業(yè)來說,他們往往側重于場景、模型研發(fā)少,ChatGPT這類產品會在一定程度上加劇同質化競爭。但接入ChatGPT,也會讓這些企業(yè)更好地提升服務獲得更多客戶。特別是那些有深厚行業(yè)積累、充分理解行業(yè)的NLP應用企業(yè),反而會進一步受益。就好比淘寶最初把中小商家和大商家放到同一個平臺上,開始的時候競價激烈,但后來大家發(fā)現平臺大了,客戶圈也大了,反而擴展到省外甚至國外。
2年后有望追上ChatGPT現有水平?
以ChatGPT為代表的AIGC應用,離不開大數據、大算力、大模型的訓練結果。當我們面對這股龍卷風般的潮流席卷時,首先要看清自身的水平和現實差距。
陳巍指出,首先數據方面,國內的高質量語料較少,大部分能用的語料標記質量恐怕達不到ChatGPT的訓練要求。就拿OpenAI來說,是雇用了約40多個全職的標記員,按照特定的要求來標記語料,而不是直接找數據公司買通用的標記數據。推測這個標記方法應該與其訓練策略密切相關,可能有一定的保密要求,是完全私有的數據集。因此,國內企業(yè)首先要補上私有數據集這個短板、以及數據集的標記策略,而這可能都是大量燒錢訓練之后學到的經驗。
再說模型本身。以ChatGPT為例,基本上國內大部分開發(fā)者都是從開源的GPT-2開始起步,大部分企業(yè)恐怕要經過大量的盲人摸象般的訓練才能進階到GPT-3的水平,然后再繼續(xù)訓練到GPT-3.5和ChatGPT。假如按理想的情況:準備數據和摸索訓練方法用半年,GPT-2到GPT-3用半年,依此類推,大概也需要2年時間才能追上ChatGPT現有的速度。而這還是項目進展順利、沒有被公司砍掉的情況下。而2年后,國外可能已經進階到GPT-5或者GPT-6的水平了。
最后是大算力芯片,這才是對國內開發(fā)者最頭大的事情。大模型訓練規(guī)模的現實擺在那里,即便使用GPU,也要消耗巨大的成本?!艾F在看GPU訓練大模型,有點像早期的深度學習研發(fā)人員看CPU訓練AlexNet這些早期的深度學習模型,訓練成本很高,速度又慢,這是大模型訓練未來需要努力改進的方向”,陳巍表示。
綜合來看當前的三方面短板,數據和模型方面,可以通過大量資金投入和研發(fā)人員的努力來補上;但大算力芯片方面,則需要半導體和相關產業(yè)鏈的整體提升,這點并不容易且是一個長期的過程,可能會成為國內趕超的重中之重。
寫在最后
一個朋友感慨:“我對AI的印象還停留在人工智障階段,怎么突然就成了再進宮的甄嬛——不可同日而語了?”
ChatGPT的橫空出世,讓AI再度引發(fā)轟動。隨著國內AI大模型的發(fā)展,使用成本的降低,AI將通過各種NLP或AIGC應用進入每個人的生活,甚至成為普通人的伙伴、助手或老師。ChatGPT這類大模型技術,還可以與機器人或傳統(tǒng)的制藥、材料、航空、汽車等領域結合,促進行業(yè)技術的快速發(fā)展。
因此,ChatGPT絕不僅僅是一個聊天機器人,也不會止步于顛覆現有的搜索引擎,它可能只是通用人工智能的一道開胃菜。