撰文?| 文燁豪,編輯?| 王? ?潘
浩浩蕩蕩的AIGC潮流,疊加資本資金如火如荼地注入,過去一年里,AI賽道煥發(fā)了新生,再度登上了科技語境的浪潮之巔。
然而,與大模型戰(zhàn)場的熱鬧相比,在商業(yè)化落地場景,AIGC的步伐卻略顯躊躇——技術(shù)層面,從文字到圖像創(chuàng)作再到視頻創(chuàng)作,AI屢屢交出了刷新大眾視野的答卷,但如何使AI滿足實際的商業(yè)期望,卻仍是擺在行業(yè)面前的,一道復(fù)雜而嚴(yán)峻的課題。
而這,或許正是今年AI戰(zhàn)場博弈勝負(fù)的關(guān)鍵環(huán)節(jié)——唯有從實驗室邁向市場,實現(xiàn)商業(yè)化落地,才能成為AI領(lǐng)域的“中堅力量”。
1月30日,科大訊飛舉行星火認(rèn)知大模型V3.5升級發(fā)布會——全國產(chǎn)化算力平臺“飛星一號”、訊飛星火V3.5、語音大模型、星火開源-13B等產(chǎn)品接連亮相的同時,科大訊飛亦端出了諸多大模型商業(yè)化成果。
顯然,大模型于今年的商業(yè)化第一槍,已然鳴響,而隨著玩家們接連端出這場盛宴的“主菜”,大模型應(yīng)用元年亦將到來。
行業(yè)桎梏,何以打破
回顧2023年的AI浪潮,各路玩家在大模型領(lǐng)域打得火熱,但AI商業(yè)化進展卻略顯遲緩——縱使各類AI應(yīng)用不斷刷新著大眾視野,但置之于成熟的商業(yè)領(lǐng)域,AI技術(shù)的商業(yè)化成效,并沒能達到預(yù)期。
背后的邏輯在于,尚未成熟的AI技術(shù),使得應(yīng)用開發(fā)陷入極高程度的不可控性,而算力的稀缺則在一定程度上“添油加醋”,阻礙著大模型技術(shù)迭代發(fā)展。
以困擾業(yè)界已久的“幻覺”問題為例,若普通用戶看到AI輸出“瘋言瘋語”,或許會一笑了之,但在嚴(yán)肅的商業(yè)場域,AI的謬誤則會被無限放大,甚至對客戶企業(yè)造成“傷害”。而除卻應(yīng)答準(zhǔn)確率,響應(yīng)時間、成本等維度,亦時刻影響著AI商業(yè)化路途。
言簡意賅,當(dāng)下的AI仿佛在技術(shù)瓶頸下帶著鐐銬跳舞。
好在,歷史的經(jīng)驗不斷告訴我們,革命性的創(chuàng)新很難一蹴而就,就像DOS向Windows演變時,曾面臨著科技語境“為何需要圖形化界面”的質(zhì)疑;縱使是iPhone,其初代產(chǎn)品以當(dāng)時諾基亞擁護者們的眼光來看,也不過是一款不耐摔、不耐用的產(chǎn)品。
然而,這并不妨礙Windows見證了微軟的傳奇,亦不妨礙其后來的iPhone,點亮移動互聯(lián)網(wǎng)的光輝時刻。
而如今,大模型的崛起正將萬物互聯(lián)的人機交互推向一個前所未有的高度,這一輪替過程是確定性的。
因此,面對遠期的確定性機遇,如何解決當(dāng)下的AI商業(yè)化應(yīng)用難題,打破行業(yè)桎梏,自然成為了AI產(chǎn)業(yè)的當(dāng)務(wù)之急。
破局的核心一環(huán)在于算力。一方面,大模型技術(shù)能力提升的困境主要根植于算力規(guī)模遞減效應(yīng)——隨著模型規(guī)模逐漸擴大,獲得相同幅度的提升所需的額外算力成本將逐漸升高,甚至變得難以負(fù)擔(dān)。
另一方面,受地緣政治因素影響,半導(dǎo)體巨頭英偉達的AI芯片出口遭到管制,美商務(wù)部長近期更是直言“將阻止中國獲得算力”。外部壓力之下,AI巨頭們或多或少面臨著算力稀缺的難題。
換言之,國產(chǎn)化算力底座,已然成為了國內(nèi)大模型玩家補充算力、實現(xiàn)算力可控,從而打破宿命循環(huán)的關(guān)鍵道路。
而作為老牌AI玩家,國內(nèi)AI賽道所面臨的挑戰(zhàn),正被科大訊飛看在眼里。
在同華為強強聯(lián)手,打造出可以私有化部署的“星火一體機”后,科大訊飛再度攜手華為,在大模型算力底座層面深度共建,合力打造了“飛星一號”大模型算力平臺。兩大“正規(guī)軍”的攜手,為國內(nèi)AI產(chǎn)業(yè)突破技術(shù)封鎖注入了一劑強心劑,在此過程中,華為卓越的硬件基底,與科大訊飛深厚的AI底蘊實現(xiàn)了優(yōu)勢互補。
行業(yè)桎梏之下,這既是保障大模型能力進一步迭代與應(yīng)用開發(fā)可控性提升的一張底牌,也標(biāo)志著一場自主創(chuàng)新的算力革命正式拉開帷幕。而國內(nèi)AI產(chǎn)業(yè)生態(tài)發(fā)展,從此有了另一種選擇。
科大訊飛的三路齊發(fā)
如果說,攻克算力底座難題,是科大訊飛乃至國內(nèi)大模型廠商步入賽道“中場”的關(guān)鍵一環(huán),那么如何在AIGC中場戰(zhàn)事中搶得更好的身位,則是一個因人而異,更加復(fù)雜的命題。
現(xiàn)階段,AI巨頭們的競爭正在上升到一個更高的維度,玩家們爭奪的焦點正從過往的大模型推出與否、大模型參數(shù),逐漸過渡到大模型真實可用性、開發(fā)者生態(tài)、商業(yè)化軌道等層面。
在此背景下,諸如科大訊飛這樣的AI廠商,正站在商業(yè)化的三岔路口:通用能力輸出的直接競爭、開源搶占生態(tài)與應(yīng)用開發(fā),而每一條路徑都伴隨著巨大的挑戰(zhàn)與想象空間??拼笥嶏w的選擇是三條路同時發(fā)力。
大模型通用能力層面,科大訊飛一直走在行業(yè)前列。
去年11月,在新華社研究院中國企業(yè)發(fā)展研究中心《人工智能大模型體驗報告3.0》評測里,訊飛星火認(rèn)知大模型蟬聯(lián)冠軍的同時,還獲得基礎(chǔ)能力指數(shù)、智商指數(shù)、工具提效指數(shù)三項評測指標(biāo)第一。
目前,科大訊飛則在“飛星一號”算力底座的的基礎(chǔ)上,訓(xùn)練出了訊飛星火V3.5。
據(jù)悉,相較于訊飛星火V3.0,其在邏輯推理、語言理解、文本生成、數(shù)學(xué)答題、代碼、多模態(tài)等核心能力均有著顯著提升。其中,語言理解、數(shù)學(xué)能力更是已然超過GPT-4 Turbo,而代碼能力達到GPT-4 Turbo的96%,多模態(tài)理解能力則達到GPT-4V的91%。
這意味著,國產(chǎn)大模型正在逐漸走出了“不斷追趕GPT-4”的敘事線,在越來越多的技術(shù)領(lǐng)域?qū)崿F(xiàn)了對于行業(yè)標(biāo)桿的超越。
只是,若想全盤超越GPT-4,除了直面現(xiàn)有不足與缺陷以外,亦需更加開放的姿態(tài),共同推動國內(nèi)AI產(chǎn)業(yè)的技術(shù)繁榮。為此,科大訊飛端出了“星火開源-13B”計劃,深度適配國產(chǎn)算力,助力開發(fā)者、高校、企業(yè)自主研發(fā),從而打通共建第一開發(fā)者生態(tài)的通路。
另一方面,科大訊飛對于大模型商業(yè)化的理解,絕非停留于行業(yè)表面,而是將其真正融入了自身的肌理。
縱觀科大訊飛的發(fā)展歷程,“語音”始終是其繞不開的烙印,多年以來,科大訊飛在語音識別、語音合成等多個領(lǐng)域,始終保持源頭核心技術(shù)創(chuàng)新迭代,并多項斬獲相關(guān)國際權(quán)威賽事和評測冠軍。
基于此,隨著科技脈絡(luò)步入大模型時代,在智能語音領(lǐng)域扎根甚深的科大訊飛,順勢推出了國內(nèi)首個語音大模型——星火語音大模型。
據(jù)悉,星火語音大模型已在數(shù)十個主流語種的語音識別效果層面,超過OpenAI Whisper V3,而多語種語音合成方面,星火語音大模型擬人度則已超83%。
從行業(yè)維度來看,科大訊飛之所以推出語音大模型,源于對萬物互聯(lián)時代涌現(xiàn)出的新需求的洞察。
萬物互聯(lián)時代,語音無疑是人機溝通的入口。這意味著,語音大模型將無縫適配智能網(wǎng)聯(lián)汽車、智能家居、陪伴機器人等熱門、前沿賽道,實現(xiàn)對現(xiàn)階段產(chǎn)品、業(yè)務(wù)的重塑,發(fā)揮“1+1>2”的效用,從而將人機交互推至新的高度。
而作為老牌智能語音廠商,科大訊飛在此領(lǐng)域沉淀已久,技術(shù)領(lǐng)先的同時,亦能將應(yīng)用成本降至“自來水”的價格,從而更好地?fù)肀А癆I+萬物互聯(lián)”時代所帶來的全新機遇。
因此,科大訊飛推出星火語音大模型,絕非“硬蹭”自身的核心賽道,而是一位實干派玩家深思熟慮的答案。
大模型,開始落地下潛
無論是打破桎梏,還是技術(shù)、產(chǎn)品層面的迭代出新,最終都繞不開商業(yè)化層面的真實考核。若技術(shù)升級無法換來“真金白銀”,那么所謂的AIGC浪潮,很可能演變?yōu)橐粓觥爸貜?fù)制造輪子”的科技自嗨,導(dǎo)致人力、時間成本的白白投入。
而縱觀千行百業(yè),并非行業(yè)端缺乏應(yīng)用AI的訴求,而是大模型玩家所提供的能力,同行業(yè)真實所需存在著一定的割裂之處。
以教育場景為例,若是打造一款面向小學(xué)生英語學(xué)習(xí)的大模型,那相比大模型參數(shù)、大模型技術(shù)評分等常規(guī)評價維度,詞匯量范圍、語句類型是否超綱,能否嫁接小學(xué)英語學(xué)習(xí)目標(biāo),或許才是決定其實際應(yīng)用效果的關(guān)鍵——縱使模型精度極高、響應(yīng)極快,但若其一味向小學(xué)生盲目輸出晦澀的長難句,那顯然也不具備可用性。
而究其本質(zhì),大模型商業(yè)化應(yīng)用過程,其實是一個考察玩家們對行業(yè)需求認(rèn)知、理解的過程。基于此,諸多大模型玩家,總習(xí)慣于埋頭于自身的“一畝三分地”,從而沉淪于“舒適圈”。
全然適應(yīng)所處環(huán)境的商業(yè)主體,在遷移至新商業(yè)生態(tài)的過程中,往往會面臨繁復(fù)的挑戰(zhàn)。當(dāng)下,AI正逐漸成為各行各業(yè)須臾不離的存在,而玩家們?nèi)羰菍⒙纷哒?,勢必會限制自身發(fā)展空間。
而科大訊飛,顯然參透了這層邏輯——大模型商業(yè)化,既要有打靶子的能力,亦要有畫靶子的能力。而科大訊飛過往的企服沉淀,使其能更加精準(zhǔn)的洞悉行業(yè)需求,做出行業(yè)真正適用的大模型。
縱向來看,借由業(yè)界領(lǐng)先的大模型能力,科大訊飛在教育硬件、語音賽道的護城河正不斷加深。
數(shù)據(jù)顯示,科大訊飛AI學(xué)習(xí)機用戶凈推薦值(NPS)持續(xù)保持行業(yè)第一,并獲得了2023年天貓&京東雙十一銷售額冠軍;而在星火語音大模型的加持下,訊飛翻譯機亦迎來了交互能力升級,將用戶體驗抬至更高維度。
同時,科大訊飛亦同中國移動達成合作,推出5G新通話商務(wù)速記——移動5G用戶無需下載任何App,便可在所有手機上,實現(xiàn)通話內(nèi)容同步紀(jì)要,關(guān)鍵事項精準(zhǔn)提煉等功能,為大模型賽道的付費邏輯挖掘,提供了另一種視角。
而橫向來看,科大訊飛過往在智慧教育、智慧醫(yī)療、智慧城市等多個領(lǐng)域積累甚深。這使其在大模型商業(yè)化路途中,更好地深入行業(yè)本質(zhì),從而端出真正適配不同行業(yè)面貌的大模型。
據(jù)悉,基于對各垂直行業(yè)的理解,科大訊飛已同包括太平洋保險、交通銀行、國家能源集團、奇瑞汽車等在內(nèi)的各行業(yè)頭部企業(yè)建立了深度合作。而這些同頭部企業(yè)的合作本身,則有如一個個釘在相關(guān)產(chǎn)業(yè)鏈中的錨點,推動其在千行百業(yè)跑出商業(yè)化的正向循環(huán)。
歸根結(jié)底,AI要想照亮未來,首要任務(wù)是點亮當(dāng)下。縱觀AI賽道數(shù)十年的漫長發(fā)展歷程,當(dāng)下的AIGC熱潮無非“驚鴻一瞥”,這場技術(shù)與商業(yè)化的馬拉松,實際上才剛剛開始。但可以肯定的是,具備自我造血與長線作戰(zhàn)能力的科大訊飛,已然拿到了殺出重圍的船票。