全球很多人都開(kāi)始相信,以ChatGPT為代表的大模型,將帶來(lái)一場(chǎng)NLP領(lǐng)域乃至整個(gè)人工智能的技術(shù)革命,影響遍及各行各業(yè)。
那么,金融機(jī)構(gòu)和科技企業(yè),應(yīng)該以怎樣的姿態(tài)邁入新的洪流?
前不久,有“中國(guó)智能科學(xué)技術(shù)最高獎(jiǎng)”之稱(chēng)的吳文俊人工智能科學(xué)技術(shù)獎(jiǎng),正式公布了2022年度獲獎(jiǎng)名單。
其中,度小滿(mǎn)建設(shè)的“智能化征信解讀中臺(tái)”工程,率先將大型語(yǔ)言模型LLM、圖算法應(yīng)用在征信報(bào)告的解讀上,榮獲了吳文俊人工智能科技進(jìn)步獎(jiǎng),成為唯一入選的金融科技公司。
大模型應(yīng)用價(jià)值到底在哪里,如何落地?是一道新技術(shù)從實(shí)驗(yàn)室走向產(chǎn)業(yè)的必答題。
度小滿(mǎn)的“智能化征信解讀中臺(tái)”工程,就帶來(lái)了技術(shù)+應(yīng)用的雙重答案。
征信報(bào)告是識(shí)別個(gè)人信用的最重要風(fēng)控手段,報(bào)告中包含大量非結(jié)構(gòu)化的征信數(shù)據(jù),比如大量的文本信息,這些征信數(shù)據(jù)的復(fù)雜性和多樣性,很難使用傳統(tǒng)的數(shù)據(jù)處理方式進(jìn)行分析。而度小滿(mǎn)“智能化征信解讀中臺(tái)” ,能夠?qū)?bào)告解讀出40萬(wàn)維的風(fēng)險(xiǎn)變量,將銀行風(fēng)控模型的風(fēng)險(xiǎn)區(qū)分度提升了26%,切實(shí)在銀行信貸場(chǎng)景中發(fā)揮作用。
這背后的技術(shù)是度小滿(mǎn)率先將大型語(yǔ)言模型LLM、圖算法等新技術(shù)應(yīng)用在征信報(bào)告的解讀上,“智能化征信解讀中臺(tái)”包含了“3個(gè)平臺(tái)-1個(gè)特征生成框架-3個(gè)模型”,讓征信報(bào)告解讀進(jìn)入到圖機(jī)器自動(dòng)學(xué)習(xí)階段。
大模型重新定義金融科技
NLP長(zhǎng)期以來(lái)是一個(gè)AI領(lǐng)域基礎(chǔ)而“冷門(mén)”的學(xué)科,全世界的NLP公司都比較少,度小滿(mǎn)為什么還要堅(jiān)持研究NLP領(lǐng)域?大模型時(shí)代, NLP能給金融領(lǐng)域帶來(lái)哪些變化?
先說(shuō)大模型。
金融文檔、信息處理等NLP任務(wù)貫穿整個(gè)金融領(lǐng)域,讀文檔、查文檔、寫(xiě)文檔,是金融機(jī)構(gòu)各個(gè)業(yè)務(wù)場(chǎng)景中的基礎(chǔ)工作。以往,這些領(lǐng)域的智能化,使用傳統(tǒng)NLP范式去開(kāi)發(fā)相關(guān)模型,數(shù)據(jù)標(biāo)注成本高,開(kāi)發(fā)交付周期長(zhǎng),維護(hù)困難。
LLM用預(yù)訓(xùn)練+精調(diào)+提示的新方法,能夠用一個(gè)模型處理多個(gè)任務(wù),甚至未曾見(jiàn)過(guò)的通用任務(wù),這就使模型出現(xiàn)了一種智能“涌現(xiàn)”現(xiàn)象,看起來(lái)更有智慧、理解能力更強(qiáng)了,所以能對(duì)金融業(yè)務(wù)場(chǎng)景中的數(shù)據(jù)信息和隱藏知識(shí)進(jìn)行更高效的挖掘和理解。
有了超大規(guī)模的預(yù)訓(xùn)練語(yǔ)言模型LLM作為基礎(chǔ)設(shè)施,可對(duì)金融機(jī)構(gòu)的全棧場(chǎng)景進(jìn)行重塑,融入NLP能力。其中較為典型的場(chǎng)景包括:
信貸輔助決策,基于強(qiáng)大的語(yǔ)義理解能力,讀懂非結(jié)構(gòu)化數(shù)據(jù),包括財(cái)務(wù)報(bào)告自動(dòng)化解析、數(shù)據(jù)智能挖掘、信貸流水材料智能處理、宏觀行業(yè)分析、風(fēng)險(xiǎn)事件傳導(dǎo)分析等。
業(yè)務(wù)審核及研報(bào)解析,包括招股書(shū)智能審核,財(cái)務(wù)數(shù)據(jù)分析,審計(jì)報(bào)告自動(dòng)化比對(duì),非結(jié)構(gòu)化數(shù)據(jù)分析。
這些場(chǎng)景都可以通過(guò)LLM加快自動(dòng)化,降低NLP應(yīng)用成本,提升效率,為金融機(jī)構(gòu)的智能化加速。
再說(shuō)自然語(yǔ)言交互。這一輪范式轉(zhuǎn)換的核心特點(diǎn)就是交互(chat),AI獲得了世界知識(shí)和強(qiáng)大的長(zhǎng)文本生成能力,從而提供更自然的人機(jī)交互體驗(yàn),這會(huì)給金融領(lǐng)域與人打交道的服務(wù)都帶來(lái)變革。其具有代表性的場(chǎng)景有:
智能客服:快速、高效、低成本地響應(yīng)用戶(hù)需求,滿(mǎn)足個(gè)性化需求,提升服務(wù)半徑和服務(wù)質(zhì)量。
智能營(yíng)銷(xiāo):洞察理解用戶(hù)需求和情緒,讓產(chǎn)品和用戶(hù)更精準(zhǔn)地匹配;一鍵生成海報(bào)、視頻等創(chuàng)意內(nèi)容,提升營(yíng)銷(xiāo)效率。
度小滿(mǎn)CEO朱光認(rèn)為,大模型技術(shù)正在重新定義金融科技(Fintech),ChatGPT的出現(xiàn),意味著所有圍繞移動(dòng)互聯(lián)網(wǎng)、AI 1.0的競(jìng)爭(zhēng)和競(jìng)爭(zhēng)優(yōu)勢(shì)正在告一段落。
站在大模型時(shí)代的前沿,度小滿(mǎn)的五年步履
近期,百度基于文心大模型技術(shù)推出的生成式對(duì)話產(chǎn)品“文心一言”(英文名:ERNIE Bot)開(kāi)放生態(tài)合作,度小滿(mǎn)成為首家接入的金融科技公司。
基于文心一言的大模型技術(shù)基座,結(jié)合度小滿(mǎn)業(yè)務(wù)場(chǎng)景積累的金融行業(yè)知識(shí)和數(shù)據(jù)進(jìn)行交互式訓(xùn)練,有望打造出適配中國(guó)金融行業(yè)的,全新的智能客服、智能風(fēng)控、智能交互服務(wù)。
這一次,度小滿(mǎn)站到了大模型時(shí)代的前沿,并不是偶然和運(yùn)氣,金融領(lǐng)域NLP應(yīng)用,這條路度小滿(mǎn)已經(jīng)走了五年。
從2018年創(chuàng)立之初,度小滿(mǎn)就引入了大量NLP人才,成立AI部門(mén),在NLP技術(shù)上發(fā)力。
2021年,在微軟舉辦的MS MARCO 比賽中的文檔排序Document Ranking(文檔排序)任務(wù)中,度小滿(mǎn)的AI-NLP團(tuán)隊(duì)排名第一并刷新紀(jì)錄。此外,團(tuán)隊(duì)研發(fā)的軒轅 (XuanYuan) 預(yù)訓(xùn)練模型也在CLUE分類(lèi)任務(wù)中排名第一。
自然語(yǔ)言處理NLP是AI皇冠上的明珠,往遠(yuǎn)了說(shuō),語(yǔ)言是進(jìn)入人類(lèi)認(rèn)知智能的一扇大門(mén),是抵達(dá)通用人工智能的一座橋梁。往近了說(shuō),人人皆可chat(聊天),語(yǔ)言本身就具備服務(wù)每一個(gè)人,連接每一個(gè)人的低門(mén)檻和大能量,和關(guān)乎每一個(gè)人的金融服務(wù)碰撞在一起,所醞釀的商業(yè)機(jī)會(huì)也是巨大的。