摘要
全球生成式人工智能(AI)市場(chǎng)仍處于起步階段。根據(jù)最新預(yù)測(cè),該市場(chǎng)將在五年內(nèi)增長(zhǎng)五倍,從2024年的146億美元增長(zhǎng)到2029年的728億美元。頂尖的應(yīng)用領(lǐng)域包括消費(fèi)類、企業(yè)服務(wù)、零售業(yè)、媒體娛樂(lè)業(yè)以及醫(yī)療保健業(yè)。
作為生成式AI的下一個(gè)前沿領(lǐng)域,多模態(tài)生成式AI技術(shù)憑借其日益增強(qiáng)的多樣化功能,正在推動(dòng)各行業(yè)的應(yīng)用案例,例如客戶服務(wù)、企業(yè)知識(shí)管理、3D數(shù)字分身以及制造業(yè)等。
目前,專注于多模態(tài)生成服務(wù)的生成式AI基礎(chǔ)模型廠商的能力主要面向通用用途,缺乏針對(duì)特定用例的定制化選項(xiàng),無(wú)法重新訓(xùn)練以滿足特定需求,尤其是在高度監(jiān)管的行業(yè)或業(yè)務(wù)關(guān)鍵的應(yīng)用場(chǎng)景中。盡管這些模型在用戶中很受歡迎,但對(duì)于希望構(gòu)建企業(yè)級(jí)多模態(tài)生成式AI應(yīng)用的企業(yè)來(lái)說(shuō),這些模型的限制性很高。
相反,企業(yè)始終需要尋求基于最適合企業(yè)數(shù)據(jù)和業(yè)務(wù)目標(biāo)的模型來(lái)開(kāi)發(fā)多模態(tài)生成式AI應(yīng)用。這些模型需要具備高度的定制化能力、準(zhǔn)確性、安全性,并符合市場(chǎng)的數(shù)據(jù)安全法規(guī)。由于并非所有開(kāi)發(fā)者和企業(yè)都精通多模態(tài)生成式AI,因此他們需要一個(gè)開(kāi)發(fā)平臺(tái),該平臺(tái)能夠提供多樣化的多模態(tài)生成式AI模型選擇,同時(shí)易于部署、優(yōu)化和維護(hù),以及滿足高標(biāo)準(zhǔn)的AI治理和安全要求。
百度智能云在多模態(tài)生成式AI上已經(jīng)在支持廣泛的開(kāi)發(fā)者和企業(yè),從生成式AI模型廠商,如生數(shù)科技,到系統(tǒng)集成商如軟通動(dòng)力和大型企業(yè)如蔚來(lái)汽車,協(xié)助他們推動(dòng)多模態(tài)生成式AI的應(yīng)用。與此同時(shí),百度智能云其強(qiáng)大的開(kāi)發(fā)者社區(qū)與用戶積極互動(dòng),也有助于其持續(xù)優(yōu)化其產(chǎn)品與服務(wù)。
Omdia 觀點(diǎn)
生成式AI已在各行各業(yè)得到廣泛應(yīng)用。在開(kāi)源和專有大型語(yǔ)言模型(LLM)的推動(dòng)下,生成式AI已應(yīng)用于所有行業(yè)的120個(gè)應(yīng)用場(chǎng)景中。雖然基于LLM的應(yīng)用程序越來(lái)越受歡迎,但其本身仍存在固有的局限性。LLM主要針對(duì)文本和語(yǔ)音數(shù)據(jù)的理解、處理和生成進(jìn)行了優(yōu)化,無(wú)法進(jìn)行多模態(tài)學(xué)習(xí),也無(wú)法生成除文本和語(yǔ)音之外的其他輸出。
為了解決上述問(wèn)題,越來(lái)越多的廠商和開(kāi)發(fā)者開(kāi)始采用多模態(tài)生成式AI技術(shù)。該技術(shù)能夠處理多種輸入形式,包括文本、圖像和音頻,并將這些提示轉(zhuǎn)換為幾乎任意類型的輸出。這將進(jìn)一步提升用戶體驗(yàn),因?yàn)槟P涂梢詫?shí)現(xiàn)多模態(tài)的理解和生成。
一方面,憑借其理解能力,用戶可以通過(guò)文本、語(yǔ)音、圖像和視頻與應(yīng)用程序自然交互。通過(guò)多模態(tài)數(shù)據(jù)理解上下文,多模態(tài)生成式AI應(yīng)用能夠以更全面的方式作出響應(yīng),幫助企業(yè)從其他數(shù)據(jù)類型中獲取情景感知的見(jiàn)解。
另一方面,多模態(tài)生成式AI技術(shù)的多模態(tài)生成能力允許用戶生成從文本到語(yǔ)音、圖像、視頻、音頻、音樂(lè)、點(diǎn)云數(shù)據(jù)、遙測(cè)數(shù)據(jù)、3D模型和數(shù)字孿生等各種類型的輸出。通過(guò)充分的預(yù)訓(xùn)練和微調(diào),這些模型可以生成高保真且物理準(zhǔn)確的輸出,非常適合企業(yè)應(yīng)用場(chǎng)景。
希望部署多模態(tài)生成式AI應(yīng)用的企業(yè)可以與兩類廠商合作。
- 第一類:專注于多模態(tài)生成服務(wù)的生成式AI基礎(chǔ)模型廠商。這類廠商以提供多模態(tài)生成服務(wù)為主,例如,OpenAI推出了Sora,這是一項(xiàng)文本到視頻的生成服務(wù),能夠生成超逼真的視頻,主要面向消費(fèi)、媒體和娛樂(lè)行業(yè)。
- 第二類:提供多模態(tài)的生成式AI模型和應(yīng)用的生成式AI開(kāi)發(fā)平臺(tái)廠商。這些廠商通常是擁有深厚生成式AI基礎(chǔ)設(shè)施、工程和服務(wù)專業(yè)知識(shí)的超大規(guī)模企業(yè)。例如,百度智能云支持文心大模型、多模態(tài)模型系列和多模態(tài)生成式AI應(yīng)用,如百度智能云曦靈(數(shù)字人),能幫助企業(yè)快速構(gòu)建多模態(tài)生成式AI應(yīng)用。
與這兩類廠商合作各有利弊:
第一類廠商提供的模型對(duì)于不熟悉該技術(shù)的開(kāi)發(fā)者和企業(yè)提供了一個(gè)甚佳的起點(diǎn)。由于多模態(tài)生成能力是通過(guò)服務(wù)方式提供的,用戶可以輕松訪問(wèn)并使用該能力。這種使用便利性也為個(gè)人開(kāi)發(fā)者降低開(kāi)發(fā)門檻。然而,這類模型的多模態(tài)生成能力主要面向通用的應(yīng)用場(chǎng)景,缺乏針對(duì)特定用例的定制化選項(xiàng),無(wú)法重新訓(xùn)練以滿足特定需求,尤其是在高度監(jiān)管的行業(yè)或業(yè)務(wù)關(guān)鍵的應(yīng)用場(chǎng)景中。盡管這些模型在用戶中很受歡迎,但對(duì)于希望構(gòu)建企業(yè)級(jí)多模態(tài)生成式AI應(yīng)用的企業(yè)來(lái)說(shuō),這些模型的限制性很高。
相反,企業(yè)始終需要尋求基于最適合企業(yè)數(shù)據(jù)和業(yè)務(wù)目標(biāo)的模型來(lái)開(kāi)發(fā)多模態(tài)生成式AI應(yīng)用。這些模型需要具備高度的定制化能力、準(zhǔn)確性、安全性,并符合市場(chǎng)的數(shù)據(jù)安全法規(guī)。由于并非所有開(kāi)發(fā)者和企業(yè)都精通多模態(tài)生成式AI,因此他們需要一個(gè)開(kāi)發(fā)平臺(tái),該平臺(tái)能夠提供多樣化的多模態(tài)生成式AI模型選擇,同時(shí)易于部署、優(yōu)化和維護(hù),以及滿足高標(biāo)準(zhǔn)的AI治理和安全要求。
為了創(chuàng)建真正符合業(yè)務(wù)目標(biāo)的多模態(tài)生成式AI應(yīng)用,提供全面多模態(tài)生成式AI解決方案的全棧廠商更適合企業(yè)。鑒于該領(lǐng)域缺乏專業(yè)知識(shí)和資源,企業(yè)難以期望僅提供基礎(chǔ)模型的廠商(第一類廠商)提供完全可定制的模型以及相關(guān)服務(wù)。全棧生成式AI解決方案廠商的核心業(yè)務(wù)并非僅銷售生成式AI模型及服務(wù),而是致力于推動(dòng)企業(yè)落地。他們不會(huì)將自己局限于單一模型,而是會(huì)幫助客戶挑選最合適的生成式AI模型。企業(yè)和開(kāi)發(fā)者可以使用其云產(chǎn)品和服務(wù)開(kāi)發(fā)、部署和優(yōu)化這些模型,從而實(shí)現(xiàn)業(yè)務(wù)目標(biāo)。
為何要將百度智能云千帆大模型平臺(tái)納入您的關(guān)注焦點(diǎn)?
隨著越來(lái)越多的企業(yè)和開(kāi)發(fā)者意識(shí)到多模態(tài)生成式AI的潛力,一款從模型開(kāi)發(fā)到智能體的端到端解決方案,同時(shí)具備無(wú)縫開(kāi)發(fā)和集成能力的多模態(tài)生成式AI開(kāi)發(fā)平臺(tái),將對(duì)技術(shù)的普及至關(guān)重要。
百度智能云已經(jīng)注意到了上述市場(chǎng)需求,并正在迅速行動(dòng)以抓住機(jī)遇。該云服務(wù)提供商已經(jīng)推出了一系列多模態(tài)生成式AI產(chǎn)品和服務(wù),即文心系列基礎(chǔ)模型以及千帆生成式AI開(kāi)發(fā)平臺(tái)。多模態(tài)生成式AI對(duì)百度智能云而言已是駕輕就熟,因?yàn)樵撛品?wù)提供商早在2023年初就推出了其大語(yǔ)言模型文心一言,并通過(guò)百度智能云千帆大模型平臺(tái)為客戶和開(kāi)發(fā)者提供了全面的應(yīng)用開(kāi)發(fā)工具、豐富的大模型、完善的模型開(kāi)發(fā)工具鏈以及易用的應(yīng)用模板,用于多模態(tài)生成式AI應(yīng)用開(kāi)發(fā),使百度智能云成為企業(yè)在構(gòu)建多模態(tài)生成式AI應(yīng)用時(shí),無(wú)論處于哪個(gè)階段,都能信賴的理想合作伙伴。
雖然百度智能云將繼續(xù)在中國(guó)引領(lǐng)多模態(tài)生成式AI應(yīng)用的部署和實(shí)施。不過(guò),其需要進(jìn)一步鞏固其行業(yè)領(lǐng)導(dǎo)地位,必須向市場(chǎng)傳達(dá)其多模態(tài)專業(yè)知識(shí),創(chuàng)造更多超越日常用例的多模態(tài)生成式AI應(yīng)用模板,并加大對(duì)多模態(tài)多智能體開(kāi)發(fā)框架和解決方案的投入。