加入星計劃,您可以享受以下權益:

  • 創(chuàng)作內容快速變現
  • 行業(yè)影響力擴散
  • 作品版權保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • AI技術基因
    • 為什么是夸克
    • 大模型將如何“升級”夸克
  • 推薦器件
  • 相關推薦
  • 電子產業(yè)圖譜
申請入駐 產業(yè)圖譜

自研大模型,夸克豹變

2023/11/17
2201
閱讀需 11 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者|李禾子,郵箱|lihezi@pingwest.com

11月14日,阿里巴巴智能信息事業(yè)群宣布正式推出夸克大模型。據介紹,夸克大模型是基于Transformer架構、全部技術均為自研,同時參數規(guī)模達千億級的多模態(tài)大模型;其應用場景除了基礎的通用搜索,還將包括醫(yī)療健康、教育學習和職場辦公等更垂直的領域。

從其應用方向來看,夸克大模型的推出很符合當前大模型“重落地”的發(fā)展趨勢。

推出之前,夸克大模型已經組建了數百人的研發(fā)團隊,在上述垂直領域進行了預訓練和精調。官方發(fā)布的數據至少顯示,夸克大模型并非是一個“趕時髦”的產物,而是有著想做到行業(yè)頂尖的野心——

11月16日,在C-Eval和CMMLU兩大權威評測榜單的最新評測結果中,夸克大模型分別以89和以77.08的均分登頂;國內專業(yè)考試測試方面,它在中考、高考和研究生考試中均超過了GPT-4,包括在臨床執(zhí)業(yè)醫(yī)師資格考試、計算機等級考試、公務員考試、教師資格證考試等評測中,也均優(yōu)于GPT-4(其中臨床執(zhí)業(yè)醫(yī)師資格考試成績?yōu)?86分,遠高于360分的及格線)。

如果進一步結合阿里巴巴在AI生態(tài)的布局,就會發(fā)現夸克大模型的誕生有著很強的戰(zhàn)略屬性,阿里巴巴智能信息事業(yè)群連同大模型在其中的地位一起,都被提到了相當的高度。

AI技術基因

需要指出的是,智能信息事業(yè)群屬于阿里巴巴“1+6+N”中的N公司,同閑魚、釘釘等公司于集團內的序列類似。

阿里巴巴智能信息事業(yè)群更注重產品創(chuàng)新和技術研發(fā),這也是內外部對其的認知之一。

該事業(yè)群成立于2021年4月,定位于信息服務方向的智能化創(chuàng)新,旗下包括了夸克App、UC瀏覽器和書旗小說等產品。

同年10月,智能信息事業(yè)群升級組織架構,圍繞夸克App成立了夸克事業(yè)部。該動作被外界解讀為是在加碼信息服務賽道,夸克則有望承擔起創(chuàng)新突破的使命。包括此次推出的夸克大模型,研發(fā)路線也是為了服務夸克的業(yè)務戰(zhàn)略。

隨著AI時代的到來,信息服務領域的用戶價值和商業(yè)價值仍處在高速增長的初期,夸克開始被置于更高的發(fā)展優(yōu)先級。

今年9月,阿里集團宣布了用戶為先、AI驅動的兩大戰(zhàn)略重心,將加大對“技術驅動的互聯網平臺業(yè)務”、“AI驅動的科技業(yè)務”等業(yè)務的戰(zhàn)略性投入。

吳泳銘指明的阿里巴巴未來的戰(zhàn)略投入方向,夸克顯然是AI生態(tài)中的一份子,夸克大模型的推出已經是一個證明。

為什么是夸克

夸克當前的定位將關系到夸克大模型將如何應用。

把時間拉回至幾年前,當時出現在人們眼中的夸克還是一款極度簡潔的小眾產品,專注于優(yōu)化用戶的搜索體驗。也因為體驗做得好,在極客和App玩家里圈了一大波粉絲,月活也達到了百萬級。

后來夸克所有的探索,也都是在此基礎上展開的,各種變化也一直圍繞著夸克的成長。

對于當時已經擁有一定體量的夸克來說,一條分岔路其實已經擺在了面前——作為一款信息服務產品,它必然要考慮后續(xù)的發(fā)展方向,單一的功能定位能贏得當下,卻不一定爭取到更大的市場??淇诵枰诳酥频那疤嵯伦黾臃?,然而對于這樣一款對用戶體驗有著執(zhí)念的搜索為主的應用而言,做加法不是個容易的過程。

期間夸克進行過一些嘗試,譬如垂直領域的專業(yè)搜索,以及不同形態(tài)的優(yōu)質內容生態(tài)建設。

但就在人們以為夸克要走上內容付費時,它又結合用戶需求和市場變化迅速對自己的業(yè)務體系進行了梳理。

2021年夸克事業(yè)部成立,按照阿里巴巴智能信息事業(yè)群總裁吳嘉的說法,夸克已進入新的階段,正在從一個好用的搜索App,邁向個人學習、生活和工作的智能助手。

此前,夸克已經在搜索業(yè)務的基礎上延展出了一些信息服務,譬如輔助考生進行志愿篩選的高考信息服務,包括健康百科和健康精選問答在內的健康信息搜索,以及內容涵蓋簡歷、PPT、論文、合同、表格和期刊等在內的文檔等。此外,工具屬性更強的夸克網盤也在2019年就已上線。

這些服務在“智能信息”的概念出現之前,還是較為分散的,而當明確要做用戶“個人學習、生活和工作的智能助手”之后,夸克的定位也逐漸清晰起來。

依然是在不犧牲用戶體驗的原則上,夸克后續(xù)又對這些服務進行了更深入的優(yōu)化,并在2022年推出另一款工具產品夸克掃描王,補足了掃描場景下的用戶體驗。也是在2022年,夸克App的Slogan正式由“新生代智能搜索”升級為“你的高效拍檔”,自此完成了從一個“小而美”的App走向新一代智能信息產品的生態(tài)化發(fā)展的蛻變。

由于服務場景更貼合學生以及年輕的上班族,夸克也在更新自己的同時,積累起了一批畫像更加年輕的用戶——據QuestMobile發(fā)布的《2023年輕人群智能效率應用研究》報告,夸克App在泛學生人群和新生代職場人群的用戶占比最高,年輕用戶使用時長位列行業(yè)第一;此外,在夸克服務的數千萬級用戶中,25歲以下用戶占比超過一半。

這些統(tǒng)統(tǒng)構成了夸克區(qū)別于其他同類應用的差異化用戶心智。

很顯然,對于夸克這樣致力于幫助用戶提高效率、有更強實用性質的應用來說,大模型的引入在現階段是適配的,也符合大模型的進化規(guī)律??淇说陌l(fā)展已經從單一服務變成產品矩陣形態(tài),這也給大模型提供了足夠多的落腳點。

大模型將如何“升級”夸克

當我們提大模型對某個應用的改造,一定是建立在這個應用原有的業(yè)務基礎之上。

夸克首先作為一個搜索工具,在過去幾年已經積累起了海量的中文數據,并號稱有“最全面的中文數據庫”。訓練大模型最核心的三要素之一就是數據,夸克過去的積累首先給了大模型能更好理解、評估和提煉中文知識體系的前提。

而在更細分的領域,夸克的知識內容體系也相對更完整。

比如高考服務,到今年夸克已經連續(xù)五年提供高考信息服務,各省市的高考數據非常齊全,同時也涵蓋了豐富的圖文、視頻和直播等針對不同省份、分數段學生的填報技巧內容;健康服務方面,夸克也聯合數百位院士、醫(yī)療專家和專業(yè)協(xié)會建立起了夸克健康百科,并且和數十家行業(yè)頭部醫(yī)療機構合作建立起了健康精選問答體系;至于文檔服務,其內容也包括了實用范文、求職簡歷、合同模板、PPT模板、教育教學、表格模板和研究報告等八大類,精選文檔也已上線了超千萬份……

更重要的是,這些數據和內容背后,包含的是非常豐富的用戶場景,對于大模型理解和認知不同用戶對工作、學習和生活上的真實需求,亦是加分項。

某種程度上,大模型的加持和夸克一直以來的技術傳統(tǒng)是一脈相承的。

AI此前就在夸克的各項服務中多有應用,就高考和健康服務來說,已經在錄取預測、模擬填報以及針對病例、藥品的篩查等等使用場景下借助過AI幫助;夸克網盤也在今年先后上線了AI自然語言搜索以及播放器AI字幕生成功能;夸克掃描王在識別的準確性上,也一直離不開AI的貢獻。

夸克可以說對浪潮的到來早有準備,而大模型一旦加碼融入,對夸克各項功能服務的影響可以預見地也將十分顯著。

想象這樣一種場景,在掃描工具的使用中,用戶的痛點通常在于相機識別出的內容不夠準確,盡管此前借助AI已經能在諸如版式、公式和手寫內容等的識別上提升準確度,但此類AI往往在語義和前后文的理解上較為機械。而大模型最強的能力恰恰就在于認知,因此當大模型被用于掃描場景,識別準確性又可以提升一個量級。

類似的大模型應用場景,幾乎可以匹配到夸克當前的每一項服務,從而帶來更多體驗上的變革。

而在大模型現階段普遍存在的幻覺問題方面,夸克也提出了自己的應對,建立了從內容、搜索再到推理的一套可辨別知識真?zhèn)蔚募夹g體系,尤其是在通用知識、圖文知識、專業(yè)知識、推理知識和寫作增強等方面,有望讓大模型提供的內容更具有準確性和專業(yè)性。

在給用戶帶來改變前,夸克先積極擁抱了變化,改變了自己。

吳泳銘幾天前在世界互聯網大會上的預判是,“在可見的未來,會有更智能的下一代產品進入人們的生活,AI助理會無處不在,成為每個人工作、生活、學習中的助手”??淇艘呀浀搅诉~向下一代搜索的臨界點,大模型也將成為推動夸克持續(xù)進行產品體驗創(chuàng)新的技術底座。

推薦器件

更多器件
器件型號 數量 器件廠商 器件描述 數據手冊 ECAD模型 風險等級 參考價格 更多信息
PIC32MX795F512LT-80I/PT 1 Microchip Technology Inc 32-BIT, FLASH, 80 MHz, RISC MICROCONTROLLER, PQFP100, 12 X 12 MM, 1 MM HEIGHT, LEAD FREE, PLASTIC, TQFP-100

ECAD模型

下載ECAD模型
$11.46 查看
DS3231SN# 1 Maxim Integrated Products Real Time Clock, Non-Volatile, 1 Timer(s), CMOS, PDSO16, 0.300 INCH, SOIC-16
$11.21 查看
ATXMEGA128D4-CU 1 Microchip Technology Inc IC MCU 8BIT 128KB FLASH 49VFBGA
$16.33 查看
阿里巴巴

阿里巴巴

阿里巴巴集團經營多項業(yè)務,另外也從關聯公司的業(yè)務和服務中取得經營商業(yè)生態(tài)系統(tǒng)上的支援。業(yè)務和關聯公司的業(yè)務包括:淘寶網、天貓、聚劃算、全球速賣通、阿里巴巴國際交易市場、1688、阿里媽媽、阿里云、螞蟻金服、菜鳥網絡等。

阿里巴巴集團經營多項業(yè)務,另外也從關聯公司的業(yè)務和服務中取得經營商業(yè)生態(tài)系統(tǒng)上的支援。業(yè)務和關聯公司的業(yè)務包括:淘寶網、天貓、聚劃算、全球速賣通、阿里巴巴國際交易市場、1688、阿里媽媽、阿里云、螞蟻金服、菜鳥網絡等。收起

查看更多

相關推薦

電子產業(yè)圖譜

關注中國未來創(chuàng)新技術產業(yè)發(fā)展,講好科技創(chuàng)新的中國故事。

微信公眾號