只要你開口,它就能將你的聲音轉(zhuǎn)化成文字;只要你會(huì)說(shuō)一口“二級(jí)乙等”的普通話,它的轉(zhuǎn)寫準(zhǔn)確率就可以達(dá)到 90%以上。它有一個(gè)小目標(biāo),讓人工智能今年在全球首次通過(guò)國(guó)家執(zhí)業(yè)醫(yī)師資格考試,成為“全科醫(yī)生”;它有一個(gè)大目標(biāo),在 2029 年的“而立之年”,成為全球人工智能產(chǎn)業(yè)領(lǐng)導(dǎo)者。
這樣的技術(shù)、這樣的愿景,來(lái)自一家名為科大訊飛的公司。近日,在它十八周年成人禮之際,記者專訪了公司董事長(zhǎng)劉慶峰——他的公司明年上半年員工總數(shù)將逾萬(wàn)人,而 1999 年成立時(shí),連他在內(nèi)只有“十八羅漢”。
●說(shuō)成果:9 年兩獲“國(guó)家科技進(jìn)步獎(jiǎng)”
記者:自 1999 年發(fā)展至今,科大訊飛已成為國(guó)內(nèi)語(yǔ)音產(chǎn)業(yè)龍頭企業(yè),目前公司在語(yǔ)音產(chǎn)業(yè)領(lǐng)先地位如何體現(xiàn)?
劉慶峰:科大訊飛是我國(guó)唯一以語(yǔ)音技術(shù)為產(chǎn)業(yè)化方向的“國(guó)家 863 計(jì)劃成果產(chǎn)業(yè)化基地”、“國(guó)家規(guī)劃布局內(nèi)重點(diǎn)軟件企業(yè)”、“國(guó)家高技術(shù)產(chǎn)業(yè)化示范工程”,并被原信息產(chǎn)業(yè)部確定為中文語(yǔ)音交互技術(shù)標(biāo)準(zhǔn)工作組組長(zhǎng)單位,牽頭制定中文語(yǔ)音技術(shù)標(biāo)準(zhǔn)。“國(guó)家智能語(yǔ)音高新技術(shù)產(chǎn)業(yè)化基地”、“語(yǔ)音及語(yǔ)言信息處理國(guó)家工程實(shí)驗(yàn)室”先后落戶公司,有利于進(jìn)一步匯聚資源,提升科大訊飛產(chǎn)業(yè)龍頭地位。
2003 年、2011 年,科大訊飛兩次榮獲“國(guó)家科技進(jìn)步獎(jiǎng)”,2005 年、2011 年兩次獲得中國(guó)信息產(chǎn)業(yè)自主創(chuàng)新最高榮譽(yù)“信息產(chǎn)業(yè)重大技術(shù)發(fā)明獎(jiǎng)”。自 90 年代中期以來(lái),在歷次國(guó)內(nèi)外語(yǔ)音合成評(píng)測(cè)中,各項(xiàng)關(guān)鍵指標(biāo)均名列第一。2017 年 8 月,在國(guó)際醫(yī)學(xué)影像領(lǐng)域的權(quán)威評(píng)測(cè) LUNA 上,科大訊飛獲得平均召回率 92.3%的檢測(cè)效果,以顯著優(yōu)勢(shì)獲得該項(xiàng)評(píng)測(cè)的第一名并刷新世界紀(jì)錄。
基于擁有自主知識(shí)產(chǎn)權(quán)的世界領(lǐng)先智能語(yǔ)音和人工智能技術(shù),科大訊飛已推出從大型電信級(jí)應(yīng)用到小型嵌入式應(yīng)用、從教育到電信等行業(yè)、從手機(jī)到車載設(shè)備、從家電到玩具等,能夠滿足不同應(yīng)用環(huán)境下企業(yè)和個(gè)人用戶需求的多種產(chǎn)品??拼笥嶏w已占有中文語(yǔ)音技術(shù)市場(chǎng) 70%以上市場(chǎng)份額。
記者:科大訊飛從 1999 年幾個(gè)大學(xué)生創(chuàng)業(yè),到今天在 IBM、微軟、谷歌等巨頭環(huán)視的情況下占中國(guó)語(yǔ)音交互市場(chǎng) 70%的份額,更在全球與這些企業(yè)進(jìn)行競(jìng)爭(zhēng),在這些年的發(fā)展與競(jìng)爭(zhēng)中訊飛具體做了什么?
劉慶峰:1999 年我們剛創(chuàng)業(yè)的時(shí)候,外界很多人在問(wèn)訊飛 18 人的團(tuán)隊(duì),憑什么有機(jī)會(huì)成功?2008 年,我們成為中國(guó)語(yǔ)音領(lǐng)域第一家上市公司。2012 年,我們做成了業(yè)界公認(rèn)的中文語(yǔ)音產(chǎn)業(yè)第一,成為中國(guó)語(yǔ)音產(chǎn)業(yè)聯(lián)盟的理事長(zhǎng)。
之所以能走到今天,首先,訊飛將核心技術(shù)做到了世界領(lǐng)先,多次獲得國(guó)家級(jí)和世界級(jí)獎(jiǎng)項(xiàng)。其次,“AI+應(yīng)用”全面開花。現(xiàn)在,通過(guò)學(xué)習(xí),我們“人工智能+醫(yī)療”在有些科目上已經(jīng)接近一線醫(yī)生的水平。我們跟中國(guó)醫(yī)學(xué)科學(xué)院協(xié)和醫(yī)學(xué)院簽訂戰(zhàn)略合作,不光是共建醫(yī)學(xué)人工智能中心,我們的目標(biāo)是還要讓人工智能今年能在全球首次通過(guò)國(guó)家執(zhí)業(yè)醫(yī)師資格考試。訊飛“全科醫(yī)生”這個(gè)項(xiàng)目,不光是對(duì)中國(guó),對(duì)全世界都將是一個(gè)巨大的福音。
記者:科大訊飛的語(yǔ)音合成技術(shù)早已被公認(rèn)處于業(yè)界領(lǐng)先水平,在語(yǔ)音識(shí)別方面,科大訊飛有哪些競(jìng)爭(zhēng)優(yōu)勢(shì)?
劉慶峰:2008 年至今,科大訊飛連續(xù)在國(guó)際說(shuō)話人、語(yǔ)種識(shí)別評(píng)測(cè)大賽中名列前茅。2016 年,科大訊飛取得國(guó)際語(yǔ)音識(shí)別大賽(CHiME)全部指標(biāo)第一。該項(xiàng)技術(shù)也深刻應(yīng)用到產(chǎn)品中,比如“訊飛聽見”。“訊飛聽見”智能會(huì)議系統(tǒng)能實(shí)時(shí)將說(shuō)話者的發(fā)言一字不落地完整同步到屏幕上,實(shí)時(shí)對(duì)發(fā)言者發(fā)言進(jìn)行轉(zhuǎn)寫,同時(shí),支持完整記錄、語(yǔ)氣詞過(guò)濾、語(yǔ)句順滑、文本在線修改、會(huì)議結(jié)束即時(shí)出稿,轉(zhuǎn)寫準(zhǔn)確率可達(dá) 95%以上。
“訊飛聽見”智能會(huì)議系統(tǒng)是全球首款中文語(yǔ)音實(shí)時(shí)轉(zhuǎn)寫和多語(yǔ)種實(shí)時(shí)翻譯系統(tǒng)。該系統(tǒng)具有三大特點(diǎn):一是實(shí)時(shí),不僅可以將發(fā)言轉(zhuǎn)換成文字,且同時(shí)能將文字再同步翻譯成英日韓等四種語(yǔ)言,當(dāng)演講或會(huì)議結(jié)束時(shí)就可以直接導(dǎo)出多語(yǔ)種文本;二是準(zhǔn)確率高,對(duì)二乙水平的普通話,轉(zhuǎn)寫準(zhǔn)確率可達(dá) 90%以上;三是離線轉(zhuǎn)寫,采用本地部署服務(wù)器,確保數(shù)據(jù)安全。這些都是科大訊飛在語(yǔ)音識(shí)別方面的優(yōu)勢(shì)所在。
●談行業(yè):人工智能產(chǎn)業(yè)進(jìn)入窗口期
記者:今年以來(lái),人工智能產(chǎn)業(yè)非?;馃幔ㄓ嶏w在內(nèi)的不少業(yè)內(nèi)人士都認(rèn)為現(xiàn)在是人工智能爆發(fā)前夜。但人工智能已有幾十年的發(fā)展歷史,憑什么確認(rèn)這次的時(shí)機(jī)就一定成熟?
劉慶峰:2016 年底,科大訊飛首先在發(fā)布會(huì)上提出,我們已經(jīng)從“互聯(lián)網(wǎng)+”時(shí)代進(jìn)入到“人工智能+”時(shí)代。可以說(shuō),在科大訊飛的努力下,2016 年成了中國(guó)人工智能元年。目前,全球人工智能產(chǎn)業(yè)已經(jīng)進(jìn)入一個(gè)關(guān)鍵的窗口期。今年 7 月 20 日,國(guó)務(wù)院《新一代人工智能發(fā)展規(guī)劃》正式發(fā)布,在我們國(guó)家的這一人工智能產(chǎn)業(yè)規(guī)劃中,對(duì)相關(guān)核心技術(shù)、源頭項(xiàng)目推動(dòng)、智能產(chǎn)業(yè)發(fā)展、智能經(jīng)濟(jì)等都進(jìn)行了清晰描述??梢赃@么說(shuō),未來(lái) 3~5 年是人工智能最關(guān)鍵的格局確定窗口期。在這 3~5 年,誰(shuí)能讓人工智能應(yīng)用真正形成規(guī)模、讓應(yīng)用落地,誰(shuí)就能在未來(lái)智能產(chǎn)業(yè)中占領(lǐng)先機(jī)。
人工智能的核心技術(shù)發(fā)展有兩條主線:第一是以深度神經(jīng)網(wǎng)絡(luò)為代表的算法,在這方面科大訊飛已處于全球領(lǐng)先水平,并且在多項(xiàng)國(guó)際比賽中拿到全球第一;第二是腦科學(xué)和類腦科學(xué)研究。目前腦科學(xué)和類腦科學(xué)相關(guān)研究不斷突破,在這個(gè)領(lǐng)域,我們已經(jīng)與中國(guó)醫(yī)學(xué)科學(xué)院、協(xié)和醫(yī)學(xué)院、中國(guó)科學(xué)院神經(jīng)所等眾多研究機(jī)構(gòu)進(jìn)行了深度合作。
在上述兩個(gè)方向上,科大訊飛都在持續(xù)突破。即使沒(méi)有新的算法突破,以我們今天所掌握的技術(shù)成果,結(jié)合云計(jì)算、大數(shù)據(jù)和移動(dòng)互聯(lián)網(wǎng),我們也已經(jīng)可以改變一個(gè)又一個(gè)的行業(yè)。當(dāng)前,我們已經(jīng)可以讓機(jī)器學(xué)習(xí)行業(yè)最頂尖專家的知識(shí),未來(lái)達(dá)到行業(yè)一流專家水平,從而超越 90%的普通專業(yè)人士,這就是今天我們面臨的機(jī)遇。
記者:科大訊飛目前的主要優(yōu)勢(shì)是語(yǔ)音識(shí)別領(lǐng)域,公司未來(lái)還有沒(méi)有其他人工智能領(lǐng)域的計(jì)劃?
劉慶峰:科大訊飛在語(yǔ)音合成、語(yǔ)音識(shí)別、口語(yǔ)評(píng)測(cè)、語(yǔ)言翻譯、聲紋識(shí)別、人臉識(shí)別、自然語(yǔ)言處理等智能語(yǔ)音與人工智能核心技術(shù)上代表著國(guó)際最高水平。
2014 年,隨著人工智能時(shí)代的到來(lái),科大訊飛推出“訊飛超腦計(jì)劃”,目標(biāo)是讓機(jī)器不僅“能聽會(huì)說(shuō)”,還要“能理解會(huì)思考”,從而實(shí)現(xiàn)一個(gè)中文認(rèn)知智能計(jì)算引擎,未來(lái)將引領(lǐng)在家居、教育、客服、醫(yī)療等領(lǐng)域的智能應(yīng)用。
2015 年,科大訊飛重新定義了萬(wàn)物互聯(lián)時(shí)代的人機(jī)交互標(biāo)準(zhǔn),發(fā)布了對(duì)人工智能產(chǎn)業(yè)具有里程碑意義的人機(jī)交互界面——AIUI。
2016 年,圍繞科大訊飛人工智能開放平臺(tái)的使用人次與創(chuàng)業(yè)團(tuán)隊(duì)成倍增長(zhǎng),帶動(dòng)超百萬(wàn)人進(jìn)行雙創(chuàng)活動(dòng)。截至 2017 年 6 月,訊飛開放平臺(tái)第三方的開發(fā)團(tuán)隊(duì)達(dá)到 37.3 萬(wàn),每天的請(qǐng)求數(shù)達(dá)到 37 億次,累計(jì)終端數(shù)達(dá)到 14.7 億個(gè),以科大訊飛為中心的人工智能產(chǎn)業(yè)生態(tài)正在持續(xù)構(gòu)建??拼笥嶏w在智能語(yǔ)音、人工智能核心研究和產(chǎn)業(yè)化方面的突出成績(jī),得到社會(huì)各界和國(guó)內(nèi)外一致認(rèn)可,作為“中國(guó)人工智能國(guó)家隊(duì)”已經(jīng)形成共識(shí)。
●論前景:教育、醫(yī)療、司法等領(lǐng)域是主賽道
記者:今年人工智能概念快速熱起來(lái),你怎么看待這種現(xiàn)象?有沒(méi)有擔(dān)心這種火熱對(duì)人工智能技術(shù)的發(fā)展帶來(lái)負(fù)面影響?
劉慶峰:此前有觀點(diǎn)認(rèn)為,同聲傳譯將被人工智能取代,這其實(shí)是對(duì)新技術(shù)發(fā)展的高度神化,可能會(huì)對(duì)大眾造成錯(cuò)誤引導(dǎo),不利于產(chǎn)業(yè)生態(tài)持續(xù)健康發(fā)展?,F(xiàn)階段,人工智能技術(shù)發(fā)展不需要“被神化”,技術(shù)發(fā)展乃至產(chǎn)品化有其自身發(fā)展的曲線,從技術(shù)走向市場(chǎng),一定是在不斷完善的過(guò)程中走向成熟。
目前,機(jī)器翻譯已經(jīng)取得非常大的進(jìn)步,在衣食住行等常用生活用語(yǔ)上的中英翻譯可以達(dá)到大學(xué)六級(jí)的水平,能夠幫助人們?cè)谝恍﹫?chǎng)景中處理語(yǔ)言交流的問(wèn)題,但距離會(huì)議同傳以及高水平翻譯所講究的“信、達(dá)、雅”還存在很大的差距。
訊飛一直所努力的,是希望通過(guò)語(yǔ)音轉(zhuǎn)寫和翻譯技術(shù)幫助同傳提高工作效率、減少失誤,形成人機(jī)耦合的同傳新模式,而非替代同聲傳譯。
目前,人工智能技術(shù)的發(fā)展在感知智能和認(rèn)知智能領(lǐng)域都取得了長(zhǎng)足進(jìn)步,在語(yǔ)音交互、智能評(píng)測(cè)、口語(yǔ)翻譯等方面更是有突破性建樹。
記者:科大訊飛目前已經(jīng)把相關(guān)技術(shù)應(yīng)用到教育、醫(yī)療、司法等等領(lǐng)域,選擇進(jìn)入行業(yè)的標(biāo)準(zhǔn)有哪些?目前,同樣做人工智能的公司有很多,但一些人似乎很難獲得切入到行業(yè)場(chǎng)景的能力,科大訊飛在這方面有哪些經(jīng)驗(yàn)?
劉慶峰:在這個(gè)時(shí)代,人工智能不再是概念,應(yīng)用是硬道理。人工智能改變世界的過(guò)程,需要在一個(gè)又一個(gè)的領(lǐng)域來(lái)進(jìn)行應(yīng)用的創(chuàng)新,通過(guò)與領(lǐng)域?qū)<业慕Y(jié)合來(lái)獲得行業(yè)的數(shù)據(jù)。這決定了人工智能產(chǎn)業(yè)不是一家公司可以包打天下的,必須建立產(chǎn)業(yè)生態(tài)。產(chǎn)業(yè)生態(tài)的好壞,建設(shè)的快慢,決定了一個(gè)企業(yè)或者一個(gè)國(guó)家的人工智能產(chǎn)業(yè)發(fā)展進(jìn)程。所以,在人工智能領(lǐng)域,不是一個(gè)人跟另一個(gè)人的戰(zhàn)斗,也不是單個(gè)企業(yè)與單個(gè)企業(yè)之間的戰(zhàn)斗,而是一個(gè)體系和另一個(gè)體系、一個(gè)生態(tài)和另一個(gè)生態(tài)的競(jìng)爭(zhēng)。
科大訊飛現(xiàn)在也確定了自己的生態(tài)體系框架:第一層是圍繞訊飛超腦,各事業(yè)群、事業(yè)部主導(dǎo)的方向,這構(gòu)成了我們的核心層,也是核心業(yè)務(wù)構(gòu)成;第二層是一些探索性方向;第三層則是更大范圍下,圍繞科大訊飛核心技術(shù)的產(chǎn)業(yè)生態(tài)。我們會(huì)按照這個(gè)生態(tài)的道路不斷向前推進(jìn)。
記者:目前包括百度等互聯(lián)網(wǎng)公司也在做人工智能研究,并且部分板塊和科大訊飛有重合,你如何看待這種競(jìng)爭(zhēng)?科大訊飛有哪些優(yōu)勢(shì)?
劉慶峰:確實(shí)現(xiàn)在非常多的優(yōu)秀公司都在做人工智能,每家公司有自己的特點(diǎn),我們的優(yōu)勢(shì)是把我們最好的算法跟行業(yè)專家和行業(yè)數(shù)據(jù)結(jié)合,其他公司做人臉識(shí)別、視頻識(shí)別,他們也都有自己擅長(zhǎng)的領(lǐng)域,賽道各不相同。訊飛會(huì)把核心能力平臺(tái)化地對(duì)外提供,我們選的主賽道有教育、醫(yī)療、司法、車載、客服這些領(lǐng)域,在這些領(lǐng)域,我們可以看到一個(gè)非常大的未來(lái),而且我們可以占據(jù)很好的空間。
記者:科大訊飛未來(lái)的戰(zhàn)略的是什么?
劉慶峰:今年是科大訊飛成立十八周年,到 2029 年也就是科大訊飛成立三十周年。從“成人禮”到“三十而立”,2029 年,每一個(gè)設(shè)備都將能聽會(huì)說(shuō),人工智能將像水和電一樣無(wú)所不在。2029 年,訊飛將會(huì)怎樣?我們的愿景是成為中國(guó)人工智能產(chǎn)業(yè)領(lǐng)導(dǎo)者和產(chǎn)業(yè)生態(tài)構(gòu)建者,成為全球人工智能產(chǎn)業(yè)領(lǐng)導(dǎo)者,成為一家用人工智能改變世界的偉大企業(yè)。
閱讀全文