5 億多年前,汪洋之中生活著一些身體構(gòu)造極其簡單的小生物們,它們靜等食物的到來,或也成為它物的食物。
偶然也好、必然也罷,最早期的這些小生物們慢慢出現(xiàn)了一雙雙“眼睛”,這個器官使得它們在獵取食物時可以自如地進攻,也可以自在地防守。
適者生存的理論指引下,之后相對較短的一段時間內(nèi),地球上的物種得到了非常豐富的發(fā)展,這也使得視覺進化引發(fā)“寒武紀大爆發(fā)”。
由此受惠的當然也包括人類,視覺也慢慢成為人們最為重要的感知系統(tǒng),人腦中超過一半的認知都需要與視覺相聯(lián)系,人們利用視覺支持日常的生活、工作,更好地了解世界。
5 億年,時間完美地讓絕大多數(shù)動物都看到了世界的光明,但稍顯遺憾的是:
直到今天,機器和計算機面對的還是相對“黑暗時代”。
我們在街頭巷弄安裝了視頻攝像頭,但只能做到事后報警,尚不能做到事前預(yù)警;
我們的社會每天都會產(chǎn)生海量視頻數(shù)據(jù),但我們無法根據(jù)這些數(shù)據(jù)進行高效檢索;
我們可以讓無人機在廣袤天空展翅,但我們還不能根據(jù)它所看到的數(shù)據(jù)繪制地貌。
總結(jié)而言:
作為一個社會整體,我們還是個盲人,因為我們最為智能的機器還是個盲人。
這是此前 CV 大牛李飛飛教授出席未來論壇時,談到的她對于視覺智能的一些看法。
而這個看法,也被業(yè)內(nèi)絕大多數(shù)從業(yè)者所認同。他們認為,計算機視覺目前在各研究應(yīng)用中主要還存有幾大問題:
1、感知問題可以通過神經(jīng)網(wǎng)絡(luò)函數(shù)無限逼近,相比之下認知問題解決起來就比較棘手。
比如:如何準確、快速地教會機器辨識什么是一把椅子?如果定義為四條腿,很多椅子并不滿足此描述;如果定義為可以坐的物體,很多非椅子類工具也有此功能。
一個如此簡單的檢測物體問題,背后都蘊含著多層次的認知問題,而這些問題至今還未得到完美解決。
2、在遮擋、模糊等弱線索情況下,人類作出某種判斷可以依據(jù)常識、推理等輔助手段實現(xiàn)全過程構(gòu)建。
但如果想要將這些能力教授給機器則非常困難,它們所表現(xiàn)的識別能力與人類相比相差甚遠,在需要能力協(xié)同、關(guān)鍵決策、精準控制時,機器智能尚顯不足。
計算機視覺技術(shù)帶給機器的能力不只是用來觀察世界,而是需要與世界建立聯(lián)系,從而智能交互。
換句話說:計算機視覺技術(shù)在城市級領(lǐng)域的探索才剛剛開始。
認識到技術(shù)的重要性及問題的多面性,作為全行業(yè)最為關(guān)注 AI 賽道的媒體之一,雷鋒網(wǎng)緊抓市場化急速前進節(jié)點,于每年的「CCF-GAIR 全球人工智能與機器人峰會 」上開設(shè)「 視覺智能 」專場。
CCF-GAIR 是目前本土人工智能領(lǐng)域規(guī)格最高、影響力最大的峰會之一。自 2016 年創(chuàng)辦以來, 已先后邀請到諾貝爾獎得主、圖靈獎得主,20 余位中美英法加等國院士、百余位 IEEE / ACM / IAPR Fellow、數(shù)百位在各自專業(yè)領(lǐng)域享有盛譽的學者以及 AI 領(lǐng)域的知名企業(yè)家、投資者和創(chuàng)新者共襄大會。
而「 視覺智能 」專場的目的則比較聚焦:召集業(yè)內(nèi)最為頂尖的技術(shù)大牛、業(yè)界專家,圍繞未來城市級視覺 AI 的發(fā)展方向展開細致討論。
過去五年,「 視覺智能 」專場已經(jīng)邀請到了包括:權(quán)龍、羅杰波、賈佳亞、孫劍、Demetri Terzopoulos、梅濤、山世光、林達華、王曉剛、王孝宇、溫浩、申省梅等超過三十位業(yè)界頂尖學者分享前瞻的技術(shù)研究 & 產(chǎn)品經(jīng)營方法論。
譬如孫劍,身為曠視首席科學家、研究院院長、西安交通大學人工智能學院院長,去年 7 月 14 日,在第四屆 CCF-GAIR 全球人工智能與機器人峰會「 視覺智能 」專場上,他便從視覺智能、計算機攝影學以及 AI 計算三個方面介紹了計算機視覺研究領(lǐng)域的變革。
他首先回顧了深度學習發(fā)展歷史。深度學習發(fā)展到今天并不容易,過程中遇到了兩個主要障礙:
第一,深度神經(jīng)網(wǎng)絡(luò)能否很好地被訓練。在深度學習獲得成功之前曾被很多人懷疑,相比傳統(tǒng)的機器學習理論,深度學習神經(jīng)網(wǎng)絡(luò)的參數(shù)要比數(shù)據(jù)大 10 倍甚至上百倍;
第二,當時的訓練過程非常不穩(wěn)定,論文即使給出了神經(jīng)網(wǎng)絡(luò)訓練方法,其他研究者也很難把結(jié)果復現(xiàn)出來。
這些障礙直到 2012 年才開始慢慢被解除。孫劍認為,深度學習和傳統(tǒng)機器學習最大的差別是,隨著數(shù)據(jù)量越來越大,使用更大的神經(jīng)網(wǎng)絡(luò)就有可能超越人類性能。
孫劍之外,上述的每一個人,都在為算力的陡增做著嘗試、為算法的精進做著努力、為計算機視覺的成熟應(yīng)用而深刻改變社會的信息資源使用觀念和方式做著奮斗。
同時,他們也都選擇在「CCF-GAIR 全球人工智能與機器人峰會 」這個目前中國學術(shù)界最為標桿的大會之上發(fā)表他們過去幾十年的所思、所想。
「 視覺智能 」專場
計算機視覺技術(shù)應(yīng)用路上,道阻且長,尚有無數(shù)未知黑暗森林亟待探索。
歷史車輪滾滾勢不可擋,每隔一段時間都會有新的技術(shù)突破。
2020 年,技術(shù)的迭代又匹配了哪些城市場景?而這是否又會帶來新一輪的市場洗牌?
2020 年 8 月 7 日 -9 日,由中國計算機學會(CCF)主辦,香港中文大學(深圳)、雷鋒網(wǎng)聯(lián)合承辦的第五屆 CCF-GAIR 全球人工智能與機器人峰會,即將在深圳召開。
延續(xù)往年,今年再次設(shè)置了「視覺智能 」專場。
本專場以「城市視覺新基建 」為主題,匯聚全球極具代表性的計算機視覺、AI 芯片、安防、智能服務(wù)器等企業(yè)高管,聯(lián)合政、企、學、研、投、媒六界頂層資源,共同探討智能城市背后計算機視覺的未來。
目前已經(jīng)確認的演講嘉賓包括:
田奇,華為諾亞方舟實驗室首席計算機視覺科學家,IEEE Fellow
孫劍,曠視首席科學家
林達華,商湯科技聯(lián)合創(chuàng)始人
姚志強:云從科技聯(lián)合創(chuàng)始人
張磊,阿里巴巴集團副總裁,達摩院 AI 中心副主任,IEEE Fellow
申省梅,澎思科技首席科學家、新加坡研究院院長
通過一年一度的計算機視覺賽道品牌盛會,雷鋒網(wǎng)希望你能從中讀出鮮活的落地實踐,考察字里行間的深意所向,還原起初不知或無法了解的既定事實,并重新審視那些塑造當今世界智能化的下沉力量。