在90年代的電腦上實現(xiàn)CNN是一種什么體驗?
最近,一位日本小哥武田廣正(音譯)就在1990年的電腦PC-9801上實現(xiàn)了CNN來識別手寫字符。
就像這樣。
可能因為電腦性能的限制,整個識別過程要消耗一分多鐘。
原來30年前CNN是這樣實現(xiàn)的。
他還將整個過程分享到了推特上,得到了大量的關注。
不少網(wǎng)友驚嘆之余,還表示,心疼這個電腦,學習AI一定很難……
如何實現(xiàn)?
雖然目前這項技術還沒有開源,但早在93年就已經(jīng)有人將CNN玩得很溜了。
這個人就是LeCun。
前不久,一段關于LeCun93年的視頻火了。視頻中展現(xiàn)的是,當時的文字識別系統(tǒng)已經(jīng)用上了CNN。
他首先是電腦的系統(tǒng)中編寫了一種網(wǎng)絡數(shù)據(jù)結構的編譯器,并生成了可編譯的 C 語言代碼,在源代碼中以權重和網(wǎng)表(netlist)代表文字。
整套系統(tǒng)是在算力為20MFLOPS 的DSP版上運行。
當時,手寫數(shù)字數(shù)據(jù)集 MNIST還沒有問世,LeCun則用攝像拍攝來構建文字識別系統(tǒng)的。除此之外,還需要解決文字縮放、位置等問題。
只需在紙上寫好任意數(shù)字,不管任意大小形狀,或者帶有一定的“藝術性”,只要用攝像頭導入電腦,就可以識別。
而這位日本小哥則是在MNIST數(shù)據(jù)集上構建的,電腦上清晰展現(xiàn)了識別過程。
首先,讀取MNIST的數(shù)字圖像的信息。
隨后,進行一波卷積、池化等操作。
最后經(jīng)過SoftMax層,每個數(shù)字轉換成概率或者權重,按照權重大小選出所得數(shù)字。
背后的作者
武田廣正,來自巖手縣立大學信息學研究院,喜歡操作系統(tǒng)以及研究復古電腦,曾撰寫《Raspberry Pi GPGPU入門》
因為這個項目,他在enPiT的PBL活動中獲得了優(yōu)秀獎。
他表示,會將這一教程編寫進《令和的PC-98編程》一起發(fā)行,源代碼將在GitHub上提供。
參考鏈接:
https://twitter.com/T_taisyou/status/1357655009618399232