“宿命”之說
“目前音頻壓縮算法的碼率日趨降低,研究空間相對較窄,主要是在某種算法的基礎(chǔ)上對特定應用的改進和定制。音頻信號的研究還可以在下列更廣闊的方向開展下去:基于信號模型的音頻內(nèi)容描述、特征提取、分類與檢索。這些研究可以作為多媒體數(shù)據(jù)庫研究的一個子課題,實現(xiàn)音頻數(shù)據(jù)庫的組織和管理,基于內(nèi)容的音頻點播等。在人機交互方面,音頻內(nèi)容的描述可以用于音頻一視頻信號處理(Audio 一 Visual Signal Processing),實現(xiàn)音視頻信號交互、信號對應、信號關(guān)連等應用?!?/p>
這段文字來源于 2003 年一篇題為《基于正弦+噪聲模型的寬帶音頻信號的表示與壓縮》的文章,是今天筆者要介紹的主人公——宋少鵬的碩士畢業(yè)論文節(jié)選。細讀這段文字,一個即將畢業(yè)的學生對音頻信號未來的發(fā)展是有積極想法的,我們似乎就可以清晰地看到這個年輕人將走上的職業(yè)生涯道路。
時間是最好的證明,這個從華南理工大學無線電系畢業(yè)的小伙子近 20 年來真的就只做了一件事,這件事就是音頻信號處理。常有人問他為什么喜歡這個領(lǐng)域、認定這個方向的時候,他都會笑著答道,“兒時的興趣,我一直對聲波、電波充滿興趣,小時候聽黑膠唱片,聽磁帶,就一直想鉆進去看看是誰在里面唱歌。此外,我的中文名字宋少鵬的拼音首字母縮寫是 SSP,而音頻信號處理(Sound Signal Processing)的英文首字母縮寫也是 SSP,因此這是一種宿命,很早就注定了的?!?/p>
我的職業(yè)生涯一路向前,沒有轉(zhuǎn)折
上面講到 2003 年宋少鵬碩士畢業(yè),這一年他放棄了大公司的 offer,選擇進入一家以色列芯片公司 Zoran 做軟件開發(fā),鉆研音頻 DSP 技術(shù)。值得一提的是,全球第一個全套杜比單芯片解決方案就來自這家公司。
2010 年,他又去了微軟亞洲硬件中心,從事硬件產(chǎn)品的研發(fā)制造,經(jīng)手產(chǎn)品包括智能攝像頭、Kinnet 體感設備等。
就在 2012 年左右,他發(fā)現(xiàn)智能手機、電視、汽車都在向聯(lián)網(wǎng)化發(fā)展,由于給用戶帶來了豐富的內(nèi)容、社交和娛樂體驗,這些產(chǎn)業(yè)得到蓬勃發(fā)展。與此同時,音頻設備卻還沒有聯(lián)網(wǎng),這在一個專業(yè)音頻從業(yè)者眼中,便是機遇。而眼前急切要弄清楚的是:如何聯(lián)網(wǎng)?如何承載娛樂和社交?
帶著這些思考,還在微軟供職的宋少鵬便尋找機會開始嘗試,這次嘗試不算成功,在他看來,原因有兩點,一是當時行業(yè)環(huán)境還不太成熟,二是大公司的體制存在一定的限制。
宋少鵬在后來接受利器的采訪時被問到職業(yè)生涯的轉(zhuǎn)折點,他直言不諱地說:“我的職業(yè)生涯一路向前,沒有轉(zhuǎn)折。”因此,回溯到上述那次不太成功的嘗試,摸清原因,認準方向也是他職業(yè)道路上的收貨,當然不止于此,他還結(jié)識了一幫志同道合的朋友。于是在 2013 年的某一天,他帶著這個團隊毅然決然的開始了他們的創(chuàng)業(yè)闖蕩。
2014 年,米唐在深圳這個遠離中國的政治和經(jīng)濟中心的灣區(qū)成立了,他喜歡那里自發(fā)式、民營式、創(chuàng)新型的經(jīng)濟模式,大家都來自江西、湖南、江蘇、四川、中國各地,移民所帶來的一些共同的特質(zhì),比如說勇敢、不屈服、創(chuàng)新,這些都與他的團隊惺惺相惜。
從產(chǎn)品到解決方案,都在用心做“耳朵”
公司成立初期,產(chǎn)業(yè)的不成熟,加上創(chuàng)業(yè)公司交付能力的有限,使得米唐沒辦法短時間內(nèi)在語音交互領(lǐng)域拿出產(chǎn)品化的東西,基于訊飛 SDK 和谷歌 SDK 的嘗試又均不能滿足這個團隊對產(chǎn)品體驗的要求,而一家公司要生存下去就必須要有良好的資金回流,于是他們的第一款產(chǎn)品“方糖音箱”放棄了語音的交互,只保留了兩項特殊的“體感”操作方式:輕拍音箱頂部開始播放音樂或暫停,向左或向右傾斜切換上下曲目。
這款音箱通過 WiFi 連接上網(wǎng),可脫離手機獨立工作,并內(nèi)置了不少音樂電臺,比如豆瓣電臺、荔枝 FM、還有一些國際電臺,同時它還能記錄個人喜好,進行智能推薦。若是用戶在互動中能會心一笑,那在宋少鵬的眼中,除了趣味更是一種關(guān)懷帶來的暖意。
“產(chǎn)品就像藝術(shù)品,源于生活,高于生活,要從生活中抽象提煉需求,發(fā)掘人性?!边@與宋少鵬以人性、人文觀點來思考產(chǎn)品設計的觀點高度契合。但生活要繼續(xù),公司更需發(fā)展,經(jīng)濟基礎(chǔ)決定上層建筑,即使方糖在 2015 年就開始銷往海外,并推出了同樣設計的藍牙音箱,以謀取更多的利潤,一年數(shù)萬臺的銷量還是顯得捉襟見肘。
作為一家始終觀察著這個領(lǐng)域的創(chuàng)業(yè)企業(yè),2015 年底,他們看到了亞馬遜的 Echo 和背后的 Alexa 語音交互系統(tǒng)。最初亞馬遜 Echo 以 MVP(最小可用原型)的形態(tài)交付用戶,語音識別和語義理解都僅能滿足流媒體播放的簡單需求,但是經(jīng)過一兩年的打磨,到了 2016 年,Echo 的體驗就好了很多,它既可以提供音頻內(nèi)容,也可以提供生活服務,包括音樂、電臺、有聲書、新聞、天氣、鬧鐘、日程等。這時候亞馬遜也將 Alexa 語音交互平臺開放出來,于是米唐團隊在第一時間找到了亞馬遜。大概花了三四個月的時間,在眾多想接入 Alexa 的競爭者中,方糖成為首個通過亞馬遜認證的第三方音箱產(chǎn)品。
“通過亞馬遜的認證后,Alexa 團隊的人就主動找到了我,問我一年能夠賣多少,我說幾萬臺,亞馬遜就說做他們的技術(shù)方案商,可以幫米唐一年賣幾百萬個解決方案”,宋少鵬回憶稱這是亞馬遜幫團隊找到了方向。于是,一個擅長做技術(shù)的團隊,開始從做 C 端產(chǎn)品轉(zhuǎn)向做 B 端的方案,并決意將自己定位為聚焦海外市場的語音交互解決方案提供商。
“讓萬物聽說”是使命所在
目前,米唐的業(yè)務已擴展到家用電器、汽車和消費電子產(chǎn)品等多個領(lǐng)域,而其核心競爭力是他們的遠場語音交互算法,在響應速度、識別率、去噪、聲源定位和產(chǎn)品良率方面均做得還不錯。
“作為創(chuàng)業(yè)狗,在哪都能工作。出差路上的飛行和堵車時的 YY 是獲得靈感的方式,出差的時候會帶一本書,和一個趁早筆記本。”宋少鵬如是說,“當你做一個事情,真正站在場景和用戶的角度去思考,才有可能在價值上有所突破,而當你受制于既得利益時,其實會做很多束縛手腳的事情?!?/p>
未來的米唐會發(fā)展成怎樣,沒人可以預判,但“讓萬物聽說”會成為它和它背后的這個團隊不變的使命。
----------------
總編推薦:由貿(mào)澤電子全力支持,與非網(wǎng)傾力策劃推出的第一個產(chǎn)業(yè)紀錄片視頻系列《深圳 Style》,關(guān)注奮斗在深圳的電子產(chǎn)業(yè)內(nèi)的創(chuàng)業(yè)者們。
如果你看過了上面的視頻,會發(fā)現(xiàn)我們制作了中英文雙語字幕,沒錯,除了與非網(wǎng)及旗下覆蓋本土市場的網(wǎng)絡集群,這一系列的視頻,我們也會通過 Supplyframe 集團覆蓋全球的網(wǎng)絡平臺進行發(fā)布。
我們的觀眾不止于中國,發(fā)出最強音,讓中國電子產(chǎn)業(yè)者的聲音觸達更多本土和海外的行業(yè)用戶,是我們對每一個有情懷、有實力的創(chuàng)業(yè)者和實業(yè)家的承諾。
如果你自認有足夠?qū)嵙?,有故事,想說給人聽,歡迎和我們聯(lián)系,聯(lián)系方式:editor@supplyframe.cn,或掃描下方二維碼,留言請備注:創(chuàng)業(yè)者