作者 |??ZeR0,編輯?|??漠影
安卓旗艦啟動性能一致性超越蘋果,讓計算單元更多運行在最佳能效的甜點區(qū)間。
芯東西12月27日報道,自研芯片技術已經(jīng)是優(yōu)化手機終端體驗的重要途徑。27日下午,OPPO亮出芯片調(diào)校技術的最新進展,首度公布其自研芯片軟硬融合技術棧關鍵的潮汐架構。
潮汐架構能有效解決影響SoC計算效率提升的存算分離、芯片調(diào)度兩大瓶頸:
1、對性能的優(yōu)化深入到傳統(tǒng)手機廠商無法精細化的片上緩存系統(tǒng),首次實現(xiàn)系統(tǒng)級緩存及L3緩存的動態(tài)匹配,可將平均能效節(jié)約8%。
2、精準動態(tài)調(diào)度SoC計算單元,使得快手、高德地圖、微博、瀏覽器等應用均能效提升明顯。
3、解決了影響系統(tǒng)流暢性的GPU控制顯示時延一致性難題,讓安卓旗艦手機的啟動性能一致性體驗超越蘋果。
除了潮汐架構外,面向安全隱私,OPPO獨家VIP模式提供芯片級權限加密,內(nèi)置國密認證安全芯片,實現(xiàn)隱私信息獨立存儲、物理隔離。此外,OPPO預告潮汐架構還會有重大升級,將進一步拓展與聯(lián)發(fā)科的合作伙伴關系,深度參與下一代天璣旗艦芯片相關硬件的設計。
01.緩存機制:精細化利用片上緩存,平均能效節(jié)約8%
OPPO軟件技術規(guī)劃與架構設計總監(jiān)洪漢生說,做好芯片調(diào)校,需要兼具好的芯片和軟件能力。當前SoC芯片計算效率提升困難有兩大瓶頸:
1)智能手機性能鏈路沿用經(jīng)典的馮·諾依曼式結構,存算分離,存儲讀寫速度遠低于CPU計算速度;
2)芯片的調(diào)度方案缺乏場景級的認知。對此,OPPO帶來自研的軟硬芯片融合技術?!?strong>潮汐架構。
據(jù)洪漢生分享,潮汐架構是OPPO在手機芯片調(diào)校領域鉆研多年的綜合成果。這些年,OPPO一直讓一些做系統(tǒng)軟件的工程師學習芯片技術,又招聘了大量的芯片設計工程師,讓他們理解軟件場景。所以潮汐架構是由一群懂軟件、懂系統(tǒng)、懂芯片的技術專家們共同打造出來的。針對典型馮·諾依曼計算機體系結構普遍存在的存算分離問題,洪漢生認為,緩存的使用是所有策略中最沒有副作用的、最有效的一個辦法。
存儲器的金字塔,越往高處,速度越快。因為價格貴,所以上面幾層容量越來越小。越往下,因為成本優(yōu)勢,容量能做的比較大。相比內(nèi)存存儲,緩存的讀寫速度優(yōu)勢能達到10倍甚至百倍。如果讓數(shù)據(jù)讀取發(fā)生在金字塔上層,那么整個計算鏈路的效率能得到很大提升。用好緩存,有助于實現(xiàn)性能和功耗的兼顧。OPPO過去幾年在這方面取得了進步。相對傳統(tǒng)手機公司僅能在ROM或RAM進行性能優(yōu)化,潮汐架構深入到了片上系統(tǒng)緩存及L3緩存。
“里面的辛酸,可能只有我自己知道。”據(jù)洪漢生回憶,兩年前OPPO團隊決定做的時候,沒有仿真平臺,更不要說代碼或者開放接口,工程師們只能通過調(diào)整CPU、GPU、DDR的參數(shù),改變投票策略,看緩存的命中和缺失,改一組數(shù)據(jù)就測一個結果,硬是用這種“笨辦法”,足足整理了一整年的數(shù)據(jù),進行數(shù)據(jù)建模,看明白其中的規(guī)律和原理,從入門到精通,真正理解了技術。然后,OPPO團隊與芯片廠商深入合作,成立性能和功耗的聯(lián)合實驗室,一起設計了從L3緩存到系統(tǒng)緩存的分區(qū)管理機制。潮汐架構基于單場景去判斷當前應用對系統(tǒng)資源的需求,緩存能夠根據(jù)CPU和GPU進行動態(tài)配比,并使CPU、GPU等計算核心在最優(yōu)頻點區(qū)間運行。如果是計算型任務占多,則主動分配更多緩存給CPU;如果渲染型任務占多,則將資源傾斜給GPU。
洪漢生說,這些方案看上去不復雜,但如果回到兩年前,“黑盒子”曾經(jīng)就像一座大山一樣擋住了道路,不翻過去,永遠不會知道山的那邊是什么樣子的,所幸OPPO團隊翻過了那座大山。經(jīng)測算,在性能無損的情況下,潮汐架構可實現(xiàn)8%的平均能效節(jié)約。
02.算力調(diào)度:動態(tài)調(diào)度SoC計算單元,明顯提升日常應用能效
下一個問題是芯片怎樣做算力調(diào)度。計算機CPU有一個甜點區(qū)間,在這個區(qū)間里,能效比是最佳的;在這個區(qū)間外,有時候為了一點點的性能提升,要付出極大的功耗損失。如果一個場景變得復雜,計算需求如何在多個計算單元里以最低能耗執(zhí)行?怎樣讓多個核心都處于這樣的甜點區(qū)間?這是一門復雜的學問。
據(jù)洪漢生透露,在OPPO新一代旗艦上,有1+2+3+2的架構,也有全大核的架構。由OPPO與芯片廠商深度合作打造的潮汐架構,通過對應用具體場景的準確識別,精細化地進行場景調(diào)度分析和精準的算力功耗匹配,實現(xiàn)SoC計算單元的動態(tài)調(diào)度,讓計算單元更多地運行在最佳能效的甜點區(qū)間。
在跨平臺的CPU頻率映射上,潮汐架構幫助避免了一些過度的算力消耗。
如圖是實測在重載游戲下滿幀情況的一個頻點分布??梢钥吹?,性能該釋放時,高頻點不吝嗇,但其他時候,其調(diào)度控制得非常精細,能夠把整個頻率能夠壓到非常低。從其他常用的快手、高德地圖、相冊、微博、瀏覽器等各種頭部應用測試結果看,潮汐架構使其在SoC整體能耗上取得了3%以上的收益。
洪漢生解釋說,這些數(shù)據(jù)看起來不多,是因為芯片能效不是那么容易提升的,而這些,都是真真實實的數(shù)據(jù)。
03.流暢性:讓安卓旗艦啟動性能一致性超越蘋果
除了能效外,潮汐架構還給安卓旗艦手機帶來了流暢性上的顯著進步。洪漢生提到蘋果手機總是給人以更加流暢的意向。在他看來,安卓手機的流暢性如果想要超越蘋果,最大的鴻溝就是“總是”這兩個字。做一次流暢很容易,做百次、千次、萬次也不難,但是做到十萬次、百萬次,需要解決看不到的問題,要實現(xiàn)基本環(huán)節(jié)的體驗始終保持一致。
OPPO是怎么做的?洪漢生分享說,日常使用手機點開一個應用,從點擊那一刻到這個應用的圖標展開,區(qū)間大概是100多毫秒。經(jīng)過長時間的分析,OPPO團隊發(fā)現(xiàn)要把它做流暢,可能比做一個游戲120幀還要難。這是因為有三個行業(yè)難題:一是觸控響應一致性,二是軟件上的線程調(diào)度一致性,三是GPU顯示時延一致性。跟GPU強相關的顯示時延一致性怎么做呢?安卓手機采用的是分層次渲染,每一幀的動畫顯示都要經(jīng)歷過多次軟件合成、硬件合成,會在GPU里進進出出。如果說這是一條生產(chǎn)線,GPU就像是控制中臺,必須有能力根據(jù)整個生產(chǎn)線上所有環(huán)節(jié)可能產(chǎn)生的任何偏差進行及時糾正,去動態(tài)增加時鐘信號、動態(tài)增強GPU驅動能力,只有這樣,才能保證小到幾毫秒級別的時延,做到始終一致性。
否則,如果整個生產(chǎn)線錯過了一個時鐘信號,就會導致整個工序往右移,會出現(xiàn)丟幀和延遲感,帶給終端用戶不好的體驗,比如點擊圖標后沒有響應,整個頁面的顯示是姍姍來遲的。在解決掉這三個問題后,OPPO參考了蘋果的設計,把響應時間調(diào)到了一個比較舒適的時間,不快也不慢,然后用高速攝像機反復進行測試,最后成功將整個應用的啟動響應時間控制得像蘋果那樣非常平穩(wěn)。通過精準的芯片算力調(diào)度,基于場景動態(tài)增強GPU驅動能力,潮汐架構解決了影響系統(tǒng)流暢性的GPU控制顯示時延一致性難題,從而保證了啟動性能的一致性。在模擬1天使用的320次應用啟動測試,OPPO Find X7以低至11ms的啟動響應標準差,做到了所有旗艦的第一名,甚至超越了以穩(wěn)定流暢著稱的蘋果。
04.國密二級認證安全芯片加持,實現(xiàn)硬件級安全加密
在保障用戶隱私安全方面,OPPO致力于通過全鏈路的應用、數(shù)據(jù)管控和軟硬件結合的創(chuàng)新功能,已取得多項國內(nèi)外安全隱私領域頂級認證。
在今年10月發(fā)布Find N3典藏版時,OPPO推出了行業(yè)首創(chuàng)的“VIP模式”,通過三段式物理開關,一鍵就能關閉麥克風、攝像頭、定位等敏感權限,為用戶隱私進行硬件級安全加密。VIP模式也將登陸下一代Find X系列旗艦。OPPO為“VIP模式”加持了一個通過手機領域最高認證等級的國密二級認證安全芯片。該芯片能夠獨立存儲各種敏感信息,相比傳統(tǒng)的軟件安全方案,芯片級的加密方式可以將敏感權限的管理、授權開關,與操作系統(tǒng)分離,鎖進安全芯片的硬件層,由芯片級安全子系統(tǒng)進行管理。
安全芯片配合通話隱私雙向保護、隱私信息自動打碼、證件照片一鍵水印等隱私功能,從硬件到一系列軟件功能,全方面守護用戶的隱私安全。
05.結語:手機競爭卷向芯片調(diào)校
同一顆芯片,不同的芯片調(diào)校能力,影響了手機在實際使用中能夠發(fā)揮的芯片性能。隨著摩爾定律瀕臨失效,每一代芯片制程提升,背后有行業(yè)千億級美元的投入、百萬級工程師的努力,也只能把芯片的整體能效提升百分之十幾。
OPPO實現(xiàn)8%的平均能效節(jié)約,足見芯片調(diào)校對于優(yōu)化能效表現(xiàn)的重要性。在有限的芯片選擇中,通過軟硬件協(xié)同實現(xiàn)手機體驗差距的芯片調(diào)校能力競爭,已經(jīng)從手機巨頭們之間暗戰(zhàn)轉化為臺前“秀肌肉”的焦點。
這些終端用戶“看不見”的優(yōu)化,拼得是不止是軟硬件技術實力,還考驗了手機大廠們的場景級認知、與芯片原廠合作深度等綜合能力。隨著芯片調(diào)校愈發(fā)精細化,更高的性能、更優(yōu)的能效,更穩(wěn)定的流暢性,結合越來越多引入的智能優(yōu)化技術,最終將使用戶受益。