金融高頻交易場景中,主流的自營交易公司、對沖基金、經(jīng)紀公司和交易所等都在利用強大的計算機系統(tǒng)和復(fù)雜算法在極短的時間內(nèi)執(zhí)行大量交易。這是一場超低時延的競速賽,對于最高頻交易來說,一納秒差別可能就意味著百萬美元的盈虧。正因如此,尋求創(chuàng)新方法來優(yōu)化tick-to-trade延遲(從接收市場數(shù)據(jù)到執(zhí)行交易訂單所需的時間),是獲得競爭優(yōu)勢的關(guān)鍵。
專為實現(xiàn)超低延遲性能而打造的FPGA加速卡
高頻交易主要有三大特點:首先,交易執(zhí)行要求低時延,幾微秒之差可能就是盈利幾百萬美元和虧損之間的差別。第二,基礎(chǔ)設(shè)施非常關(guān)鍵,要進行高頻交易經(jīng)常需要在交易所租用服務(wù)器,實現(xiàn)服務(wù)器共置來獲得優(yōu)勢。很多高頻交易公司都是在非常接近交易所的地方或是在交易所部署基礎(chǔ)設(shè)施。此外,不論是基礎(chǔ)設(shè)施,還是產(chǎn)品尺寸、機架上服務(wù)器的數(shù)量,對于高頻交易來說也非常重要。第三,算法也能夠給高頻交易帶來優(yōu)勢,通過不斷演進的算法打造差異化優(yōu)勢,能夠幫助交易商實現(xiàn)監(jiān)管合規(guī),這對效率也非常重要。
結(jié)合上述需求,AMD日前推出了Alveo UL3422金融科技加速卡,將超低延遲網(wǎng)絡(luò)與自適應(yīng)硬件相結(jié)合,能夠推動交易策略以納秒級速度加速執(zhí)行。它主要有三大亮點:超低時延,滿足對速度要求最嚴苛的交易執(zhí)行;纖薄尺寸規(guī)格,可實現(xiàn)極具性價比的部署;易于開發(fā),可實現(xiàn)快速交易。
亮點一:超低時延,納秒級加速執(zhí)行
AMD Alveo UL3422加速卡基于Virtex UltraScale+ VU2P FPGA,并采用全新的收發(fā)器架構(gòu)。該FPGA結(jié)構(gòu)能夠在進行16位操作時達到644MHz的時鐘速度,可高效傳輸市場數(shù)據(jù)。該器件還集成了固化的以太網(wǎng)MAC和PCS IP,可實現(xiàn)超低延遲數(shù)據(jù)傳輸和控制管理,并簡化了ULL交易的時序收斂。該卡的FPGA和收發(fā)器架構(gòu)配有兩個網(wǎng)絡(luò)端口,分別支持10Gb/s和25Gb/s數(shù)據(jù)傳輸速率,符合大多數(shù)市場交易所的運行標準。
值得一提的還有,Virtex UltraScale+ VU2P FPGA基于前幾代進行了架構(gòu)上的顯著提升,采用的是GTF收發(fā)器,比之前的GTY提升了約7倍性能。由于實現(xiàn)了最大程度的硬化,從而將tick-to-trade時延降低了40%-49%,相當于13.9納秒。對于金融交易來說,這是一個巨大的優(yōu)勢。
其中,GTF與GTY的主要區(qū)別在于,GTF收發(fā)器是專為Virtex UltraScale+ VU2P FPGA芯片設(shè)計的,專為超低時延市場量身定制;GTY收發(fā)器技術(shù)則被廣泛應(yīng)用于Virtex UltraScale+系列的所有納米級別產(chǎn)品,包括16納米產(chǎn)品中。
在Alveo UL3422加速卡的硬件架構(gòu)中,F(xiàn)PGA架構(gòu)和DSP塊能夠針對不斷演進的交易策略進行靈活加速,嵌入式RAM用于對定價數(shù)據(jù)、交易記錄等進行快速內(nèi)存存取,DDR4用于存儲訂單簿信息、歷史定價數(shù)據(jù)等,這種架構(gòu)設(shè)計便于實現(xiàn)靈活的交易。
Alveo UL3422具體如何滿足對速度要求最嚴苛的交易執(zhí)行?AMD自適應(yīng)和嵌入式計算事業(yè)部Alveo加速卡高級產(chǎn)品線經(jīng)理Shyam Chander介紹,Alveo UL3422能夠進行實時的數(shù)據(jù)送達和交易執(zhí)行,算法支持交易前的風(fēng)險檢測,無論是經(jīng)紀商還是交易商都有著風(fēng)險管控的需求,通過這樣的方式能夠減少錯誤的發(fā)生,并且更好地滿足合規(guī)要求。
亮點二:極具性價比的纖薄尺寸
作為專為加速交易打造的FPGA卡,Alveo UL3422采用纖薄 FHHL(全高半長)外形尺寸設(shè)計,在實際部署中,這樣的尺寸規(guī)格極具性價比,可以降低進入門檻,實現(xiàn)廣泛采用。
Shyam Chander介紹,Alveo UL3422是AMD Alveo超低時延加速卡產(chǎn)品組合的最新成員,與一年前推出的Alveo UL3524相比,它更具性價比,同時保持了UL3524的諸多優(yōu)勢。具體而言,它尺寸更小,和很多服務(wù)器都能兼容,特別是有些企業(yè)在尋求共置服務(wù)器的時候特別注重空間方面的需要,Alveo UL3422實現(xiàn)了性能與性價比之間的出色平衡。
Shyam Chander表示,基礎(chǔ)設(shè)施策略對高頻交易的盈利能力至關(guān)重要,涵蓋全球前25、市值超過了100萬億美元的證券交易所,需要主機共置以確保最低時延,而這涉及資本支出與運營支出,包括機架空間、能源、網(wǎng)絡(luò)、數(shù)據(jù)饋送等。由于共置服務(wù)器的數(shù)量空間非常有限的,對成本的要求非常高,所以需要相關(guān)的器件封裝尺寸要盡可能小。此外還有功耗,所需調(diào)配網(wǎng)絡(luò)的數(shù)量和服務(wù)器數(shù)量等,都是非常關(guān)鍵的因素。
亮點三:易于開發(fā),實現(xiàn)快速交易
面向傳統(tǒng)的FPGA開發(fā)者,Alveo UL3422也展現(xiàn)出了較高的靈活性,使得高頻交易公司能夠持續(xù)優(yōu)化其交易策略,并適應(yīng)交易、算法及監(jiān)管要求的不斷演進。
針對傳統(tǒng)FPGA開發(fā)者,該硬件平臺展現(xiàn)出極高的靈活性,使得高頻交易公司能夠持續(xù)優(yōu)化其交易策略,并適應(yīng)交易、算法及監(jiān)管要求的不斷演進。開發(fā)者可以利用熟悉的FPGA工具流程,通過AMD Vivado工具進行RTL設(shè)計,同時,針對時延基準測試的參考設(shè)計,可以評估和集成自定義算法。
此外,AMD擁有豐富的IP工具包和生態(tài)系統(tǒng)解決方案,能夠?qū)崿F(xiàn)快速部署,無論是直接使用IP還是通過合作伙伴如Exegy提供的預(yù)構(gòu)建基礎(chǔ)設(shè)施IP,都能達到超低時延,運行時堆棧和API的簡化進一步加快了開發(fā)進程。該平臺還支持工業(yè)標準的機器學(xué)習(xí)開發(fā)框架,以實現(xiàn)低時延,例如FINN編譯器,它支持PyTorch開發(fā)、神經(jīng)網(wǎng)絡(luò)量化,并能生成RTL IP。
Alveo加速卡如何成為金融科技優(yōu)選?
當前,金融領(lǐng)域許多交易商開始采用AI交易策略,這些策略與FPGA的靈活加速計算能力結(jié)合成為一種趨勢。在金融科技領(lǐng)域,AI應(yīng)用正逐漸從非核心部分轉(zhuǎn)變?yōu)榻灰坠芫€的關(guān)鍵組成部分。
Shyam Chander表示,F(xiàn)PGA在這一過程中的價值和優(yōu)勢主要體現(xiàn)在兩個方面:首先,F(xiàn)PGA的可編程性使其能夠適應(yīng)各種算法需求,實現(xiàn)利潤最大化和特定算法的無縫連接,這是ASIC或SSD無法實現(xiàn)的;其次,針對金融科技對超低時延的嚴格要求,F(xiàn)PGA加速卡通過其GTF收發(fā)器能夠在20納秒內(nèi)完成數(shù)據(jù)傳輸,從而滿足超低時延的需求。
并且,Alveo加速卡面向金融科技領(lǐng)域提供多樣化的產(chǎn)品線,其中Alveo UL3524和Alveo UL3422專為超低時延需求而設(shè)計;Alveo V80等產(chǎn)品則更側(cè)重于計算和內(nèi)存密集型工作負載,對于時延的要求相對寬松。這也意味著,Alveo加速卡系列能夠同時滿足通用和專業(yè)化需求,對于FPGA和自適應(yīng)SoC而言,市場應(yīng)用空間廣闊。
除了金融科技,最新推出的Alveo UL3422加速卡是否還有其他潛在應(yīng)用領(lǐng)域?對此,Shyam Chander表示,確實存在其他的目標應(yīng)用,尤其是和低時延相關(guān)的,例如科研和智駕汽車領(lǐng)域??蒲蓄I(lǐng)域中,許多數(shù)據(jù)饋送處理需要在交換機中完成,超低時延的芯片能力對于這些應(yīng)用至關(guān)重要。
Shyam Chander 強調(diào),AMD正在通過高性能和自適應(yīng)計算技術(shù),積極推動金融服務(wù)領(lǐng)域的數(shù)字化轉(zhuǎn)型,這包括Ryzen(銳龍)、EPYC處理器以及FPGA技術(shù)等。高頻交易方面,由于低時延是降低成本和獲得利潤的關(guān)鍵,AMD希望通過持續(xù)創(chuàng)新,滿足更多應(yīng)用需求。