北京2024年8月15日?/美通社/ -- 目前數(shù)據(jù)中心運(yùn)維人員部署服務(wù)器時(shí),經(jīng)常會(huì)遇到服務(wù)器開機(jī)噪音極大,開機(jī)聲浪仿佛"飛機(jī)起飛",明明剛開機(jī),服務(wù)器內(nèi)部各個(gè)部件還未完全上電,風(fēng)扇轉(zhuǎn)速為什么要拉滿?而且,伴隨著風(fēng)扇的呼嘯聲,服務(wù)器啟動(dòng)"龜速",開機(jī)時(shí)間要3、5分鐘甚至更久,嚴(yán)重影響了服務(wù)器運(yùn)維部署效率。
通過(guò)BMC Linux/RTOS異構(gòu)雙系統(tǒng)并行管理技術(shù),浪潮信息首創(chuàng)「開機(jī)3秒智能控溫技術(shù)」,能夠在服務(wù)器上電后,BMC的Linux系統(tǒng)啟動(dòng)之前,3秒內(nèi)即時(shí)接管風(fēng)扇轉(zhuǎn)速調(diào)控策略,通過(guò)實(shí)時(shí)感知環(huán)境溫度,實(shí)現(xiàn)對(duì)溫度與散熱的動(dòng)態(tài)把控,噪音比優(yōu)化前最大下降30.4%,提升數(shù)據(jù)中心運(yùn)維體驗(yàn),開機(jī)功耗相比傳統(tǒng)風(fēng)扇轉(zhuǎn)速拉滿策略也可降低一半以上。同時(shí),通過(guò)BMC RTOS系統(tǒng)與Linux系統(tǒng)的同時(shí)啟動(dòng),及BIOS系統(tǒng)優(yōu)化,可實(shí)現(xiàn)上電即開機(jī),開機(jī)時(shí)間縮短一半以上,減少時(shí)間敏感型業(yè)務(wù)部署上線時(shí)間,有效降低因?yàn)檫\(yùn)維重啟服務(wù)器對(duì)于業(yè)務(wù)的不良影響。
浪潮信息首創(chuàng)服務(wù)器開機(jī)3秒智能控溫技術(shù)
服務(wù)器啟動(dòng)時(shí)間過(guò)長(zhǎng)且風(fēng)扇噪音過(guò)高的癥結(jié)在于,服務(wù)器傳統(tǒng)控溫策略中為了盡可能滿足散熱安全性要求,上電之后會(huì)以覆蓋最大配置的方式來(lái)進(jìn)行風(fēng)扇速度調(diào)節(jié),而此時(shí)BMC Linux系統(tǒng)尚未啟動(dòng),熱量傳感器數(shù)據(jù)無(wú)法采集,導(dǎo)致風(fēng)扇滿載狀態(tài)會(huì)持續(xù)較長(zhǎng)時(shí)間,帶來(lái)能耗、噪音的攀升和穩(wěn)定性的降低。而且為了避免開機(jī)過(guò)程中散熱風(fēng)險(xiǎn)一般會(huì)設(shè)置等待BMC Linux 系統(tǒng)啟動(dòng)完成后再啟動(dòng) POST 過(guò)程,導(dǎo)致服務(wù)器從 AC 上電到進(jìn)入 OS 的時(shí)間被拉長(zhǎng)。
除了啟動(dòng)過(guò)程中服務(wù)器風(fēng)扇滿轉(zhuǎn),噪音過(guò)高,在BMC的Linux故障情況下,由于沒(méi)有合理機(jī)制能夠保證風(fēng)扇的可靠接管,也會(huì)造成風(fēng)扇滿轉(zhuǎn)噪音瞬間達(dá)到峰值,服務(wù)器始終在功耗峰值運(yùn)行,運(yùn)維環(huán)境惡劣,不僅不符合節(jié)能降碳趨勢(shì),還會(huì)影響系統(tǒng)穩(wěn)定性和風(fēng)扇壽命。
為了化解服務(wù)器啟動(dòng)等過(guò)程中的風(fēng)扇控制難題,浪潮信息首創(chuàng)開機(jī)3秒智能控溫技術(shù)。該技術(shù)通過(guò)解決BMC異構(gòu)雙系統(tǒng)核間通信的難題,實(shí)現(xiàn)BMC內(nèi)部RTOS 3秒智能控溫技術(shù)和Linux管理技術(shù)的雙系統(tǒng)并行,有效利用RTOS實(shí)時(shí)操作系統(tǒng)采集傳感器數(shù)據(jù),實(shí)現(xiàn)毫秒級(jí)的信號(hào)采集控制,確保風(fēng)扇控制的高效、精準(zhǔn),同時(shí)也優(yōu)化了服務(wù)器開機(jī)管理流程。
創(chuàng)新一:創(chuàng)新RTOS系統(tǒng) 精準(zhǔn)控制風(fēng)扇轉(zhuǎn)速
浪潮信息充分利用BMC芯片算力資源,創(chuàng)新性開發(fā)RTOS實(shí)時(shí)操作系統(tǒng),通過(guò)PECI總線對(duì)環(huán)境溫度以及部分核心部件溫度進(jìn)行采集,開機(jī)即可實(shí)現(xiàn)毫秒級(jí)的信號(hào)采集控制,隨后通過(guò)閉環(huán)反饋實(shí)現(xiàn)對(duì)溫度與散熱的動(dòng)態(tài)把控,從而精確掌控散熱資源,以滿足散熱需求的最小化資源,降低無(wú)效功耗。
在通過(guò)RTOS系統(tǒng)實(shí)時(shí)獲取傳感器溫度數(shù)據(jù)的基礎(chǔ)上,浪潮信息獨(dú)家提出BMC Linux/RTOS異構(gòu)雙系統(tǒng)并行技術(shù),成功攻克多核多系統(tǒng)之間數(shù)據(jù)交換難題,構(gòu)建了開機(jī)期間,全新的風(fēng)扇控制策略:
- BMC Linux系統(tǒng)啟動(dòng)前,RTOS進(jìn)行系統(tǒng)溫度收集及控制;
- 在BMC Linux系統(tǒng)啟動(dòng)階段,由Linux收集傳感器溫度信息,之后通過(guò)共享內(nèi)存?zhèn)鬟f給RTOS,由RTOS進(jìn)行風(fēng)扇調(diào)控
- 當(dāng)BMC Linux系統(tǒng)完全啟動(dòng)后,由Linux系統(tǒng)收集傳感器溫度并親自實(shí)現(xiàn)溫度調(diào)控。同時(shí)在BMC Linux系統(tǒng)故障或重啟時(shí)RTOS能迅速接管散熱系統(tǒng)并精確控制風(fēng)扇轉(zhuǎn)速。
創(chuàng)新二:階梯性散熱策略 散熱需求實(shí)時(shí)動(dòng)態(tài)響應(yīng)
開機(jī)過(guò)程中,一般服務(wù)器內(nèi)部各部件會(huì)相繼啟動(dòng),帶來(lái)的散熱需求應(yīng)該是階梯式增長(zhǎng)的。但此時(shí)BMC Linux系統(tǒng)尚未啟動(dòng),無(wú)法控制風(fēng)扇轉(zhuǎn)速,為保障服務(wù)器高可用性,風(fēng)扇只能按照極端環(huán)境下的極限負(fù)載高轉(zhuǎn)速運(yùn)行,造成能耗、噪音的提升和穩(wěn)定性的降低。
浪潮信息基于深耕多年的服務(wù)器行業(yè)經(jīng)驗(yàn),結(jié)合電子設(shè)備在上電后熱量逐漸累積并向外傳遞的散熱數(shù)據(jù),構(gòu)建服務(wù)器散熱策略專家?guī)?,與業(yè)界開機(jī)即風(fēng)扇拉滿的策略不同,創(chuàng)造性的提出基于服務(wù)器溫度感知的階梯性風(fēng)量提升控制技術(shù)。
借助毫秒級(jí)的信號(hào)檢測(cè)和梯度散熱模型,浪潮信息了實(shí)現(xiàn)對(duì)散熱需求的動(dòng)態(tài)響應(yīng),使風(fēng)扇轉(zhuǎn)速能夠階梯式上升,不僅更符合硬件散熱規(guī)律,也使得開機(jī)過(guò)程中的噪音得到有效控制。實(shí)測(cè)數(shù)據(jù)證實(shí),在環(huán)境溫度為20°時(shí),浪潮信息的解決方案可將風(fēng)扇轉(zhuǎn)速值控制在25%,開機(jī)噪聲值降低至44.7dBA,噪音下降30.4%。在BMC重啟或掛死情況下,其能夠?qū)L(fēng)扇轉(zhuǎn)速值優(yōu)化40%,噪聲由71.8dBA降低至57.2dBA。
創(chuàng)新三:上電即開機(jī) 開機(jī)時(shí)間縮短一半以上
RTOS作為輕量級(jí)實(shí)時(shí)系統(tǒng),任務(wù)負(fù)載量小,可先于BMC Linux啟動(dòng),同時(shí)搭配浪潮信息獨(dú)有的BMC Linux與服務(wù)器BIOS系統(tǒng)同步啟動(dòng)技術(shù),可實(shí)現(xiàn)上電即開機(jī),從而大幅度提升開機(jī)速度。
測(cè)試數(shù)據(jù)顯示,部署RTOS實(shí)時(shí)操作系統(tǒng)和BIOS快速啟動(dòng)技術(shù)的服務(wù)器,進(jìn)入操作系統(tǒng)時(shí)間可較業(yè)界縮短一半以上,不但可以快速執(zhí)行時(shí)間敏感型任務(wù),還能有效加快常規(guī)業(yè)務(wù)部署上線,并減少因?yàn)檫\(yùn)維重啟服務(wù)器對(duì)于業(yè)務(wù)時(shí)效的影響。
開機(jī)智能控溫,大規(guī)模數(shù)據(jù)中心高效綠色發(fā)展利器
浪潮信息服務(wù)器開機(jī)3秒智能控溫技術(shù),為數(shù)據(jù)中心運(yùn)維人員解決了"服務(wù)器部署時(shí)啟動(dòng)時(shí)間過(guò)長(zhǎng),且風(fēng)扇轉(zhuǎn)速一次性拉升過(guò)高"的問(wèn)題,實(shí)現(xiàn)上電即開機(jī),開機(jī)速度較業(yè)界平均速度最大提升1.2倍,助力業(yè)務(wù)快速上線,減少因?yàn)檫\(yùn)維和維護(hù)造成的業(yè)務(wù)擱淺時(shí)間。
同時(shí),在階梯式轉(zhuǎn)速控制模型和閉環(huán)反饋控制的精確調(diào)節(jié)下,實(shí)現(xiàn)了根據(jù)環(huán)境溫度和散熱需求的動(dòng)態(tài)響應(yīng),大幅改善啟動(dòng)過(guò)程中的噪音,噪音比優(yōu)化前最大下降30.4%,能夠?yàn)檫\(yùn)維人員提供更舒適的機(jī)房環(huán)境,并實(shí)現(xiàn)風(fēng)扇轉(zhuǎn)速的全周期速率可控,延長(zhǎng)風(fēng)扇壽命,降低運(yùn)維成本。在BMC Linux故障的情況下,RTOS還可以迅速接管設(shè)備散熱管理,對(duì)風(fēng)扇進(jìn)行有效管控,防止設(shè)備過(guò)熱損壞,提升系統(tǒng)可靠性。