使用POWERPRO降低動態(tài)功耗簡介
發(fā)布時間:2020-05-12 來源:ELLIE BURNS,ABHISHEK RANJAN 責(zé)任編輯:wenwei
【導(dǎo)讀】一直以來,設(shè)計人員都將最小化功耗的工作留給實現(xiàn)/物理工具來完成。但到了這個時候,有關(guān)設(shè)計的所有重要架構(gòu)和微架構(gòu)決策都已確定。物理工具對功耗的影響非常有限。這些工具無法對設(shè)計架構(gòu)進行徹底的更改,從而實現(xiàn)節(jié)能。物理工具所用的方法,例如單元尺寸調(diào)整、管腳交換和 Vth 選擇,只能將稍稍降低功耗而已。
UPF 主要用于增強漏泄功耗的功率門控,其主要用途是定義電壓域。指定不同電壓域的其中一個原因是為了協(xié)商功耗與性能之間的折衷方案。較高的電壓可獲得更快的速度,但需要更高的動態(tài)功耗 (1/2 C V2 f)。
功耗與電壓的平方成正比。因此,降低動態(tài)功耗要從針對設(shè)計中的不同模塊規(guī)劃合適的電壓電平開始。動態(tài)功耗主要受活動影響。設(shè)計中運行的工作越多,最終需要的能量就越多。隨著在設(shè)計中完成工作的速度提高,所需功耗也會增加。要節(jié)省動態(tài)功耗,可以降低設(shè)計的工作速度(降低時鐘速度),嘗試降低電壓,或嘗試削減設(shè)計活動。減小設(shè)計中的電容是節(jié)能的另一個重要方面,這通常可借助高效的實施或通過調(diào)整工藝來實現(xiàn)。
一般而言,設(shè)計架構(gòu)師比較擅長確定電壓和時鐘速度。但目前為止,還未找到減少活動(尤其是不必要的活動)的有效做法。此類縮減往往需要微架構(gòu)更改(例如 FSM 重新編碼、模塊級時鐘門控、存儲器門控、存儲器分塊和旁路存儲器訪問),而這類更改要求深入了解設(shè)計功能。這類更改適合由編寫 RTL 的設(shè)計人員來執(zhí)行。
在許多公司,降低功耗的工作交給功耗專家完成。這些專家具備多年積累的反復(fù)應(yīng)用于所在業(yè)務(wù)組設(shè)計的知識和方法。但這種方法非常狹隘,無法在公司內(nèi)多個業(yè)務(wù)組之間拓展。
公司開始認(rèn)識到這一方法的局限性。于是越來越多的 RTL 設(shè)計人員從一開始便承擔(dān)了解決功耗問題的任務(wù)。理想情況下原本就應(yīng)如此。了解設(shè)計的人員是進行功耗優(yōu)化的最佳人選。而且,在設(shè)計轉(zhuǎn)向 FinFET 技術(shù)的過程中,動態(tài)功耗已成為功耗的主導(dǎo)因素(圖 1)。
圖 1:功耗趨勢。
降低 RTL 動態(tài)功耗的常用方法
在 RTL 做出的決定對設(shè)計功耗的影響遠(yuǎn)大于在設(shè)計流程后期做出的決定。RTL 設(shè)計人員嚴(yán)重依賴時鐘門控來削減時鐘翻轉(zhuǎn)。這是目前占絕對優(yōu)勢的降低動態(tài)功耗的最常用方法。RTL 設(shè)計人員使用的一些其他方法包括數(shù)據(jù)門控和觸發(fā)器克隆/共享(圖 2)。
圖 2:克隆觸發(fā)器方法。
圖 2 顯示:
• 觸發(fā)器 F 提供了用于 3 種算術(shù)運算的運算符。
• 觸發(fā)器 F 無法進行門控,因為至少一種算術(shù)運算需要它的值。
• 即便執(zhí)行一種運算,另外兩種運算中的邏輯也會發(fā)生不必要的翻轉(zhuǎn)并產(chǎn)生功耗。
• 通過將觸發(fā)器 F 克隆到三個觸發(fā)器(F1、F2 和 F3)中,可在對兩種運算進行門控的同時計算第三種運算。
通過這一更改,設(shè)計人員需要確認(rèn)額外觸發(fā)器的功耗要遠(yuǎn)小于它們所控制的下游算術(shù)運算功耗。
要對功耗產(chǎn)生更深刻的影響,RTL 設(shè)計人員需要在設(shè)計中進行越來越多的粗粒度(微架構(gòu))更改。例如,通過以下方法可顯著削減動態(tài)功耗:
• 模塊級的時鐘門控
• 將寄存器鏈轉(zhuǎn)換為環(huán)形緩沖器
• 關(guān)斷存儲器
• 旁路存儲器訪問
• 執(zhí)行重定時
• 使用運算符屏蔽。
將移位寄存器替換為環(huán)形緩沖器是一種常見的微架構(gòu)設(shè)計更改。移位寄存器中的活動量很大,因為沿著接收新值的觸發(fā)器鏈,數(shù)據(jù)一直都在進行移位。這一移位操作導(dǎo)致觸發(fā)器(以及這些觸發(fā)器所驅(qū)動的邏輯中)發(fā)生多次不必要的翻轉(zhuǎn)并造成功耗。因此,設(shè)計人員考慮將移位寄存器替換為環(huán)形緩沖器(圖 3),因為這些緩沖器在讀取或使用新值時不需要移動。
圖 3:將移位寄存器替換為環(huán)形緩沖器。
進行這一更改后,設(shè)計人員需要確認(rèn)在環(huán)形緩沖器內(nèi)添加讀/寫指針邏輯產(chǎn)生的功耗不會超過通過使用環(huán)形緩沖器節(jié)省的功耗。
由于在任意給定的時間間隔,僅僅訪問總計地址中的少數(shù)幾個地址,因此存儲器會浪費功率。為解決此問題,設(shè)計人員可使用較小的“分塊”實施總體存儲器,這些分塊在未被訪問時可予以關(guān)斷(圖 4)。
圖 4:存儲器分塊示例。
圖 4 顯示了對一個 1024 字存儲器進行分塊的兩種方法:
1. 兩個 512 字的分塊:僅其中一個分塊處于主動被訪問狀態(tài),另一個分塊則通過門控關(guān)斷以節(jié)省功耗。
2. 四個 256 字的分塊:任意時刻有三個分塊可處于門控關(guān)斷狀態(tài)。
另一種設(shè)計存儲器以節(jié)省功耗的方法是通過一組固定寬度的存儲塊來配置所需的存儲器字大小。在圖 5 所示的示例中,有多種實現(xiàn) 512 字 X 28 位存儲器的方法,圖中提供了兩種:
1. 剛好使用 28 位字大小 (16 + 8 + 4) 并插入額外的編碼邏輯,用于在兩個分塊之間做出選擇(圖 5 右上角)。
2. 使用單個 32 位存儲器元器件(圖 5 右下角)。盡管此解決方案不需要任何編碼邏輯,但有 4 位存儲器被浪費。
圖 5:可能的存儲器配置。
不論設(shè)計人員采用哪種方法來降低存儲器功耗,都必須非常小心,確保額外解碼邏輯的功耗仍小于較大的原始存儲塊功耗。
遺憾的是,前述方法的接受度遠(yuǎn)不如預(yù)期。主要有兩個原因:
• 不容易了解設(shè)計中存在這類機會。
• 不容易了解通過做出更改將會降低多少功耗。
通常,設(shè)計人員依賴他們的經(jīng)驗或直覺做出設(shè)計更改。他們載入仿真波形,并嘗試估計其設(shè)計中可能出現(xiàn)冗余活動的位置。然后,根據(jù)此類活動所在的區(qū)域,嘗試評估可減少浪費活動的方法。對一般 RTL 設(shè)計人員而言,這樣未免要求過高。因此,很多功耗節(jié)省未能付諸實施。使用 PowerPro® 提供了一種解決方案。
使用 POWERPRO 降低動態(tài)功耗
很顯然,傳統(tǒng)的降低功耗方法已經(jīng)不再行得通。遷移到 FinFET 給動態(tài)功耗帶來了與日俱增的嚴(yán)峻挑戰(zhàn)。為保持競爭優(yōu)勢,單純依賴功耗專家來降低功耗已經(jīng)遠(yuǎn)遠(yuǎn)不夠了。公司將會在功耗方面落后于競爭對手。
簡單地報告設(shè)計的功耗數(shù)字已不再適宜。功耗分析是一個重要的步驟,但它本身并不能節(jié)省任何功耗。最終要取決于設(shè)計人員個人的專業(yè)知識,以及他們?nèi)绾谓庾x工具報告從而優(yōu)化功耗設(shè)計。
RTL 設(shè)計人員需要關(guān)于設(shè)計中哪些位置可以節(jié)省功耗的指導(dǎo)。他們需要關(guān)于其設(shè)計中存在的優(yōu)化范圍(例如模塊級時鐘門控、移位寄存器到環(huán)形緩沖器、存儲器緩存和復(fù)位移除)及相關(guān)功耗節(jié)省的確鑿證據(jù)。PowerPro 在設(shè)計中提供了進行許多微架構(gòu)和細(xì)粒度優(yōu)化的可能性,并且呈現(xiàn)了與每項更改相關(guān)的實際功耗節(jié)省。與手動方法相比,其可最大限度減少了花費在做出設(shè)計決策上的時間?;?PowerPro 的建議,設(shè)計人員可根據(jù)其設(shè)計進度做出更改。如果依據(jù)進度還有足夠的時間,他們可以實施所有建議。如果時間有限,設(shè)計人員可以選取最佳建議加以實施。在設(shè)計流程中采用 PowerPro 時,這一靈活性至關(guān)重要。
功耗優(yōu)化的另一個關(guān)鍵部分是探索各種更改(例如工作模式、時鐘頻率、工作電壓和工藝技術(shù))對應(yīng)的功耗的能力,對于 IP 開發(fā)人員而言尤其如此。建議的優(yōu)化應(yīng)適用于上述所有參數(shù)。利用 PowerPro,設(shè)計人員可以探索仿真配置文件、電壓、時鐘速度和設(shè)計自身的更改。在 PowerPro 內(nèi)可以并行評估以上多種更改(圖 6)。因此,過去需要幾周才能完成的探索任務(wù),現(xiàn)在只要幾個小時就能完成。這種生產(chǎn)率提升讓 PowerPro 成為極具吸引力的設(shè)計流程補充。
圖 6:PowerPro 功耗探索。
檢測功率冗余的基礎(chǔ)技術(shù)是形式化分析。PowerPro 對設(shè)計執(zhí)行深入的時序分析,以找出存儲器訪問、寄存器載入和數(shù)據(jù)路徑計算中存在的冗余。由于 PowerPro 能夠基于時序探索建議修改,因此遠(yuǎn)優(yōu)于市場中的同類競爭技術(shù)。PowerPro 可針對設(shè)計流程的所有方面提供支持,包括寫出優(yōu)化的 RTL、ECO 和驗證。設(shè)計人員確信,他們可以接受源自 PowerPro 的所有建議,并且不會對其交付進度產(chǎn)生任何不利影響。
推薦閱讀:
特別推薦
- 授權(quán)代理商貿(mào)澤電子供應(yīng)Same Sky多樣化電子元器件
- 使用合適的窗口電壓監(jiān)控器優(yōu)化系統(tǒng)設(shè)計
- ADI電機運動控制解決方案 驅(qū)動智能運動新時代
- 倍福推出采用 TwinSAFE SC 技術(shù)的 EtherCAT 端子模塊 EL3453-0090
- TDK推出新的X系列環(huán)保型SMD壓敏電阻
- Vishay 推出新款采用0102、0204和 0207封裝的精密薄膜MELF電阻
- Microchip推出新款交鑰匙電容式觸摸控制器產(chǎn)品 MTCH2120
技術(shù)文章更多>>
- 更高精度、更低噪音 GMCC美芝電子膨脹閥以創(chuàng)新?lián)屨夹袠I(yè)“制高點”
- 本立租完成近億元估值Pre-A輪融資,打造AI賦能的租賃服務(wù)平臺
- 中微公司成功從美國國防部中國軍事企業(yè)清單中移除
- 華邦電子白皮書:滿足歐盟無線電設(shè)備指令(RED)信息安全標(biāo)準(zhǔn)
- 功率器件熱設(shè)計基礎(chǔ)(九)——功率半導(dǎo)體模塊的熱擴散
技術(shù)白皮書下載更多>>
- 車規(guī)與基于V2X的車輛協(xié)同主動避撞技術(shù)展望
- 數(shù)字隔離助力新能源汽車安全隔離的新挑戰(zhàn)
- 汽車模塊拋負(fù)載的解決方案
- 車用連接器的安全創(chuàng)新應(yīng)用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索