國產單片機代理商深圳英銳恩科技關注到Arm正在實現他們承諾的每年20~25%的CAGR,推出升級版Arm架構的Cortex-A77。Arm如何推動其新微架構的IPC,以及這將如何轉化為即將到來的2019年末/2020年初的SoC和器件的實際性能。國產單片機代理商深圳英銳恩科技為您解析。
Deimos轉向Cortex-A77
鑒于Arm仍舊保持著每年發布IP的節奏,Cortex-A77的發布并不讓人意外。事實上,今天并不是Arm第一次談論A77:去年8月,Arm在發布2020年前的性能路線圖時調侃了CPU核心:
代號為“Deimos”的新款Cortex-A77繼承了Cortex-A76的設計,并遵循Arm的發展軌跡,每一代Arm的Austin系列CPU都將帶來持續穩定的20-25%的性能提升。
Cortex-A77:頂層概覽
Cortex-A77是A76的直接微架構繼承者,這意味著新核心在很大程度上保持了前代的特性。Arm指出,構建核心時,供應商可以簡單地升級SoC IP,無需付出太多工作。
實際上,這意味著A77在架構上與A76保持一致,仍然是ARMv8.2 CPU核心,旨在與DynamIQ共享單元(DSU)集群內的Cortex-A55小CPU配對。
與前代相比,基本配置特性(如A77的緩存大?。┮矝]有變化:我們仍然看到64KB L1指令和數據緩存,以及256或512KB L2緩存。有趣的是,Arm確實為基礎設施Neoverse N1 CPU核心設計了1MB L2緩存選項(它本身來自A76),但選擇保留客戶端(手機)CPU IP上的較小配置選項。
作為A76的演進,A77的性能提升并不會像預期的那樣令人印象深刻,無論是從微架構的角度看,還是從絕對性能的角度看都是如此,因為我們無法期望即將到來新一代SoC有很大的工藝節點改進。
此處,對于大多數客戶而言,A77的產品預計仍在7nm工藝節點上,Arm也宣稱了與前代類似的3GHz峰值目標頻率。當然,由于頻率預計不會有太大的變化,這意味著核心+20%的性能提升可以完全歸功于IP的微架構變化。
為了實現IPC(每時鐘周期指令數)的提升,Arm對微架構進行了重新設計,并引入了一些巧妙的新特性,這通常會增強CPU IP,從而實現更廣泛、更高性能的設計。
Cortex-A77巡禮:邁向6-Wide前端
Cortex-A76在微架構方面代表了一種全新的設計,Arm從頭開始實現了多年CPU設計的知識和經驗。這使得Arm能夠設計出一種在微架構方面具有前瞻性思維的新核心。A76旨在作為Austin系列接下來兩代設計的基準,即今天的新款Cortex-A77以及明年的“Hercules”設計。
A77推出了新功能,其主要目標是提升微架構的IPC。Arm這一代的目標是繼續專注于提供業界最好的PPA,這意味著設計師的目標是提高核心的性能,同時保持A76核心卓越的能源效率和面積特性。
在頻率方面,新核心保持在與A76相同的頻率范圍內,Arm在最佳實現中以3 GHz峰值頻率為目標。
作為對微架構變化的概述,Arm幾乎觸及了核心的每個部分。從前端開始,我們看到了更高的讀取帶寬,它的分支預測能力翻了一番,新的macro-OP運算緩存結構充當了L0指令緩存,它有更寬的中央核心,解碼器寬度了增加50%,新的整數ALU流水線以及改進的加載/存儲隊列和發布能力。
Cortex-A77今天宣稱的變化并不像我們去年在A76上看到的那樣大,也不像今天新發布的Arm新ValHall GPU架構和G77 GPU IP那樣大。
然而,Arm通過A77成功實現的是繼續執行他們的路線圖,這在競爭環境中是非常重要的。A76實現了Arm的所有承諾,最終成為一個性能極佳的核心,同時保持了驚人的效率,并在密度上明顯領先于競爭對手。在這方面,Arm的主要客戶仍然非常注重在他們的產品中擁有最好的PPA,而Arm也在這方面提供服務。
A77的一大驚喜是,它的浮點性能提升了30~35%,比我對核心的預期要高得多,而在移動領域,網頁瀏覽是恰巧是考驗浮點運算的殺手級應用,所以我期待著未來擁有A77的SoC會有怎樣的表現。
但即使是在整數工作負載中,20~25%的IPC提升也絕對是了不起的改進,我們相信ARM能夠保持A76的能效。功耗將略有上升,但我認為業界已經表明,今天的移動設備可以正確處理至少兩個更高功率的核心,因此未來的SoC應該繼續使用大+中+小CPU配置。
單片機架構在不斷優化升級,智能電子產品單片機方案也在不斷更新換代,深圳英銳恩科技資深的工程團隊與您共同應對智能電子產品的新需求,為您提供定制單片機開發方案服務。