2021-11-08 10:13:21|已瀏覽:1669次

首先,回顧下計算機和服務(wù)器基礎(chǔ)知識,參考文章“計算系統(tǒng)架構(gòu)概述”、“服務(wù)器硬件體系架構(gòu)淺析”和“服務(wù)器基礎(chǔ)知識全解”。
計算系統(tǒng)架構(gòu)概述
服務(wù)器硬件體系架構(gòu)淺析
本文轉(zhuǎn)載自機器之心,原文標題為《計算機架構(gòu)的新黃金時代,兩位圖靈獎得主最新力作》。先分享我對這篇文章的總結(jié),或者我得到的啟發(fā):
1、DSA(Domain-Specific Architectures,特定領(lǐng)域的體系結(jié)構(gòu))
將成為未來十年甚至更長時間,計算機體系結(jié)構(gòu)的趨勢。登納德縮放定律結(jié)束、摩爾定律衰退,而阿姆達爾定律正當其時,這意味著低效性將每年的性能改進限制在幾個百分點。獲得更高的性能改進需要新的架構(gòu)方法,就是DSA。
2、開放的 ISA,處理器領(lǐng)域的Linux
計算機架構(gòu)的第二個機會是開放的 ISA(Instruction Set Architecture,指令集合架構(gòu)),要創(chuàng)建處理器領(lǐng)域的Linux。
這讓我想起了2021年7月27日OCP China Day的第二演播廳(詳見視頻:數(shù)據(jù)處理怎么能變更快?),接受IT大嘴巴(劉策)的采訪時,因西部數(shù)據(jù)Bill 劉總的啟發(fā),得出:開放計算未來十年,除了在系統(tǒng)級(整機柜、機架服務(wù)器、邊緣服務(wù)器等),組件級(OAI、NVMe SSD、NIC 3.0、DPU等),還將在芯片級(如RISC-V、英偉達NVDLA)大有作為。
3、硬件也可以敏捷開發(fā)
借助電子計算機輔助設(shè)計(ECAD)工具,使得敏捷開發(fā)成為可能;這種更高水平的抽象增加了設(shè)計的重用性。從設(shè)計交付到返回芯片原來需要幾個月時間,現(xiàn)在可能四周左右。
4、體系結(jié)構(gòu)的幾個定律
1)摩爾定律(Moore's Law)
摩爾(Gordon Moore)在 1965 年的最初預(yù)測中,稱晶體管密度會每年翻一番;1975 年,他又預(yù)計每兩年翻一番。
2)登納德縮放定律(Dennard scaling)
羅伯特·登納德(Robert Dennard)預(yù)測隨著晶體管密度的增加,每個晶體管的能耗將降低,因此硅芯片上每平方毫米上的能耗幾乎保持恒定。由于每平方毫米硅芯片的計算能力隨著技術(shù)的迭代而不斷增強,計算機將變得更加節(jié)能。然而,登納德縮放定律從 2007 年開始大幅放緩,2012 年左右接近失效(見圖 3)。
1986 年至 2002 年間,指令級并行(ILP)是提高性能的主要架構(gòu)方法。而且隨著晶體管速度的提高,其性能每年能提高 50% 左右。登納德縮放定律的終結(jié)意味著工程師必須找到更加高效的并行化利用方法。
為了保持工作流程完整,需要預(yù)測分支,并根據(jù)推測將代碼放入工作流程中以便執(zhí)行。推測的使用是 ILP 高性能和芯片低能效的源頭所在。如果分支預(yù)測完美,推測就能提高 ILP 性能,但能耗會增加一些——甚至可能節(jié)約能耗——但如果分支預(yù)測出現(xiàn)失誤,處理器就必須拋棄錯誤的推測指令,其計算工作及所耗能量就會付之東流。處理器的內(nèi)部狀態(tài)也必須恢復(fù)到錯誤預(yù)測分支之前的狀態(tài),這將花費額外的時間和能量。
很少有通用程序能夠如此準確地預(yù)測分支。架構(gòu)師需要一種不同的方法來實現(xiàn)性能改進。于是多核時代就這樣誕生了。
多核將識別并行性和決定如何利用并行性的責(zé)任轉(zhuǎn)移給程序員和語言系統(tǒng)。多核并不能解決由登納德縮放定律終結(jié)帶來的能效計算挑戰(zhàn)。每個活躍的核都會消耗能量,無論其對計算是否具有有效貢獻。一個主要的障礙可以用阿姆達爾定律(Amdahl's Law)表述。
3)阿姆達爾定律(Amdahl's Law)
IBM360系列機的主要設(shè)計者阿姆達爾于1967年提出。
該定律指出:系統(tǒng)中對某一部件采用更快執(zhí)行方式所能獲得的系統(tǒng)性能改進程度,取決于這種執(zhí)行方式被使用的頻率,或所占總執(zhí)行時間的比例。阿姆達爾定律實際上定義了采取增強(加速)某部分功能處理的措施后可獲得的性能改進或執(zhí)行時間的加速比。簡單來說是通過更快的處理器來獲得加速是由慢的系統(tǒng)組件所限制。
阿姆達爾曾致力于并行處理系統(tǒng)的研究。對于固定負載情況下描述并行處理效果的加速比s,阿姆達爾經(jīng)過深入研究給出了如下公式:S=1/(1-a+a/n)
其中,a為并行計算部分所占比例,n為并行處理結(jié)點個數(shù)。這樣,當1-a=0時,(即沒有串行,只有并行)最大加速比s=n;當a=0時(即只有串行,沒有并行),最小加速比s=1;當n→∞時,極限加速比s→ 1/(1-a),這也就是加速比的上限。例如,若串行代碼占整個代碼的25%,則并行處理的總體性能不可能超過4。
本文由培訓(xùn)無憂網(wǎng)牛耳教育專屬課程顧問整理發(fā)布,希望能夠?qū)ο朐陂L沙學(xué)習(xí)系統(tǒng)架構(gòu)師培訓(xùn)的同學(xué)有所幫助。更多系統(tǒng)架構(gòu)師培訓(xùn)課程歡迎關(guān)注培訓(xùn)無憂網(wǎng)系統(tǒng)架構(gòu)師培訓(xùn)培訓(xùn)頻道或添加老師微信:15033336050
注:尊重原創(chuàng)文章,轉(zhuǎn)載請注明出處和鏈接 http://www.hebeijilong.cn/news-id-3291.html 違者必究!部分文章來源于網(wǎng)絡(luò)由培訓(xùn)無憂網(wǎng)編輯部人員整理發(fā)布,內(nèi)容真實性請自行核實或聯(lián)系我們,了解更多相關(guān)資訊請關(guān)注系統(tǒng)架構(gòu)師頻道查看更多,了解相關(guān)專業(yè)課程信息您可在線咨詢也可免費申請試課。關(guān)注官方微信了解更多:150 3333 6050