More  

收藏本站

電腦請使用 Ctrl + D 加入最愛
手機請使用 收藏
關閉

小編的世界 優質文選 主機

如何讓服務器實現扛住三倍流量壓力,成本降低40%?


字體大小:
2020年11月07日 -
:       
 

計算雜談

*信息來源於IDC

IDC預計,2020年與疫情相關10個領域的ICT市場商機,總金額會超過1.5萬億
人民幣。其中就包括數字平台與大數據、新型的城市智慧城市與園區、醫療遠程辦公、工業互聯網、5G、數據中心與服務、人工智能、供應鏈管理、制造與服務機器人。

對於企業而言,最大需求只有一個,就是:需要有足夠的算力
來應對這些挑戰!

代號為“Rome”的EPYC(霄龍)

助用戶迎接來自算力的挑戰

那麼,我們需要一個什麼樣的思路去解決企業級用戶所面臨的計算力挑戰呢?

在2020年騰訊全球數字生態大會上,AMD與會並圍繞“實力Zen2架構,賦能企業新基建
”,與行業用戶共同探討了AMD數據中心戰略、第二代EPYC的解決方案與案例以及如何協助企業級用戶解決來自計算力的挑戰等話題。

AMD中國區企業與商用事業部銷售總監周俊傑表示:首先,我們需要有一個可持續發展的CPU跟GPU的架構;第二是需要一套全新、高效率的芯片與系統集成方案;第三是必須有一個開放的生態環境,獲得更多的解決方案供應商支持。只有這樣,才能幫助用戶去迎接新挑戰。

2019年,AMD推出了代號為羅馬(Rome)的第二代EPYC處理器,相比上代產品,無論是性能、核心數量、新技術支持還是安全性等方面都有了長足的進步,在雲計算、虛擬化、高性能計算以及諸多行業應用方面,為用戶帶來了全新的選擇。並解決了很多之前難以實現的性能挑戰,開辟了一個64核的EPYC時代!

AMD EPYC(霄龍)采用了先進的7nm
制程工藝,配備8到64顆
物理核心,包括128個PCIe Gen 4
通道和8個
支持DDR4-3200的高速內存通道,並可訪問高達4TB
的高速內存。EPYC處理器的均衡資源集意味著可以更自由地根據工作負載調整服務器配置的大小。

以EPYC 7742為例,可以看到其每個處理器具有64個核心,基頻為2.25GHz,加速頻率高達3.4GHz。新一代“Rome”基於全新的Zen 2架構,並采用了模塊化設計。在擁有計算核心Die的同時,還有專門的I/O Die,負責輸入輸出控制。

第二代EPYC的CPU架構在IPC(每時脈周期執行指令)效能表現上,相比前代產品提高了15%。另外在執行AVX2指令集的浮點運算效能也有翻倍的提升。此次還加大處理器使用的L3快取,將總容量提高至256MB,進而縮短CPU資料存取時間。

通過采用混合多芯片架構,能夠讓第二代EPYC的處理效能提高兩倍,並具備更強的平行運算處理能力,最大可以提供多達4倍的運算吞吐量(FLOPS)。

現如今第二代EPYC已經打破了上百項世界記錄的性能,其中包括:HPC、浮點計算、整體計算性能、Java性能、DB/ERP業務、能耗指標、大數據分析、雲應用和虛擬化等等,為數據中心服務器定格了新的標杆。64核心是當前服務器處理器中的最多數量,遠遠地將競爭對手甩在了身後。

安全方面,在AMD EPYC中內嵌了一個ARM架構小核心,它可以支持512位的密鑰。也就是說,這一顆CPU可以支持500以上的虛擬機,每一個虛擬機機會有獨立的密鑰。當數據從CPU寫進內存的時候進行加密。因此,如果有人通過各種方式拿到內存中的數據,也是在短時間內難以破解的。為客戶的資產及數據安全提供了完美保障。

新一代AMD EPYC處理器在整個產品線中提供了一致的特性,允許用戶在不犧牲特性、內存通道數量、內存容量或I/O通道數量的情況下優化工作負載所需的核心數量。無論每路的物理核心數量如何,都可以在所有EPYC處理器上訪問8個內存通道

2020年的4月,AMD又推出了三套7Fx2
系列處理器,將主頻進一步提升,使其更加適合超融合、高性能計算、裸金屬等應用。

其中7F32為8核心處理器,功耗僅為180W,最高主頻3.9GHz,相比現款7262/7252產品主頻更高,性價比進一步提升;7F52更高端一些,擁有16顆物理核心,比現款7302的3.0GHz和7282的2.8GHz主頻要高很多,最高可以達到3.9GHz。

7F72是最高端產品,擁有24顆核心,比現款的7402/2.8GHz和7352/2.3GHz處理器主頻高出一個級別,最高達到了3.7GHz。值得一提的是,在保持高主頻的同時,它能夠將每核心成本進一步降低,這一點相信會深得超融合、數據庫和HPC等應用的青睞。

今年推出的7Fx2系列則是更有針對性地對產品進行了細分,這些領域就包括超融合、裸金屬、高性能計算、數據庫應用和刀片服務器

AMD發力超融合市場,有著自己的核心優勢。計算力方面,超多的核心數量以及性能本身就表現出色,7Fx2系列更是將主頻提升一個檔次,進一步符合超融合的需求。據資料顯示,行業用戶曾經做過測試,每秒1100萬Java運算,將處理器換成EPYC之後,只需要33台128核心的服務器,就可以替換掉原來的60台服務器。單CPU的能力提高了83%,節省了45%的服務器,整個TCO節省了44%。足見EPYC強大的計算性能。

“萬能”的SA2實例,

AMD與騰訊雲深度合作的結晶

既然是在2020年騰訊全球數字生態大會上,那麼肯定會有更精彩的內容發布。9月11日下午,AMD與騰訊雲簽署了戰略合作協議,共同建立“技術創新聯合實驗室
”。

SA2是基於騰訊全新自研的星星海服務器,軟硬件完全屬於騰訊自主知識產權,並進行了高度的適配,提高了性能與穩定性,是AMD與騰訊深度合作的結晶。

SA2服務器提供了一個非常彈性靈活的算力,可以靈活的選配從1核到180核
的雲服務器規格,全面釋放技術紅利。比上一代的產品提升了35%
以上的性能,極大降低了用戶上雲成本。幾乎可以覆蓋到騰訊99%
的業務場景,同時可以支持騰訊雲容器
產品。這款深度定制的星星海服務器,從它的內部設計、管理、安全可靠性等方面都非常適配騰訊整個運維體系,構建了一套專業、可信、紮實可靠的基礎架構。

在後疫情時代,星星海SA2實例非常好的支持了整個騰訊業務部署,包括騰訊會議、QQ等應用,實現了8天擴容100萬核,擴容能力在業界處於領先地位。

特別是在2020年春節期間,QQ紅包使用了星星海的實例,扛住了三倍於以往的瞬間流量,也使綜合能力提升35%以上。騰訊廣告也同時在使用該實例來做他的廣告檢索模塊,業務比上一代產品降低了25%的延遲,成本降低了40%。

將性能發揮極致,

高性能計算繼續保持優勢

對於企業級用戶而言,代號為“Rome”的EPYC處理器最直觀印象就是:業界獨有的64核心128線程!對於HPC應用而言,它所帶來的改變將是翻天覆地。

工程仿真、結構分析、有限元分析、生產建模以及流體動力
方面,相比上一代產品,Rome核心EPYC能夠分別帶來58%、72%、79%、95%和95%的性能提升,可稱得上質的飛躍!

此外,AMD與美國能源部、橡樹嶺國家實驗室和Cray公司聯合宣布了預期世界上最快的百億億級超級計算機,並定於2021年交付給橡樹嶺國家實驗室。為實現預期超過 1.5 百億億次的預期處理性能,Frontier 系統設計使用未來新一代為高性能計算(HPC)和人工智能(AI)優化的AMD霄龍處理器和AMD Radeon Instinct 計算卡。

據了解,ORNL研究人員將使用Frontier系統及下一代AI技術,進行模擬和建模,以進一步探究天氣、亞原子機構、基因組學、物理和其他重要科學領域的深層次相互作用。

軟硬結合,GPU為數據中心錦上添花

在此次大會上,AMD還帶來了最新的GPU和CDNA架構。

據AMD數據中心GPU事業部資深市場開發經理秦驊介紹,CDNA架構會專注於計算性能,從而加速機器學習、高性能計算,而且可以通過Infinity Fabric互連總線提升多卡性能,並支持增強的企業級RAS特性、安全、虛擬化技術。

AMD Radeon Instinct MI50加速卡基於全球首款7nm GPU。具有靈活的混合精度能力,搭載高性能計算單元,能夠處理多種類型的工作負載,包括一系列的HPC和深度學習應用程序。AMD Radeon Instinct MI50加速卡可以高效地處理工作流,比如快速訓練複雜的神經網絡,為數據中心和部門部署提供更高級別的浮點性能,全面的功能和更優的系統高效性。此外Radeon Instinct MI50支持PCIe Gen4 總線接口,從而可以和Zen架構的霄龍高效協同。

此外,AMD還發布了用於加速計算的全新ROCm開放式軟件平台,該平台支持新加速器的架構特性,包括具有優化性的深度學習操作(DLOPS)和AMD Infinity Fabric Link GPU互聯技術。ROCm為規模化而設計,允許客戶在開放式的環境中部署高性能、高能效的異構計算系統。

怎麼樣,AMD此次帶來的幹貨確實夠硬吧,自“Rome”問世以來,AMD一路披荊斬棘地將企業級市場份額提升至兩位數,並且屢屢斬獲行業用的大單,生態建設方面硬件合作夥伴也從2017年的22個極速拓展至140個,並且與騰訊雲這樣的龍頭企業簽約了深度合作。

總體來看AMD近兩年的發展已經步入了一個新的階段,行業深耕與生態建設將成為新的重點。同時,面對未來更加苛刻的計算需求,我們是不是也該期待下一代EPYC“Milan”的到來呢!