小編的世界 優質文選 主機
字體大小:
2020年12月30日 -
:
DeepTech深科技
DeepTech深科技官方百家號
圖 | 騰訊雲星星海首款自研 GPU 服務器
“一獨” 指的是在設計上,該 GPU 服務器采用全球首創的、可在同一框架內靈活更換的主板,此外還克服了通用計算和異構計算兼容對系統的挑戰,做到支持多平台兼容。
“三最” 分別指的是最大密度、最短機框和最高可用性。該 GPU 服務器可結合業務對 PCIe 帶寬要求低的特點,來支持 16 卡 GPU 和 4 路 Intel 服務器,是目前業界密度最高的 GPU 服務器,故此可使單卡 TCO 大幅降低。它還擁有目前業界最短機框,可支持邊緣部署,在提高帶寬穩定性的同時,還能極大降低業務延時,最高可降近百毫秒。此外,基於該 GPU 服務器的 RAS 特性以及 PCIe 熱插拔特性,遇到單 GPU 卡故障,也不會對整機產生影響,因此用戶可用性相對較高。
而以上這些技術還可以讓星星海首款自研 GPU 服務器在與對手同台競技時擁有以下優勢:
低成本:由於大多數的 AI 工作任務被認為是 “突發性” 的,也就是說,他們依賴於那些能夠在短時提供大量計算能力的服務。星星海 GPU 服務器只會針對用戶去收取那些他們進行硬件使用時的費用,這大大降低了他們的成本。
可擴展:與其他的雲服務一樣,星星海首款自研 GPU 服務器提供的 AI 雲服務本身也具有較高的可擴展性。企業可以從一個試點項目開始,然後隨著需求的提升,快速擴展他們 AI 服務的規模。
高可用:一般來講雲計算的可用性,會比傳統架構的系統高出兩個量級,而星星海服務器在高可用方面更有獨到的設計,在高可用方面相信還會更有保證。
星星海自研服務器 - 雲算力底座的最強神器
像金融領域一樣,目前的技術也開始朝著普惠的方向轉變,並且還應滿足客戶的個性化與定制化需求,達到快速響應,而這些都需要強大的算力支撐。
但是,如騰訊雲服務器與供應鏈管理部總經理劉裕勳所說,隨著雲計算承載的業務規模越來越大,傳統服務器難以完全滿足雲計算數據中心場景下對超大規模、需求多樣、高性價比、安全可靠以及軟硬件一體化等方面的要求。
騰訊雲星星海發布的新一代自研雙路服務器就是算力底座中的王者。這款服務器是國內首款搭載即將發布的第三代英特爾至強可擴展處理器(Ice Lake)的雙路服務器。
圖 | 騰訊雲星星海新一代自研雙路服務器
該服務器是雲服務的硬件基礎,采用英特爾 10nm 工藝處理器。在第二代英特爾傲騰持久內存的支持下,雙路服務器單機最高支持 12TB 內存,這可滿足大型數據庫等業務需求,用戶也可獲得更強的計算性能。
另外,雙路服務器的免工具模組化設計,可使全系列服務器共用成為現實,這不僅能覆蓋全業務場景,還能實現彈性部署,且可降低雲服務總體成本。
在安全技術上,雙路服務器采用英特爾 SGX 技術,最大可支持 1TB enclave;其還采用加密加速技術,在增強安全性的同時,還可滿足創新雲業務的安全需求。
概括來說,其不僅能為用戶提供更高的內存帶寬、更快的 I/O 吞吐、更強的實例性能,還可幫助用戶基於英特爾深度學習加速技術,來獲得處理器內置 AI 加速能力。主要應用場景有通用計算、異構計算、裸金屬、高性能計算等。此外,在生命科學和金融服務領域,基於英特爾 AVX-512 擴展指令集,騰訊雲星星海新一代自研雙路服務器對應的服務器實例在高性能計算機群場景下表現出較大提升。
除立足於當下,以上兩款服務器也已為將來做准備,基於硬件系統架構設計和持續不斷的基礎技術研究,上述服務器可支持未來 3-5 年的前瞻性架構演變,也就是說雲上開發部署可以提前享受技術紅利。
騰訊雲星星海 - 追逐科技時代的星辰大海
如果將數據比作這個數字時代的石油,那麼騰訊社交帝國憑借其豐富的業務場景與龐大的用戶基數,就為其科研團隊提供了世界上最大的原油儲存基地,這些都為前沿的 AI 研究成果提供了令整個業界都非常羨慕的絕佳 “訓練場”,而擁有了這樣高的訓練水平,騰訊技術方面取得如此的突破也就不足為奇了。
據悉,上述兩款自研服務器均誕生於騰訊雲星星海實驗室,它是騰訊史上首個硬件工程實驗室,也是騰訊雲面向產業互聯網加速技術自研的重要戰略。
該實驗室至今未滿一歲,其名字取自青海省果洛藏族自治州瑪多星星海,瑪多星星海地處黃河源頭,這樣的命名既預表著該實驗室兼具靈動和智慧,亦是科技對古老的致敬。
該實驗室主要專注於硬件系統架構設計和前瞻性基礎技術研究,力圖通過創新性高兼容架構、簡潔可靠的自主設計,來提供雲計算產品和服務,其目前正結合騰訊自有業務和上雲客戶的需求,在雲原生服務器技術方面開展專項研發,此外其也是騰訊雲與智慧產業事業群技術實驗室矩陣中的一所。
“以硬為主” 的星星海,已擁有 20 多項專利和多款自主知識產權產品,其中包括四款自研服務器和一款智能網卡。
以 2019 年騰訊雲發布的首款擁有完全自主知識產權的服務器產品星星海 SA2 雲服務器為例,其已廣泛應用於騰訊內部,如騰訊會議、騰訊教育、春節 QQ 紅包、微信等產品和業務中。在疫情期間,星星海 SA2 雲服務器支撐騰訊會議擴容 10 萬多台雲主機,日均擴容雲主機近 1.5 萬台,共涉及超百萬核的計算資源投入,而以上工作量均在 8 天內完成。
最後不得不提的就是上述兩款服務器,均發布於騰訊 2020 Techo Park 開發者大會。
什麼是 Techo 呢?據大會虛擬主持人 “小七” 的介紹,所謂 Techo,就是 Tech(技術)和 Echo(回響)的合稱,暗含著這一面向全球開發者和技術愛好者的平台具有的技術交流和分享屬性。這個由騰訊發起的非商業大會,通過匯聚全球頂尖行業專家、企業高管、技術愛好者等共同研討前沿技術,以助力開發者實現能力成長和實踐創新。
本次 Techo Park 開發者大會的 Slogan 是 “代碼傳遞思想,技術創造回響”,區塊鏈、視頻雲、5G、AI、大數據等各個信息科技領域的 “大腦” 發表主題演講和論壇,並吸引了來自科研機構、高校、創業公司的大批開發者齊聚現場。
盡管這只是 Techo Park 的第二次全球亮相,但其激烈碰撞的觀點和接連發布的自研新品,仍然為試圖洞察未來科技走向的參與者們打開了一扇窗。