![]() 香港飛龍.online 官方授權發布的第4代「香港飛龍」標誌 本文内容: 如果您希望可以時常見面,歡迎標星收藏哦~來源:內容編譯自serverthehome。近日,博通(Broadcom)推出了其下一代交換機ASIC——博通Tomahawk6系列。這是一款全新的102.4Tbps交換機,最多可處理64個1.6TbE端口。沒錯,我們正在用“太比特”以太網端口時代取代“千兆比特”時代。博通BCM78910和BCM78914這兩款全新ASIC針對不同的應用提供了兩種不同的配置。除了更高的帶寬外,新的交換芯片還需要SerDes來爲端口供電,並改善負載平衡和遙測性能。我們有博通的發佈會,大致強調了這些要點。這些新型交換機的理念是,它們可以縱向擴展或橫向擴展。縱向擴展是一種選擇,即在較少數量的節點之間提供巨大的帶寬。橫向擴展則是一種選擇,即連接大量加速器和節點。在擴大規模方面,這裏展示了HBM4切換帶寬的可怕之處。在擴大規模方面,需要擴大到數十萬個加速器甚至更多。新芯片的巧妙功能之一是可選擇共封裝光學器件以及512x200GPAM4或1024x100GPAM4。使用200GPAM4選項,可以在單個交換機上配置多達512個XPU。(512x200G=102.4Tbps。)在橫向擴展方面,如果您僅使用200GbE,則意味着您擁有更大的基數,因此可以使用更少的網絡交換層。使用更少的交換機和交換機層級的優勢並不在於每臺交換機的成本。通常情況下,新交換機的成本高於舊交換機。節省的成本來自於更少的交換機數量以及更少的光纖、線纜、電源等等。此外,通過減少跳數,還可以降低延遲。有了Tomahawk6,我們獲得了新的全球負載平衡2.0。新的認知路由有助於平衡整個網絡路徑的負載。一箇簡單的模型是,隨着越來越多的設備高速運行,網絡在數據傳輸方式上需要變得更加智能。我們將讓您閱讀有關認知路由2.0的這張幻燈片。此外,雲提供商等運營商也在不斷推動更好的遙測技術。博通還提供了多種用於連接發射臺上滑行的設備的選擇。該公司不僅生產交換機,還生產網卡等。這是爲大家提供的擴展以太網圖。到處都使用Broadcom的交換機和NIC。總結起來,Tomahawk6基本上是一款102.4Tbps交換機,支持高達1.6Tbps的鏈路,並具有不同的SerDes選項。除此之外,還有一些新功能可以處理更高的速度。過去幾周,我看到了三款不同的Tomahawk6交換機。在此次發佈之前,它們被簡單地列爲102.4T交換機。對很多人來說,102.4Tbps是一箇隨意的數字。近年來,全球互聯網帶寬在1200-1700Tbps之間,這只是爲了更好地理解這個數字。需要明確的是,向超以太網和更快交換速度的轉變是件好事,能夠以更少的交換層級擴展到更大的網絡拓撲也同樣重要。在人工智能集羣不斷增長的世界中,網絡成本高昂,而且耗電量巨大。博通現在擁有市場上最大的交換機ASIC。博通面臨的一箇更普遍的重大挑戰是,NVIDIA正在有效地將其加速器生態系統對非NVIDIA網卡和PCIe交換機關閉。博通也生產許多定製的XPU和AI加速器,因此它在AI領域擁有舉足輕重的地位。感覺市場正在開始分化。NVIDIA憑藉此舉終結了博通在傳統AI領域的競爭在2025年臺北國際電腦展(Computex2025)上,一項公告震驚了整個AI服務器行業。NVIDIA發佈了一款新的參考板,更新了8-GPUPCIe設計,徹底改變了未來8-GPUPCIe服務器的構建方式。對於服務器OEM/ODM廠商來說,這被普遍視爲一種削弱其差異化努力的方式。對於博通(Broadcom)以及某種程度上AsteraLabs來說,這實際上鎖定了其產品市場。此外,它還提供了一種功能,當我們在2025年晚些時候看到NVIDIA的下一代GPU問世時,這項功能將至關重要。因此,瞭解一下此次公告的內容以及將產生的影響似乎是個不錯的主意。如果你回顧一下2015年前的設計,你會看到許多8-GPUPCIe服務器。那時NVLink交換機尚未問世,深度學習研究的常用模型是將8到10塊NVIDIAGeForce顯卡塞進一臺服務器。到2017年,這一模式已經轉移到GeForceGTX1080Ti一代,我們開始看到一些大型系統使用Mellanox顯卡進行相對低端的互連。即使在那時,我們也看到數百甚至數千塊GPU的部署都採用類似的架構。其基本架構是將英特爾至強CPU的PCIe通道連接到一塊PCB上,該PCB上既有用於GPU的PCIe插槽,也有博通PCIe交換機。在2017年,NVLink和許多橫向擴展(NCCL)技術尚未真正普及之前,這種架構的一箇優勢是,公司可以決定使用單個PCIe根聯合體,GPU之間的通信僅通過PCIe交換機板進行。這使得P2P流量可以在GPU之間進行,而無需一路傳輸到CPU,從而避免潛在的插槽間鏈路速度變慢。另一種選擇,也是最終變得更加普遍的選擇,是使用多組PCIe交換機,並將這些PCIe交換機連接到幾個GPU和兩個CPU。NVIDIA限制了GeForce上的NCCL,迫使客戶購買更高端的顯卡,但在此過程中,使用多箇PCIe交換機變得更容易接受。如果您想瞭解2017年多GPUPCIe板的示例,請看這裏。如您所見,四個PEX8747PCIe交換機分別連接到CPU和兩個GPU。此外,還提供了用於網卡和其他擴展(例如存儲)的額外插槽。PEX這個名字可以追溯到PLX的舊時代。PLX被Avago收購,後來更名爲Broadcom。收購後,組件價格飆升,這實際上對行業中全NVMe閃存的採用產生了顯著影響。Microsemi/Microchip曾有另一條交換機產品線,但近幾代產品競爭力不足。相反,我們看到像AsteraLabs這樣的新貴進入了這個市場,其PCIe交換機通常在PCIe子板上有四個交換機。以下是一款8xPCIeGPU服務器的框圖,需要注意的是,DDR5鏈路應該連接到CPU,而不是PCIe交換機。類似的交換式架構,即在每個CPU上使用多箇PCIe(Gen5)x16根,然後PCIe交換機連接到多箇GPU,這種架構仍然在實踐中。這裏需要強調一些非常重要的點。多年來,網卡(NIC)已從連接到CPU遷移到連接到PCIe交換機。這種配置允許GPU直接與NIC通信,而無需經過CPU及其PCIe根複合體。網卡的數量也從系統中可能一箇增加到每兩個GPU一箇。在此配置中,我們在PCIe交換機上使用NVMe存儲,就像我們在HGX8-GPU平臺上看到的GPUDirect存儲一樣。https://www.servethehome.com/broadcom-tomahawk-6-launched-for-1-6tbe-generation/半導體精品公衆號推薦專注半導體領域更多原創內容關注全球半導體產業動向與趨勢*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅爲了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。今天是《半導體行業觀察》爲您分享的第4056期內容,歡迎關注。『半導體第一垂直媒體』實時專業原創深度公衆號ID:icbank喜歡我們的內容就點“在看”分享給小夥伴哦 (本文内容不代表本站观点。) --------------------------------- |