正文

現(xiàn)代戰(zhàn)爭3數(shù)據(jù)包( 現(xiàn)代戰(zhàn)爭數(shù)據(jù)包3)

5424

使用 Equality 網(wǎng)絡(luò)拓?fù)鋵Χ?exaflops 機(jī)器進(jìn)行性能評估

在現(xiàn)代計算架構(gòu)中,由于核心數(shù)量的增加,圖論是重頭戲。不斷尋找更好的連接核心的方法是必不可少的。本文重新審視了一種新穎的弦環(huán)互連拓?fù)湎到y(tǒng) Equality,以與之前的一些作品進(jìn)行比較。本文詳細(xì)介紹了構(gòu)建 Equality 互連的過程、其特殊路由過程、選擇配置的策略以及使用開源周期精確 BookSim 并評估其性能。提出了代表小型到大型計算設(shè)施的四個場景來評估網(wǎng)絡(luò)性能。這項工作表明,在 16,384 各端點(diǎn)系統(tǒng)中,Equality 網(wǎng)絡(luò)被證明是最有效的系統(tǒng)。結(jié)果還顯示了擴(kuò)展到 48-320K 和一百萬個端點(diǎn)的 Equality 網(wǎng)絡(luò)的穩(wěn)定可擴(kuò)展性。平等網(wǎng)絡(luò)可調(diào)整以適應(yīng)商品硬件,并在十種常見流量模型下具有彈性。建議將 Equality 網(wǎng)絡(luò)拓?fù)溆糜跇?gòu)建高效的 multi-exaflops 超級計算機(jī)和數(shù)據(jù)中心。

 

介紹

高性能計算(HPC)是一種使用高端計算組件來協(xié)同處理普通計算機(jī)無法輕易解決的大規(guī)模任務(wù)的計算類型。計算組件通過 HPC 網(wǎng)絡(luò)連接,以實(shí)現(xiàn)更高的效率。

 

HPC 網(wǎng)絡(luò)與其他網(wǎng)絡(luò)的不同之處在于,它通常尋求同步通信和計算,以便通信不會過多地中斷計算以提高效率。HPC 網(wǎng)絡(luò)還傾向于使用同類計算硬件,例如在整個實(shí)施過程中使用相同型號的交換機(jī)(具有相同數(shù)量的端口)、CPU 和加速器。由于大規(guī)模生產(chǎn),系統(tǒng)中的同質(zhì)產(chǎn)品確保每個組件的價格更低,并且在某些部件出現(xiàn)問題時通過及時更換來更直接地恢復(fù)。

 

黃等人。與一些流行的 HPC 網(wǎng)絡(luò)拓?fù)洌ɡ?2 層胖樹、3 層胖樹、3D 環(huán)面和 5D 環(huán)面)相比,已經(jīng)展示了平等網(wǎng)絡(luò)的潛力。在這項工作中,我們進(jìn)一步分析了不同規(guī)模的 Equality 網(wǎng)絡(luò)的性能,以與 Slim Fly、Dragonfly 和兩種流行的網(wǎng)絡(luò)拓?fù)?Fat-tree 和 Tori 進(jìn)行比較。我們還擴(kuò)展了對應(yīng)用 Equality 網(wǎng)絡(luò)的關(guān)注,以使機(jī)器能夠根據(jù)當(dāng)前的硬件工藝達(dá)到 multi-exaflops。

 

當(dāng)前工作不同于以往工作的主要貢獻(xiàn)包括:

 

平等網(wǎng)絡(luò)系統(tǒng)路由表的開發(fā)和實(shí)施,

 

修改后的路由算法 bottleneck-UGAL 避免過度訂閱路徑,

 

除了二分帶寬外,還介紹了一種稱為二分比的新度量,

 

對各種規(guī)模的 Equality 網(wǎng)絡(luò)的結(jié)果網(wǎng)絡(luò)屬性(直徑、平均距離、延遲和吞吐量)的分析以及與其他現(xiàn)有出版物的比較,

 

利用 Equality 網(wǎng)絡(luò)拓?fù)錇槲磥?HPC 系統(tǒng)尋找合適配置的策略,以及

 

BookSim(一個 1 M 端點(diǎn)系統(tǒng))計算過的最大的周期精確模擬。

 

網(wǎng)絡(luò)架構(gòu)

預(yù)先設(shè)計不同的網(wǎng)絡(luò)拓?fù)渫ǔJ菫榱诉m應(yīng)特定的工作負(fù)載而設(shè)計的。為了證明網(wǎng)絡(luò)的質(zhì)量以及它是否適合目標(biāo)應(yīng)用程序工作負(fù)載,可以檢查網(wǎng)絡(luò)的性能指標(biāo)并在網(wǎng)絡(luò)上進(jìn)行額外的模擬。本文中使用的標(biāo)準(zhǔn)網(wǎng)絡(luò)度量包括網(wǎng)絡(luò)直徑d和平均距離a。標(biāo)準(zhǔn)的通信度量是消息延遲和網(wǎng)絡(luò)在不同流量模式和注入強(qiáng)度下的整體吞吐量。

 

一個平衡良好的拓?fù)鋺?yīng)該有一個合理的網(wǎng)絡(luò)直徑,并伴隨著定制的路由算法來減少延遲和增加吞吐量。然而,對于任何應(yīng)用程序,如果特定應(yīng)用程序的所有通信模式在網(wǎng)絡(luò)中使用不超