Atlas 900 AI 訓(xùn)練集群介紹
在大型數(shù)據(jù)集上進(jìn)行訓(xùn)練的神經(jīng)網(wǎng)絡(luò)架構(gòu)涵蓋從圖像識別、自然語言處理、視頻實(shí)時(shí)分析和智能推薦系統(tǒng)等各個(gè)方面,訓(xùn)練這些神經(jīng)網(wǎng)絡(luò)模型需要大量浮點(diǎn)計(jì)算能力。近年來單個(gè)AI處理器算力和訓(xùn)練方法上均取得了重大進(jìn)步,但是在單一機(jī)器上,AI訓(xùn)練所需要的時(shí)間仍然長得不切實(shí)際,因此需要借助大規(guī)模分布式AI集群環(huán)境來提升神經(jīng)網(wǎng)絡(luò)訓(xùn)練系統(tǒng)的浮點(diǎn)計(jì)算能力。
此次發(fā)布的Atlas 900 AI訓(xùn)練集群由數(shù)千顆昇騰910 AI處理器互聯(lián)構(gòu)成,是當(dāng)前全球最快的AI訓(xùn)練集群,代表了當(dāng)今全球的算力巔峰。其總算力達(dá)到256P~1024P FLOPS @FP16,相當(dāng)于50萬臺PC的計(jì)算能力。
Atlas 900 AI訓(xùn)練集群領(lǐng)先技術(shù)優(yōu)勢
AI算力業(yè)界領(lǐng)先
Atlas 900 AI訓(xùn)練集群采用業(yè)界單芯片算力最強(qiáng)的昇騰910 AI處理器,每顆昇騰910 AI處理器內(nèi)置32個(gè)達(dá)芬奇AI Core,單芯片提供比業(yè)界高一倍的算力(256TFLOPS@FP16)。Atlas 900 AI訓(xùn)練集群將數(shù)千顆昇騰910 AI處理器互聯(lián),打造業(yè)界第一的算力集群。
昇騰910 AI處理器采用SoC設(shè)計(jì),集成“AI算力、通用算力、高速大帶寬I/O”,大幅度卸載Host CPU的數(shù)據(jù)預(yù)處理任務(wù),充分提升訓(xùn)練效率。
最佳集群網(wǎng)絡(luò)
Atlas 900 AI訓(xùn)練集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯(lián)方式,百TB全互聯(lián)無阻塞專屬參數(shù)同步網(wǎng)絡(luò),降低網(wǎng)絡(luò)時(shí)延,梯度同步時(shí)延縮短10~70%。
在AI服務(wù)器內(nèi)部,昇騰910 AI處理器之間通過HCCS高速總線互聯(lián);昇騰910 AI處理器和CPU之間以最新的PCIe 4.0(速率16Gb/s)技術(shù)互聯(lián),其速率是業(yè)界主流采用的PCIe 3.0(8.0Gb/s)技術(shù)的兩倍,使得數(shù)據(jù)傳輸更加快速和高效。在集群層面,采用面向數(shù)據(jù)中心的CloudEngine 8800系列交換機(jī),提供單端口100Gbps的交換速率,將集群內(nèi)的所有AI服務(wù)器接入高速交換網(wǎng)絡(luò)。
獨(dú)創(chuàng)iLossless 智能無損交換算法,對集群內(nèi)的網(wǎng)絡(luò)流量進(jìn)行實(shí)時(shí)的學(xué)習(xí)訓(xùn)練,實(shí)現(xiàn)網(wǎng)絡(luò)0丟包與E2E μs級時(shí)延。
責(zé)任編輯:楊林宇
特別聲明:本網(wǎng)登載內(nèi)容出于更直觀傳遞信息之目的。該內(nèi)容版權(quán)歸原作者所有,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。如該內(nèi)容涉及任何第三方合法權(quán)利,請及時(shí)與ts@hxnews.com聯(lián)系或者請點(diǎn)擊右側(cè)投訴按鈕,我們會及時(shí)反饋并處理完畢。
- 華為“企業(yè)智慧屏”曝光,可連接電腦和手機(jī)2020-02-21
- 華為回應(yīng)美司法部提起新訴訟:新指控缺乏依據(jù)2020-02-14
- 華為手機(jī)新設(shè)計(jì)專利曝光:后置“X”五攝2020-01-21
已有0人發(fā)表了評論