您現(xiàn)在的位置:海峽網(wǎng)>新聞中心>IT科技>科技前沿
分享

DeepSeek“開源周”第二日,DeepSeek宣布開源DeepEP,第一個用于MoE模型訓(xùn)練和推理的開源EP通信庫。

昨天,DeepSeek則開源了代碼庫Flash MLA,這是針對Hopper GPU優(yōu)化的高效MLA解碼內(nèi)核,針對可變長度序列作了優(yōu)化。

MoE(混合專家架構(gòu))和MLA(多頭潛在注意力機制)被認為是DeepSeek以低成本實現(xiàn)杰出表現(xiàn)的核心原因。

簡單理解,MoE架構(gòu)是由多個專注于垂直技能的專家模型分工協(xié)作來實現(xiàn)最終輸出結(jié)果,訓(xùn)練成本和推理成本更低。有消息稱,GPT-4就使用了MoE架構(gòu),由8個220B模型組成。但MoE架構(gòu)的缺點之一是會增加通信成本。

DeepEP通信庫就是針對通信環(huán)節(jié)的優(yōu)化,其特點包括:高效、優(yōu)化的全員溝通;節(jié)點內(nèi)和節(jié)點間均支持 NVLink 和 RDMA;用于訓(xùn)練和推理預(yù)填充的高吞吐量內(nèi)核;用于推理解碼的低延遲內(nèi)核;原生 FP8 調(diào)度支持;靈活的 GPU 資源控制,實現(xiàn)計算-通信重疊。

MLA則是讓模型預(yù)測更遠位置的token,從而增強語義理解能力。DeepSeek的Flash MLA專為英偉達Hopper GPU打造了高效MLA解碼內(nèi)核,特別針對變長序列進行了優(yōu)化。

責(zé)任編輯:黃學(xué)焚

       特別聲明:本網(wǎng)登載內(nèi)容出于更直觀傳遞信息之目的。該內(nèi)容版權(quán)歸原作者所有,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)。如該內(nèi)容涉及任何第三方合法權(quán)利,請及時與ts@hxnews.com聯(lián)系或者請點擊右側(cè)投訴按鈕,我們會及時反饋并處理完畢。

最新科技前沿 頻道推薦
進入新聞頻道新聞推薦
央行二月縮量續(xù)做MLF 適度寬松貨幣政策
進入圖片頻道最新圖文
進入視頻頻道最新視頻
一周熱點新聞
下載海湃客戶端
關(guān)注海峽網(wǎng)微信
?

職業(yè)道德監(jiān)督、違法和不良信息舉報電話:0591-87095414 舉報郵箱:service@hxnews.com

本站游戲頻道作品版權(quán)歸作者所有,如果侵犯了您的版權(quán),請聯(lián)系我們,本站將在3個工作日內(nèi)刪除。

溫馨提示:抵制不良游戲,拒絕盜版游戲,注意自我保護,謹防受騙上當(dāng),適度游戲益腦,沉迷游戲傷身,合理安排時間,享受健康生活。

CopyRight ?2016 海峽網(wǎng)(福建日報主管主辦) 版權(quán)所有 閩ICP備15008128號-2 閩互聯(lián)網(wǎng)新聞信息服務(wù)備案編號:20070802號

福建日報報業(yè)集團擁有海峽都市報(海峽網(wǎng))采編人員所創(chuàng)作作品之版權(quán),未經(jīng)報業(yè)集團書面授權(quán),不得轉(zhuǎn)載、摘編或以其他方式使用和傳播。

版權(quán)說明| 海峽網(wǎng)全媒體廣告價| 聯(lián)系我們| 法律顧問| 舉報投訴| 海峽網(wǎng)跟帖評論自律管理承諾書

友情鏈接:新聞頻道?| 福建頻道?| 新聞聚合