
智通财经APP获悉,Deepseek于开源周第三天文书开源DeepGEMM。DeepGEMM是一个专为大略高效的FP8通用矩阵乘法(GEMM)想象的库,具有细粒度缩放功能,如DeepSeek-V3中所建议。它解救鄙俗和夹杂群众(MoE)分组的GEMM。该库经受CUDA编写,在安设历程中无需编译,通过使用轻量级的即时编译(JIT)模块在起先时编译通盘内核。FP8GEMM库,为V3/R1老练和推理提供解救。 DeepSeek开源周第二日(2月25日),DeepSeek官宣开源DeepEP,第一个用

智通财经APP获悉,Deepseek于开源周第三天文书开源DeepGEMM。DeepGEMM是一个专为大略高效的FP8通用矩阵乘法(GEMM)想象的库,具有细粒度缩放功能,如DeepSeek-V3中所建议。它解救鄙俗和夹杂群众(MoE)分组的GEMM。该库经受CUDA编写,在安设历程中无需编译,通过使用轻量级的即时编译(JIT)模块在起先时编译通盘内核。FP8GEMM库,为V3/R1老练和推理提供解救。
DeepSeek开源周第二日(2月25日),DeepSeek官宣开源DeepEP,第一个用于MoE模子老练和推理的开源EP通讯库。特色有:高效、优化的全员疏导;节点内和节点间均解救NVLink和RDMA;用于老练和推理预填充的高模糊量内核;用于推意会码的低延伸内核;原生FP8休养解救;生动的GPU资源放胆,收尾蓄意-通讯肖似。
2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。2月21日,DeepSeek在外交平台发文称,构建了一支探索AGI(通用东谈主工智能)的小团队,将开源5个代码库,以足够透明的模式共享商议推崇。
【免责声明】本文仅代表作家本东谈主不雅点开云体育,与和讯网无关。和讯网站对文中述说、不雅点判断保执中立,差异所包含本体的准确性、可靠性或完好意思性提供任何昭示或示意的保证。请读者仅作参考,并请自行承担一谈背负。邮箱:news_center@staff.hexun.com