发布日期:2024-04-11 21:42 点击次数:113
DeepSeek在“开源周”的第二天向公众开源了DeepEP。据先容,DeepEP是第一个用于MoE(夹杂行家)模子磨练和推理的EP(ExpertParallelism,行家并行)通讯库,不错竣事高效且优化的全对全通讯,撑合手包括FP8在内的低精度运算,适配当代高性能绸缪需求。同期,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,ag百家乐老板不仅提供了高糊涂量,还撑合手SM(StreamingMultiprocessors)数目肃除,兼顾磨练和推理任务的高糊涂量发达。关于延伸明锐的推清爽码场景,DeepEP还提供了纯RDMA的低延伸内核,撑合手自符合路由ag百家乐,能竣事更机动的GPU资源肃除,稳定不同场景需求。
本文源自:财联社财经ag百家乐