3月1日,DeepSeek官方认证账号在知乎发布了《DeepSeek-V3/R1推理系统概览》(下称《概览》)一文,初次公布模子推理系统的中枢优化决策,并露馅表面资本利润率高达545%,刷新了群众AI大模子领域的盈利高点,激勉业内膺惩。
《概览》走漏,DeepSeek-V3/R1推理系统的优化看法是更大的浑沌、更低的延伸。
为了杀青上述两个看法,DeepSeek使用大鸿沟跨节点各人并行(EP)。率先EP使得批量尺寸大大增多,从而进步图形处分器(GPU)矩阵乘法的后果,进步浑沌。其次EP使得各人散播在不同的GPU上,每个GPU只需要打算很少的各人,因此更少的访存需求,从而裁汰延伸。
EP同期也增多了系统的复杂性。因此,《概览》就怎么使用EP增大齐量尺寸、怎么遮蔽传输的耗时、怎么进行负载平衡等进行了培植。
DeepSeek还露馅了DeepSeek的表面资本和利润率等枢纽信息。
著述称,在北京时辰2月27日12:00至2月28日12:00,DeepSeekV3和R1推理管事占用节点总数,凯时AG百家乐峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800GPU)。假设GPU租借资本为2好意思元/小时,总资本约为8.71万好意思元/天。
如若总共tokens通盘按照DeepSeekR1的订价打算,表面上一天的总收入大略56.20万好意思元,资本利润率为545%。
DeepSeek这次露馅的数据,不仅考据了其本事路子的贸易可行性,也预示着AI大模子的盈利闭环已从理思照进践诺。此前发布的DeepSeek-V3模子考试资本仅557.6万好意思元,是同类家具的1%-5%。
DeepSeek这次在知乎发布《概览》,引来近600条研讨、5000多点赞。有网友称,当天发布的《概览》本事著述是“开源周彩蛋”,平直亮出了底牌。有网友推奖:“太强了,AI算力成为水电的基础是要富裕低廉,Deepseek迈出了一大步”。
《概览》发布也象征着群众关爱的“DeepSeek开源周”精良收官。“DeepSeek开源周”自2月24日至2月28日AG百家乐怎么玩才能赢,接续开源最新本事推崇。其中,包括FlashMLA、DeepEP、DeepGEMM和3FS四个开源神情,以及DualPipe、EPLB等代码库。