新闻资讯

DeepSeek“开源周”今日收官,都发布了什么?

DeepSeek“开源周”今日收官,都发布了什么?

  2月28日,国内AI明星企业深度求索(DeepSeek)为期五天的“开源周”活动正式收官。

  “开源周”都发布了什么?

  自2月24日启动以来,DeepSeek“开源周”发布的五个项目涵盖了从计算、通信到存储的各个方面。

2月24日:首个开源的代码库为Flash MLA,这是针对Hopper GPU优化的高效MLA解码内核,针对可变长度序列作了优化,目前已投入生产。 2月25日:宣布将DeepEP向公众开放。DeepEP是用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。 2月26日:宣布开源DeepGEMM。DeepGEMM 是一个专为简洁高效的 FP8 通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如 DeepSeek-V3 中所提出。它支持普通和混合专家(MoE)分组的 GEMM。该库采用 CUDA 编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。FP8GEMM库,为V3/R1训练和推理提供支持。 2月27日:一次性开源了两个工具和一个数据集,分别是DualPipe、EPLB(专家并行负载均衡器)以及训练和推理框架的性能分析数据。此外,DeepSeek还在Github上详细讲解了DeepSeek-V3和R1模型背后的并行计算优化技术。 2月28日:在官方X账号宣布开源3FS,它是所有Deepseek数据访问的助推器。

  中信证券研报指出,DeepSeek“开源周”有望进一步催化AI+主题。DeepSeek陆续开源5个代码库,以完全透明的方式与全球开发者社区分享他们在探索通用人工智能(AGI)领域的进展。DeepSeek的低成本、高性能特性带动AI渗透率全社会加速,随着开源代码的逐步发布,有望进一步带动各个行业应用的加速发展,以及算力端需求的增长。

  Deepseek API重新开放充值,并下调价格

  在经历长达19天的暂停充值后,DeepSeek于2月25日正式恢复API开放平台的充值功能。此次重启伴随着价格体系的结构性调整:

deepseek-chat基于的V3模型调用价格为每百万输入tokens 2元,每百万输出tokens 8元; deepseek-reasoner基于的R1模型调用价格为每百万输入tokens 4元,每百万输出tokens 16元。

  2月26日,DeepSeek进一步推出错峰优惠定价策略。DeepSeek宣布,每日优惠时段为北京时间00:30-08:30,其余时间按照标准价格计费。在此期间,API调用价格大幅下调:DeepSeek-V3降至原价的50%,DeepSeek-R1更是低至25%。

来源:每日经济新闻、财联社、21世纪经济报道、DeepSeek微信公众号

  • 行业ETF风向标丨消费行业继续反弹,消费ETF半日成交超6亿元
  • 王朝弟:对建设金融强国的几点体会
  • 【市场速递】11月15日人民币汇率指数
  • 奥克斯冲刺港交所:高增速背后,负债与技术瓶颈的困境与挑战
  • 晋江今年计划拍卖多宗地块!晋东、梅岭、青阳、池店……
  • 国企股大幅走强 中字头方向领涨
  • 本田、日产、三菱突曝大合并
  • IMF警告这两大行业堪比“吞电巨兽”:用电量直逼一个经济大国
  • A500ETF“吸金”2155亿元:30家公募竞争梯队已成
  • 外媒:马克龙访问阿根廷,在两件事上劝米莱
  • 把握“AI+”机遇 数智化转型驶入快车道
  • 在岸人民币兑美元较上周五夜盘收盘跌155点
  • DeepSeek“开源周”今日收官,都发布了什么?的相关内容

    关键词:
    >下一篇:金租市场的2025