新闻资讯

DeepSeek“开源周”今日收官,都发布了什么?

DeepSeek“开源周”今日收官,都发布了什么?

  2月28日,国内AI明星企业深度求索(DeepSeek)为期五天的“开源周”活动正式收官。

  “开源周”都发布了什么?

  自2月24日启动以来,DeepSeek“开源周”发布的五个项目涵盖了从计算、通信到存储的各个方面。

2月24日:首个开源的代码库为Flash MLA,这是针对Hopper GPU优化的高效MLA解码内核,针对可变长度序列作了优化,目前已投入生产。 2月25日:宣布将DeepEP向公众开放。DeepEP是用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。 2月26日:宣布开源DeepGEMM。DeepGEMM 是一个专为简洁高效的 FP8 通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如 DeepSeek-V3 中所提出。它支持普通和混合专家(MoE)分组的 GEMM。该库采用 CUDA 编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。FP8GEMM库,为V3/R1训练和推理提供支持。 2月27日:一次性开源了两个工具和一个数据集,分别是DualPipe、EPLB(专家并行负载均衡器)以及训练和推理框架的性能分析数据。此外,DeepSeek还在Github上详细讲解了DeepSeek-V3和R1模型背后的并行计算优化技术。 2月28日:在官方X账号宣布开源3FS,它是所有Deepseek数据访问的助推器。

  中信证券研报指出,DeepSeek“开源周”有望进一步催化AI+主题。DeepSeek陆续开源5个代码库,以完全透明的方式与全球开发者社区分享他们在探索通用人工智能(AGI)领域的进展。DeepSeek的低成本、高性能特性带动AI渗透率全社会加速,随着开源代码的逐步发布,有望进一步带动各个行业应用的加速发展,以及算力端需求的增长。

  Deepseek API重新开放充值,并下调价格

  在经历长达19天的暂停充值后,DeepSeek于2月25日正式恢复API开放平台的充值功能。此次重启伴随着价格体系的结构性调整:

deepseek-chat基于的V3模型调用价格为每百万输入tokens 2元,每百万输出tokens 8元; deepseek-reasoner基于的R1模型调用价格为每百万输入tokens 4元,每百万输出tokens 16元。

  2月26日,DeepSeek进一步推出错峰优惠定价策略。DeepSeek宣布,每日优惠时段为北京时间00:30-08:30,其余时间按照标准价格计费。在此期间,API调用价格大幅下调:DeepSeek-V3降至原价的50%,DeepSeek-R1更是低至25%。

来源:每日经济新闻、财联社、21世纪经济报道、DeepSeek微信公众号

  • 威胜信息(688100) 在手订单充盈,海外收入延续高增
  • 完美世界预计2024年营收55亿元-56亿元
  • 港交所下调股票最低上落价位
  • 马骏:积极探索建立“四链融合”科技金融创新生态区|两会声音​
  • 又一机构“出局”!基金代销市场 “淘汰赛”加剧
  • 根据微软协议 美国允许向阿联酋出口先进的人工智能芯片
  • 谷歌地图将为美国用户把“墨西哥湾”更名为“美国湾”
  • 中行报告:大行资本补充,注资规模、方式、节奏有哪些可能?
  • 低空经济2024“+”速起飞
  • “宝能系”余震持续:被恢复执行29.53亿元,前海人寿阴霾后能否见曙光?
  • 布局投顾、选股,AI能让同花顺赚到更多钱吗?
  • 66个交易日涨超132%!多重积极因素催化,金融科技板块有望引领跨年行情
  • DeepSeek“开源周”今日收官,都发布了什么?的相关内容

    关键词:
    >下一篇:金租市场的2025