AIGC宇宙 AIGC宇宙

存储

DeepSeek太给力了!自家的大模型秘方开源到底!国产大模型雄起

出品 | 51CTO技术栈(微信号:blog51cto)DeepSeek “开源周”第五天,依旧保持了一如既往地“务实”风,满满的诚意。 先来回忆下前四天,源神的慷慨发布——第一天,2月24日,最为外界称道的MLA技术率先开源,这项解码加速器FlashMLA技术能够让英伟达Hopper架构GPU跑得更快,效果更好! 紧接着,25日,直接亮出首个面向MoE模型的开源专家并行通信库DeepEP,实现了MoE训练推理的全栈优化;第三天,则进一步祭出一项跨时代的发布:FP8通用矩阵乘法加速库,从底层让模型训练、微调变得更加流畅丝滑;第四天,也就是昨天的并行优化“三剑客”:DeepSeek-V3和R1 模型背后的并行计算优化技术——DualPipe(双向流水线并行算法,让计算和通信高效协同)、EPLB ( 专家并行负载均衡器,让每个 GPU 都“雨露均沾”)、profile-data (性能分析数据,可以理解成V3/R1 的并行优化的分析经验)可以说前四天的发布聚焦在算力通信、模型架构优化,也就是算力和算法的层面,而接下来第五天的开源则补上了AI三驾马车的最后一块,也是用户体验感知更为明显的一块优化动作:高性能分布式文件系统(数据存储层面的改进)。
2/28/2025 12:32:42 PM

哪些国家封杀了DeepSeek?

在人工智能领域的又一轮"狼来了"预警中,各国政府再次上演了一出集体焦虑的好戏。 这次的主角是人工智能公司 DeepSeek,而各国的反应仿佛看到了什么洪水猛兽。 在这场看似声势浩大的"防范"行动中,各国似乎都在用同一个模板复制粘贴着相似的说辞——"安全风险"、"数据担忧",仿佛这些词汇成了一个万能的理由。
2/13/2025 10:19:24 AM
佚名
  • 1