模型

历史分水岭：DeepSeek GitHub星数超越OpenAI！大佬揭秘仅用450美元训推理模型

就在刚刚，历史性的一刻出现了。 DeepSeek项目在GitHub平台上的Star数，已经超越了OpenAI。热度最高的DeepSeek-V3，Star数如今已达7.7万。

2/8/2025 9:15:00 AM

新智元

《麻省理工科技评论》点评中国AI“四剑客”，每家都媲美DeepSeek

春节期间，DeepSeek 一跃成为全球瞩目的焦点。它以仅约十分之一的超低训练成本，成功推出了性能与OpenAI o1近乎相当的开源模型，对全球科技领域带来巨大冲击，先后引发美国科技股的大幅下跌，以及硅谷科技巨头和各国政要的纷纷回应，如今全球各大芯片厂商和智算云服务厂商更是积极响应、跟进适配。半个月来，DeepSeek相关话题热度居高不下，热搜频频，已成为全球科技、经济乃至政治领域的重要话题。

2/7/2025 2:37:00 PM

新闻助手

DeepSeek R1 集成难题完美解决：Deepseek4j 已开源

一、为什么需要 deepseek4j？ 1.1 现有框架的局限性思维链内容丢失：R1 最核心的推理过程完全被忽略响应模式不兼容：无法处理"思考在前、结论在后"的输出模式参数限制：temperature、top_p 等关键参数设置失效流式处理不完善：用户体验欠佳虽然笔者上篇博客介绍了如何使用 WebFlux 直接调用 DeepSeek API，但这种方式存在一些问题：开发成本高：直接调用 API 或改造现有框架需要处理大量细节，包括请求构建、响应解析、错误处理等。一不做二不休，为了彻底解决这些问题，笔者基于 OpenAI4J[1] 项目的优秀架构，打造了一个专门面向 DeepSeek 的开箱即用方案 DeepSeek4J[2]增强支持 DeepSeek 独有的思维链和账单特性增加 Project Reactor 的全面响应式支持提供集成 Spring Boot Starter，提供自动配置二、核心特性 ✨ 完整保留思维链能力、账单🚀 响应式流式处理🛠 简单优雅的 API 设计📦 开箱即用的 Spring Boot 集成，同时支持 2.x / 3.x💡 内置调试页面🔍 详细的请求响应日志🔧 灵活的代理配置⚡️ 响应式编程支持三、快速开始 3.1 添加依赖复制3.2 配置参数复制3.3 基础使用复制3.4 进阶配置复制

2/7/2025 1:10:06 PM

冷冷

突发！o3-mini思维链公开，却被曝光全是「作假」，奥特曼现身解释网友炸锅

OpenAI，真的被DeepSeek逼急了！活久见，就在刚刚，OpenAI把o3-mini的「思维链」公开了。比如问「怎么今天不是星期五啊😅」？

2/7/2025 11:20:50 AM

新智元

对标DeepSeek，Gemini 2.0轻量模型开卷“极致性价比”！谷歌守住多模态阵地，油管、地图应用们都要开始做推理了！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）DeepSeek的火热，让Google坐不住了！深夜，Google推出了Gemini 2.0全家桶，一口气推出了三个模型型号：Gemini 2.0 Flash、Gemini 2.0 Flash-LiteGemini 2.0 Pro。图片看技术报告，2.0系列的三个模型在通用、代码、推理、事实性、多语言等方面指标如下。

2/6/2025 1:13:07 PM

伊风

力压DeepSeek-R1！谷歌Gemini 2.0系列集体上新，全员跻身大模型竞技场前10

终于，谷歌DeepMind坐不住了，出手就是超越DeepSeek-R1！劈柴哥亲自官宣Gemini 2.0家族更新，分别是Gemini 2.0 Flash、Gemini 2.0 Pro、Gemini 2.0 Flash-Lite。同时，稳居大模型竞技场第1名的推理模型Gemini 2.0 Flash Thinking，已在Gemini App中推出。

2/6/2025 12:10:00 PM

量子位

英伟达憾失DeepSeek关键人才？美国放走AI「钱学森」，哈佛教授痛心疾首

DeepSeek给美国造成的威胁，还在加剧。就在昨天，DeepSeek的日活数已经达到ChatGPT的23%，每日应用下载量接近500万！ a16z联创Marc Andreessen发文谁能想到，做出DeepSeek关键贡献的人才，本来是可能留在美国的。

2/6/2025 9:30:00 AM

新智元

DeepSeek 全面指南：95% 的人都不知道的九个技巧

大家好，我是汤师爷~最近，DeepSeek这款AI工具爆火国内外。虽然许多人都开始尝试使用它，但有人吐槽说，没想象中那么牛。其实问题不在工具，很多人的使用姿势就搞错了，用大炮打蚊子，白白浪费DeepSeek的强大功能。

2/4/2025 5:33:00 PM

架构师汤师爷

创造历史！DeepSeek超越ChatGPT登顶中美AppStore

DeepSeek 20 日发布以来获得的热度至今依然没有任何消退的迹象。一觉醒来，DeepSeek 发布的 iOS 应用甚至超越了 ChatGPT 的官方应用，直接登顶 AppStore。不少网友都认为这是他们当之无愧。

1/27/2025 12:04:37 PM

机器之心

OpenAI微软关系现裂痕，奥特曼紧急公关，导火索竟是DeepMind联创

一个5000亿美元的大动作，让微软不再是OpenAI独家云计算供应商了。在OpenAI与甲骨文牵手组建数据中心那一刻起，网友们纷纷看向这个计划之外的微软：他们两个之间的关系约莫是出现裂痕了。结果奥特曼紧急公关，不是你听我解释，这是形势所迫，为算力折腰啊啊。

1/23/2025 4:22:56 PM

量子位

刚刚，OpenAI发布o1模型新突破，推理时间增强对抗鲁棒性

今天凌晨2点，OpenAI发布了一项新技术研究，通过增加推理时间、算力资源来大幅度提升模型的对抗鲁棒性。与传统的对抗训练样本方法不同的是，OpenAI提出的新方法不需要对大模型进行专门的对抗训练，也不需要提前了解攻击的具体形式。只需要通过增加推理时间和算力资源，模型就可以更充分地利用其推理能力表现出更强的鲁棒性。

1/23/2025 10:45:52 AM

AIGC开放社区

有道子曰推理模型“子曰-o1”发布即开源，14B小参数复现OpenAI o1强推理效果

2025开年，AI行业掀起大模型“推理潮”，自OpenAI发布o1后，各式推理模型不断涌现，模型的高阶推理能力迎来爆发增强，其应用价值也愈发获得业界的广泛关注。 1月22日，网易有道正式推出国内首个输出分步式讲解的推理模型“子曰-o1”。作为14B轻量级单模型，子曰-o1支持在消费级显卡上进行部署，采用思维链技术，能够提供细致解题过程，以强逻辑和推理能力，实现更高的解题准确性，并提供中文逻辑推理。

1/22/2025 11:32:00 AM

新闻助手

「DeepSeek接班OpenAI」，最新开源的R1推理模型，让AI圈爆了

昨晚，大模型领域再次「热闹起来」，月之暗面发布在数学、代码、多模态推理能力层面全面对标 OpenAI 的满血版 o1 的多模态思考模型 K1.5。而最近大热的 DeepSeek 正式推出了 DeepSeek-R1，同样在数学、代码和自然语言推理等任务上比肩 OpenAI o1 正式版。去年 12 月开源的大模型 DeepSeek-V3 刚刚掀起了一阵热潮，实现了诸多的不可能。

1/21/2025 11:53:53 AM

机器之心