AIGC宇宙 AIGC宇宙

文章列表

Nature:OpenAI推出AI研究助手,深度综述能力引发学界关注

编辑 | matrix科技巨头 OpenAI 于 2 月 2 日推出付费工具「Deep Research」,这款工具能将数十或数百个网站的信息综合为带有引用的完整报告。 此举紧随谷歌在去年 12 月发布的类似产品,标志着 AI 个人研究助手时代的来临。 这类工具最显著的特点是将原本需要数小时的研究工作压缩至数十分钟内完成,引发学界广泛关注。
2/7/2025 6:24:00 PM
ScienceAI

「鲶鱼」DeepSeek 正在搅动上下游

作者|朱可轩编辑|陈彩娴春节结束,DeepSeek 热度不减,而要说刚刚过去的春节假期,留给科技圈的印象可能是“卷上加卷”,几乎无人不在热议分析着 DeepSeek 这条“鲶鱼”。 硅谷方面迎来了空前的危机感:开源的信徒们声量再度走高,甚至连 OpenAI 都在反思闭源的决策是否正确;低算力成本的新范式引发芯片巨头英伟达连锁反应,创下美股史上最大规模单日市值蒸发纪录;政府部门下场调查 DeepSeek 使用芯片的合规性......在海外对 DeepSeek 评价褒贬不一的同时,国内也迎来了空前繁荣。 DeepSeek 发布 R1 模型后上线的 APP 接到泼天流量,初步验证了应用端增长将会拉动整个 AI 生态发展。
2/7/2025 6:10:00 PM
朱可轩

历史时刻:DeepSeek GitHub星数超越OpenAI,仅用时两个月

开源 AI 世界的里程碑事件! 我们正在见证历史:DeepSeek 项目在全球最大代码托管平台 GitHub 上的 Star 量超过了 OpenAI。 截至本周五下午两点,DeepSeek 旗下热度最高的项目 DeepSeek-V3 大模型 Star 量已达 7.77 万,超越了同平台中 OpenAI 最热门项目。
2/7/2025 5:39:00 PM
机器之心

烽火通信旗下长江计算 G440K V2 服务器实现 DeepSeek 系列模型推理适配和优化

烽火通信旗下长江计算近日联合昇腾、华为云团队成功助力某国有大行完成 DeepSeek-V3 大模型的本地化推理服务部署。本次部署使用长江计算 G440K V2 服务器,基于 MindIE 推理引擎,在华为云 AI 开发平台 ModelArts 上完成。
2/7/2025 4:33:56 PM
归泷(实习)

AI成本革命:DeepSeek-R1与OpenAI的颠覆性突破重构企业智能新范式

AI领域的发展日新月异,如果你跟不上步伐,就会落后。 近期的两项进展正在重塑开发者和企业的格局:DeepSeek发布R1模型,以及OpenAI推出新的DeepResearch产品,它们共同重新定义了强大推理模型的成本和可及性,这一点已被广泛报道,然而,较少被讨论的是,它们将如何推动公司采用蒸馏、有监督微调(SFT)、强化学习(RL)和检索增强生成(RAG)等技术,来构建更智能、更专业的AI应用。 在DeepSeek惊人成就的初步兴奋感逐渐平息后,开发者和企业决策者需要考虑这对他们意味着什么。
2/7/2025 3:52:20 PM
Matt Marshall

DeepSeek被禁!最高判刑20年,外交部回应!

过去几周,中国人工智能公司DeepSeek的崛起,在全球范围内引发了一场前所未有的争议。 这款凭借“低成本、高性能”迅速抢占市场的AI工具,不仅一度超越ChatGPT登顶美国应用下载榜,还导致多国科技股震荡下跌。 然而,其“高光时刻”很快被多国的禁令与限制措施打破——美国、意大利、澳大利亚、印度、韩国、日本等国相继以“国家安全”“数据隐私风险”为由,禁止或限制DeepSeek在政府及企业中的使用。
2/7/2025 3:46:17 PM
不才陈某

你的提示词根本只是在浪费算力,让deepseek达到最佳效果的三大原则

最近几周自学deepseek原理 应用 实践,一些成果,和大家分享。 与deepseek这类AI对话,为了达到最佳效果,提示词应当遵循哪三大原则? 清晰性;结构化;细节化;为什么?
2/7/2025 3:11:41 PM
58沈剑

行业首款 DeepSeek 量产车型落地,消息称岚图知音、梦想家已深度融合 R1 大模型

岚图知音车机云端还将持续融合和蒸馏DeepSeek R1模型。基于对DeepSeek做模型蒸馏,岚图一方面可以优化车机的智能化体验,做到技术的快速迭代;同时还可以降低智能座舱的开发和使用成本。
2/7/2025 3:07:11 PM
清源

法院判决武汉首例 AI 图片创作者维权案,认可创作者享有著作权

法院判决武汉某科技有限公司赔偿王某经济损失及合理开支 4000 元。一审判决作出后,双方均未上诉,判决已发生法律效力,被告已主动履行义务。
2/7/2025 3:00:20 PM
清源

Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现

继近日斯坦福李飞飞、Percy Liang 等人推出 S1 后,李飞飞的学生、OpenAI 早期成员与前特斯拉 AI 总监也录制了一期最新长达 3 小时的长视频上传到 YouTube,深入浅出地从神经网络的起源、GPT-2、ChatGPT 到最近 DeepSeek-R1 介绍了 AI 大模型的系列进化:视频链接:,视频讲解十分通俗易懂,即使没有技术背景的观众也能轻松理解! 尤其是在视频的第 2 个小时开始,他对最近爆火的 DeepSeek-R1 论文进行了深入介绍,并直言 DeepSeek R1 在性能方面与 OpenAI 的模型不相上下,它的出现推动了 RL 技术的发展。 除了盛赞 DeepSeek-R1 的技术创新外,Andrej Karpathy 还对纯 RL 的学习能力给予了高度评价,但又指出 RL 非常非常擅长发现一种方法来“欺骗”模型,阻碍了 RLHF 成为专业技术的步伐。
2/7/2025 2:50:00 PM
郑佳美

OpenAI更新o3-mini模型,展示了给出答案的 “思维链”

近日,OpenAI 在推出其旗舰 AI 模型 o3和 o3-mini 后,进行了重大更新,改变了 o3-mini 的回应方式。 现在,这款模型不仅能够回答用户的问题,还能展示其思考过程,为用户提供更多透明度。 这一变化标志着 OpenAI 在提升用户体验方面迈出了重要一步,使得 AI 工具的使用变得更加人性化。
2/7/2025 2:40:00 PM
AI在线

《麻省理工科技评论》点评中国AI“四剑客”,每家都媲美DeepSeek

春节期间,DeepSeek 一跃成为全球瞩目的焦点。 它以仅约十分之一的超低训练成本,成功推出了性能与OpenAI o1近乎相当的开源模型,对全球科技领域带来巨大冲击,先后引发美国科技股的大幅下跌,以及硅谷科技巨头和各国政要的纷纷回应,如今全球各大芯片厂商和智算云服务厂商更是积极响应、跟进适配。 半个月来,DeepSeek相关话题热度居高不下,热搜频频,已成为全球科技、经济乃至政治领域的重要话题。
2/7/2025 2:37:00 PM
新闻助手

从 DeepSeek 火热,到李飞飞团队新成果,“幕后高手”竟是它

最近 AI 大模型领域可以说是热点话题不断,DeepSeek 的热潮还未消退,国内李飞飞团队提出的一种模型训练新方法又在行业里引发热议
2/7/2025 2:13:55 PM
汐元

全球化钓鱼攻击:DeepSeek仿冒网站遍布六国,用户需警惕

奇安信XLab实验室2月6日发布最新安全报告,揭示了一波针对DeepSeek用户的大规模网络钓鱼活动。 数据显示,仿冒DeepSeek的钓鱼网站数量已超过2000个,且仍在持续增长。 根据报告,在2024年12月1日至2025年2月3日期间,共发现2650个仿冒DeepSeek的域名。
2/7/2025 2:07:00 PM
AI在线

架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练

随着大模型技术向多场景渗透,算力需求呈现「大规模、高弹性、低成本」三重挑战。 清微智能基于全球领先的可重构计算架构(CGRA)推出可重构算力芯片RPU(Reconfigurable Processing Unit),实现单机高效运行千亿级参数模型推理和训练,以动态硬件重构、全栈优化及高能效比,重新定义国产AI芯片的性价比标杆。 新年伊始,DeepSeek的惊艳亮相,不仅在科技圈掀起巨浪,其影响还涉及到经济、社会、政策等多个维度,相关企业迅速跟进。
2/7/2025 2:04:44 PM
新智元

华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

自我反思(尤其是肤浅的)有时对模型性能的助益不大。 在过去这半个月里,关于 DeepSeek 的一切都会迅速成为焦点。 一项非常鼓舞人心的发现是:DeepSeek-R1-Zero 通过纯强化学习(RL)实现了「顿悟」。
2/7/2025 1:52:00 PM
机器之心

DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法

自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。 R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。 GRPO 是一种在线学习算法(online learning algorithm),它通过使用训练过程中由训练模型自身生成的数据来进行迭代改进。
2/7/2025 1:45:58 PM
机器之心

国产大模型DeepSeek爆火,崛起背后大模型专利申请激增

近日,国产大模型DeepSeek爆火全网,凭借“低成本、高性能”的技术优势,其成为全球科技市场关注的焦点。 创始人梁文锋介绍,团队主要由国内高校毕业生和没毕业的博士生组成。 过硬的创新成果表明,今天的中国,正在成为顶尖人才成长的沃土、原创性创新的策源地。
2/7/2025 1:42:00 PM
AI在线