AIGC宇宙 AIGC宇宙

文章列表

4500美元复刻DeepSeek神话,1.5B战胜o1-preview只用RL!训练细节全公开

强化学习迎来重大突破! 近日,来自UC伯克利的研究团队基于Deepseek-R1-Distilled-Qwen-1.5B,通过简单的强化学习(RL)微调,得到了全新的DeepScaleR-1.5B-Preview。 在AIME2024基准中,模型的Pass@1准确率达高达43.1% ——不仅比基础模型提高了14.3%,而且在只有1.5B参数的情况下超越了OpenAI o1-preview!
2/11/2025 4:17:42 PM
新智元

5000字揭秘!DeepSeek-R1-Zero自我进化的三大特点和三大基石

当前 AI 在推理能力提升上遇到了诸多瓶颈,这在一定程度上限制了其进一步发展和广泛应用。 在传统的 AI 训练中,模型对大量监督数据的依赖是一个显著问题。 监督学习需要大量带有标注的数据来训练模型,使其能够对新的数据进行准确的分类或预测。
2/11/2025 4:15:09 PM
小智

一文速通 DeepSeek 家族核心技术点:从 LLM 到 R1!

DeepSeek横空出世并迅速走红,引发了全球科技圈的强烈震动,NVIDIA股价暴跌18%,全球科技股市市值蒸发近1万亿美元。 特朗普也居然公开称赞DeepSeek的崛起具有“积极意义”,并表示这给美国敲响了“警钟”。 Anthropic一方面肯定了DeepSeek的成就,另一方面却呼吁美国政府加强对华芯片管制。
2/11/2025 3:56:18 PM
小喵学AI

在 DeepSeek 的帮助下,我在 GitHub “战绩区”涂鸦

在每个人的 GitHub 的主页上,有一块儿区域特别显眼,就是 Contributions 日历图,也就是下面这个绿色的小方格子部分。 image.pngGitHub 会记录你每天是否有提交代码,提交了多少代码。 哪年比较勤劳,哪年偷懒了,一眼就能看出来。
2/11/2025 3:53:29 PM
风筝

​DeepSeek梁文峰或成亚洲顶级科技富豪,估值高达1500亿美元

近日,DeepSeek 的创始人梁文峰凭借其在人工智能领域的成功,可能会成为亚洲顶级科技富豪之一。 根据彭博社对多位初创公司创始人和 AI 专家的调研,DeepSeek 的估值预计将在10亿美元到超过1500亿美元之间。 这意味着梁文峰持有的84% 股份,可能使他跻身亚洲最富有的科技大亨之列。
2/11/2025 3:19:00 PM
AI在线

IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

IBM 近日宣布,其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。 DeepSeek 通过知识蒸馏技术,利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化,进一步提升了模型性能。 在 watsonx.ai平台上,用户可以通过两种方式使用 DeepSeek 蒸馏模型。
2/11/2025 2:25:00 PM
AI在线

你真的还在思考吗?微软研究显示生成性 AI 或让批判性思维退化!

近日,微软研究院与卡内基梅隆大学的研究人员联合发布了一项新研究,揭示了知识工作者在使用生成性人工智能(如 C o p i l o t 和 ChatGPT)时的潜在问题。 研究小组通过对319名每周使用生成性 AI 的知识工作者进行调查,探讨了他们在使用这些工具时的批判性思维应用情况。 图源备注:图片由AI生成,图片授权服务商Midjourney研究结果显示,那些对任务充满信心的工作者,更倾向于对生成性 AI 的输出进行批判性思考。
2/11/2025 1:55:00 PM
AI在线

思科研究:97%的CEO 计划采用AI,但只有2%做好准备

思科公司近日发布了一项关于 CEO 在人工智能(AI)领域的研究报告。 报告显示,尽管有97% 的 CEO 计划将 AI 整合到他们的业务中,但仅有2% 的 CEO 认为自己已经做好了 AI 的准备。 这项调查涵盖了来自欧洲、北美、南美、非洲和亚太地区超过250家公司的2500多位 CEO,年龄均在25岁以上。
2/11/2025 1:41:00 PM
AI在线

IBM 企业级 AI 开发平台 watsonx.ai 上线 DeepSeek R1 蒸馏模型

根据官方介绍,DeepSeek 还借助知识蒸馏技术,利用 R1 模型生成的数据优化了多个 Llama 和 Qwen 变体。
2/11/2025 12:36:07 PM
清源

DeepSeek本地部署详细指南!从 Ollama 到个人知识库应用

作者:lushen一、系统介绍mbp pro:二、Ollama 安装与配置1. 跨平台安装指南Ollama 作为本地运行大模型的利器,支持三大主流操作系统:复制2. 服务验证复制出现上述则表示安装成功,可浏览器访问http://localhost:11434/验证。
2/11/2025 12:15:57 PM
腾讯技术工程

马斯克欲收购OpenAI:你还会继续使用其产品吗?

AI领域的新闻总是层出不穷,今天也不例外:《华尔街日报》报道,由世界首富、多家公司老板埃隆·马斯克领导的私人投资者财团,已向OpenAI的非营利董事会提出974亿美元的收购报价,旨在收购由前联合创始人、现任OpenAI CEO山姆·阿尔特曼领导的有利可图的公司子公司。 抛开两人之间漫长且复杂的过往,这已导致多起诉讼,马斯克此次提出收购另一家公司的目标,是想在他已经拥有或经营的六家公司(SpaceX、特斯拉、Starlink、Neuralink、X、xAI)之上,再添一员。 他的目的是让OpenAI回归其最初的开源使命,即为所有人带来AI福祉和AGI。
2/11/2025 12:02:20 PM
Carl Franzen

全球开源大模型榜单揭晓,阿里通义千问独占鳌头

近日,全球最大人工智能开源社区 Huggingface 发布了最新的开源大模型排行榜(Open LLM Leaderboard),结果显示,排名前十的开源大模型全都是基于阿里通义千问(Qwen)开源模型进行二次训练的衍生模型。 这一成就标志着 Qwen 在开源 AI 领域的主导地位,进一步推动了其在全球的影响力。 Open LLM Leaderboard 被广泛认为是当前最权威的开源大模型榜单,测试维度涵盖了多个领域,包括阅读理解、逻辑推理、数学计算及事实问答等。
2/11/2025 11:55:00 AM
AI在线

马斯克再开炮:974亿美元买下OpenAI!马斯克与奥特曼的恩怨局如何收场?

出品 | 51CTO技术栈(微信号:blog51cto)马斯克与与奥特曼的激烈争斗已经从法律诉讼升级成收购商战! 据《华尔街日报》报道,马斯克的律师马克·托贝罗夫周一提交了对OpenAI管理公司的收购出价:974亿美元。 收购主体是一个由马斯克牵头的财团,目的也很明确:寻求控制OpenAI。
2/11/2025 11:46:48 AM

阿里通义实验室开源音乐生成技术InspireMusic

近日,通义实验室正式开源了其创新性的音乐生成技术——InspireMusic。 该技术旨在打造一个集音乐、歌曲及音频生成能力于一体的开源AIGC工具包,为研究者、开发者及音乐爱好者提供一个全面的创作平台。 InspireMusic不仅为研究者和开发者提供了丰富的音乐/歌曲/音频生成模型的训练和调优工具,还为他们配备了高效的模型,以便优化生成效果。
2/11/2025 11:43:00 AM
AI在线

OpenAI 携手 Schibsted 媒体集团 推动新闻内容创新

近日,Schibsted 媒体集团宣布与 OpenAI 达成合作,旨在将旗下多家知名出版物的内容整合进 OpenAI 的产品中,包括热门的聊天机器人 ChatGPT。 此次合作将涵盖 Schibsted 旗下的多份重要报纸,如挪威的 VG、Aftenposten 以及瑞典的 Aftonbladet 和 Svenska Dagbladet。 通过这项合作,ChatGPT 将能够提供最新的新闻摘要,并在引用内容时清晰标注来源,方便用户核实信息。
2/11/2025 11:36:00 AM
AI在线

全国首批金融机构,重庆农商行与腾讯云合作落地 DeepSeek 大模型联网应用

重庆农村商业银行10日宣布借助腾讯云大模型知识引擎的能力,在企业微信上线基于DeepSeek模型的智能助手应用“AI小渝”,成为全国首批接入DeepSeek大模型应用的金融机构。
2/11/2025 11:22:22 AM
清源

极狐阿尔法 S5 官宣深度融合 DeepSeek,接入北汽自研“百模汇创平台”

基于该平台架构,该车能够实现行业首个多模型协同,用户可自由切换DeepSeek、minimax等多模型,智能助手还能按需匹配最佳模型,此功能将于4月份通过OTA更新正式上线。
2/11/2025 11:15:40 AM
清源