AIGC宇宙 AIGC宇宙

文章列表

DeepSeek R1范式复现笔记

作者 | yulei自DeepSeek R1技术报告🐳开放以来,开源社区涌现了多种「复现」工作。 本R1复现笔记旨在以多个开源项目的再复现以及交叉验证为目标,探索R1/R1-zero中强化学习步骤带来的模型效果提升,并尝试展望R1技术在未来模型训练与业务落地上的前景。 一、R1 开源项目梳理目前主流的 R1 系列复现工作如表 1 所示。
2/20/2025 3:32:28 PM
腾讯技术工程

腾讯理财通升级AI能力:同时接入DeepSeek和混元大模型

腾讯理财通2月20日宣布重要升级:同时接入DeepSeek-R1模型满血版和腾讯混元大模型,标志着这家服务数亿用户的财富管理平台在AI金融服务领域迈出重要一步。 本次升级后,腾讯理财通将整合其专业金融信息数据、微信公众号文章等资源,结合大模型能力,为用户提供更专业、实时的金融服务。 用户可通过App首页搜索框或股票行情入口快速体验新功能。
2/20/2025 3:11:00 PM
AI在线

DeepSeek创始人是谁?这个问题DeepSeek也整不会了!

梁文锋到底有多低调? 你问DeepSeek官网,连自家的产品都整不会“DeepSeek的创始人是谁”这个问题。 事情是这样的。
2/20/2025 2:54:56 PM

DeepSeek相关人士已辟谣:融资消息均为谣言 阿里股价微跌0.88%

出品 | 51CTO技术栈(微信号:blog51cto)针对外媒称“DeepSeek 首次考虑筹集外部资金”的消息,DeepSeek相关人士今天上午已经进行了辟谣——融资消息均为谣言。 (图1)但作为另一主角的阿里,尚无回应。 腾讯科技报道,阿里美股股价微跌0.88%。
2/20/2025 2:30:31 PM

​谷歌DeepMind高管:AI 应助力人类能力,而非取代

在近期于班加罗尔举办的 “投资卡纳塔克2025” 会议上,众多科技行业的领导者聚集一堂,探讨人工智能在印度的变革潜力及其影响。 谷歌DeepMind的高级董事马尼什・古普塔(Manish Gupta)在会上发表了重要讲话,强调在推动技术创新的同时,应建立相应的规章制度,以确保负责任的发展。 图源备注:图片由AI生成,图片授权服务商Midjourney古普塔指出,随着印度在构建基础性人工智能模型方面取得显著进展,大家都在关注人工智能对就业市场的影响。
2/20/2025 2:20:00 PM
AI在线

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数:以步骤为粒度对齐上下文学习与推理

仅需简单提示,满血版DeepSeek-R1美国数学邀请赛AIME分数再提高。 上海交大、港中文、上海AI实验室等带来最新成果BoostStep对齐推理和上下文学习粒度,大幅提升上下文学习性能,突破少样本学习上限。 图片大语言模型使用多步推理解决复杂数学问题,即先将复杂问题分解为多个步骤并逐步进行推理。
2/20/2025 12:09:22 PM

OpenAI的GPT-5即将问世:目前我们所知道的一切

想象一下,一个能浏览互联网、理解世界、记忆事物,还能像人一样自然聊天并进行复杂推理的AI。 这听起来像科幻电影里的情节,但实际上,这样的技术已经离我们不远了。 随着ChatGPT的不断进化,其最新版本GPT-5即将横空出世,预示着AI正朝着通用智能的目标大步迈进。
2/20/2025 11:20:41 AM
Bernard Marr

新突破!中国电信复现DeepSeek R1,探索行业大模型建设新路径

DeepSeek是由深度求索开发的低成本、高性能开源大语言模型,该模型通过强化学习与混合专家结构(MOE)的技术创新,以工程优化突破硬件限制,实现了“算力需求下降但性能提升”的反共识路径。 开源策略重塑了AI生态,为全球开发者提供普惠工具,标志着从“算力堆砌”向“算法效率”的产业转型。 中国电信政企信息服务事业群DeepSeek攻坚团队紧跟技术潮流,基于行业数据复现R1模型,提出行业大模型优化的新思路。
2/20/2025 11:12:11 AM

硅基流动袁进辉否认拒绝 DeepSeek 梁文锋投资,但承认自己没有远见感到后悔

大模型云服务商硅基流动于 2024 年底完成亿元人民币 Pre-A 轮融资。本月早些时候,硅基流动上线 DeepSeek R1 & V3 企业级服务,提供专属实例、算力纳管、私有版 MaaS、基于华为昇腾 910B 的一体机四种企业级服务模式供客户选择。
2/20/2025 10:57:42 AM
汪淼

​Netflix 使用 AI 克隆被谋杀受害者声音引发公众愤怒

近日,Netflix 在其新推出的真实犯罪纪录片《美国谋杀:加比・佩蒂托》中,因使用 AI 技术重现已故社交媒体影响者加比・佩蒂托的声音而引发了广泛争议。 加比于2021年8月被其未婚夫布莱恩・劳德里谋杀,令公众深感痛心。 在纪录片开头,观众注意到了一则提示,称佩蒂托的日记和短信将通过语音重现技术以她的声音进行演绎。
2/20/2025 10:05:00 AM
AI在线

Mistral的AI助手Le Chat两周内下载量突破百万

在人工智能领域,Mistral 最近发布的 AI 助手 Le Chat 引起了广泛关注。 仅仅在上线两周后,该应用便达成了令人瞩目的成就 —— 下载量突破了100万次。 这一成果不仅在其发源地法国引发热潮,更在 iOS 应用商店中迅速攀升至免费应用下载榜首。
2/20/2025 10:04:00 AM
AI在线

DeepSeek否认融资传闻 知情人士称"信息不实"

2024年2月20日,针对市场流传的"AI公司DeepSeek正筹备首次公开融资"消息,《科创板日报》报道,相关传闻均为不实信息,"融资事宜纯属谣言"。   近期,随着生成式AI赛道持续升温,多家中国AI初创企业频传融资动态。 月之暗面、Minimax等公司接连传出超10亿美元估值融资消息,引发市场对AI领域投资动向的高度关注。
2/20/2025 10:00:30 AM
AI在线

全球动画第一!AI哪吒走秀引百万网友围观,我们用DeepSeek搞了个

AI好好用报道编辑:杨文哪吒、敖闰、申公豹、太乙真人「走」上巴黎时装秀。 小哪吒创造了传奇。 不仅 16 天破百亿,刷新了中国影史纪录,现如今还直接干到了全球动画电影票房榜第一。
2/20/2025 9:31:00 AM
AI好好用

从大模型性能优化到DeepSeek部署

一、背景Deepseek-r1模型的爆火标志着本地部署大模型的需求日益增长。 本文主要探讨如何优化本地部署大模型的性能,并结合我们的实践进行评测分析,文章最后我们将分享如何在本地高效部署满血版Deepseek-r1大模型。 在生产环境中,我们已部署专用的大模型推理集群,并对其性能进行了全面优化。
2/20/2025 9:27:46 AM
menglinggong

多地政务服务系统接入DeepSeek大模型 服务效率大提升

随着人工智能技术的迅速发展,越来越多的地方政府开始将 AI 引入政务服务,试图通过智能化手段提升服务质量和效率。 近期,北京经济技术开发区和深圳福田区纷纷上线了基于 DeepSeek 大模型的智能政务助手,标志着 AI 在政务领域的应用迈出了重要一步。 在北京经济技术开发区,新的智能政务小助手经过多家企业的测试后正式投入使用。
2/20/2025 9:23:00 AM
AI在线

谷歌将Gemini从iOS主应用撤出,押注独立应用战略

谷歌日前宣布一项重大战略调整:将其人工智能助手Gemini从iOS版谷歌主应用中完全移除,转而推广其独立应用。 这一决策意在加强与ChatGPT、Claude等竞争对手的直接较量,但同时也面临着用户流失的风险。 据悉,谷歌已通过电子邮件向用户发出通知,明确表示"Gemini不再在谷歌应用中可用"。
2/20/2025 9:13:00 AM
AI在线

腾讯深度思考模型「混元T1」面向所有用户开放

腾讯宣布其深度思考模型“混元T1”正式面向所有用户开放,用户可以通过腾讯元宝平台体验并测试该模型。 此前,混元T1开启灰度测试后,受到了用户的广泛关注和积极反馈。 为了满足用户需求,腾讯紧急部署,现已实现混元T1的全面开放,所有用户均可无限量使用。
2/20/2025 8:51:00 AM
AI在线

DeepSeek 被曝首次考虑进行外部融资,巨头阿里巴巴有意参投

外媒 The Information 报道提到,由于其 AI 模型大受欢迎,因而要增加资源投放以满足明显增加的需求,所以促成内部讨论引入更多投资者。
2/20/2025 1:26:23 AM
汪淼