文章列表
GPT-4价格已被砍成1/150 !OpenAI副总裁回应DeepSeek的竞争,揭秘内部员工花式使用自家产品,有很多工程难题
编辑 | 言征2天前,就在马斯克宣布要以 974 亿美元收购 OpenAI 后,OpenAI 工程副总裁斯里尼瓦斯·纳拉亚南( Srinivas Narayanan) 接受了华尔街日报的一次线下对话,这次对话同样也是出于一场中美 AI 博弈的新语境下:DeepSeek R1低成本训练出可以对标 Open AI o1的强推理模型,甚至登顶了应用排行榜,美国现在已经封禁了DeepSeek应用的下载。 主持人当然没有放过斯里尼瓦斯,问了他这个非常敏感的问题。 那么 OpenAI 内部究竟是如何看待 DeepSeek 的?
2/17/2025 8:00:00 AM
言征
DeepSeek 系列模型详解之 DeepSeek Math
DeepSeek Math发布于2024年2月,虽然是一个7B参数量的模型,但在Math基准榜单上的表现却超过了多个30B~70B参数量的开源模型。 一、技术亮点1. 数据集使用Common Crawl提取的120B(1200亿个)高质量数学网页数据(具体包括与数学相关的token,以及自然语言和代码数据等),总数据量是开源数据集OpenWebMath的9倍。
2/17/2025 8:00:00 AM
小喵
DeepSeek官方发布R1模型推荐设置,这才是正确用法
自春节以来,DeepSeek 就一直是 AI 领域最热门的关键词,甚至可能没有之一,其官方 App 成为了史上最快突破 3000 万日活的应用。 最近一段时间,各家 AI 或云服务厂商更是掀起了部署 DeepSeek-R1 服务的狂潮,甚至让薅羊毛的用户们都有点忙不过来了。 就在刚刚,DeepSeek 官网 X 帐号终于更新了(上一次更新还是在 1 月 28 日),官方下场推荐了部署 DeepSeek-R1 的设置。
2/17/2025 7:35:00 AM
机器之心
当消费陷阱披上 DeepSeek 外衣:你看透"二次支付"背后的双倍收割了吗?
在 AI 浪潮中,真正的竞争力不在于收藏多少课程,而在于保持独立判断和持续学习的能力。 DeepSeek 付费群异军突起,我们还在重复李一舟式的狂欢吗? 去年,也差不多是这个时刻,售卖 AI 课的“中国 AI 教父”李一舟陷入学历和虚假宣传争议,最后,他的课程被下架,今天这股热潮还在继续,仿佛是消费主义对技术革命的异化。
2/17/2025 5:00:00 AM
宇宙之一粟
“RAG界的DeepSeek”开源-企业复杂私域知识理解与推理框架PIKE-RAG
PIKE-RAG框架的设计目标是提供一个灵活且可扩展的RAG系统,应对工业应用中复杂多样的任务需求。 框架的核心是通过有效的知识提取、理解和组织,以及构建连贯的推理逻辑,解决了RAG系统在工业应用中的局限性。 下面来看下PIKE-RAG框架及其实现过程,供参考。
2/17/2025 3:00:00 AM
余俊晖
Spring 宣布接入 DeepSeek
DeepSeek 是深度求索公司发布的大模型,是国产之光。 大家应该学会如何使用 DeepSeek 大模型,下面我们将看下如何开发基于 DeepSeek 大模型的智能应用。 DeepSeek 大模型DeepSeek 推出两款模型;DeepSeek V 系列,对于V系列主要 对话,模型名称:deepseek-chatDeepSeek R 系统,对于R系统主要 推理, 模型名称:deepseek-reasonerDeepSeek 官方更新日志,可以看到模型发布和演化的过程。
2/17/2025 12:25:00 AM
不才陈某
DeepSeek R1遇难题142次"I give up",研究还称需增加推理时机控制机制
最新大语言模型推理测试引众议,DeepSeek R1常常在提供错误答案前就“我放弃”了? ? Cursor刚刚参与了一项研究,他们基于NPR周日谜题挑战(The Sunday Puzzle),构建了一个包含近600个问题新基准测试。
2/17/2025 12:00:10 AM
百度搜索宣布将全面接入 DeepSeek 及文心大模型深度搜索功能
百度搜索今晚宣布,为丰富更多元化的搜索体验,百度搜索将全面接入DeepSeek和文心大模型最新的深度搜索功能。
2/16/2025 9:22:56 PM
浩渺
真正的王炸组合!微信终于接入满血版DeepSeek R1,灰度测试中
一觉醒来,AI 应用的天变了! 微信终于反应过来,接入了 DeepSeek! 而且据腾讯回应消息,接入的还是满血版 DeepSeek R1!
2/16/2025 8:40:00 PM
机器之心
微信 AI 搜索接入 DeepSeek,腾讯称不会使用朋友圈、聊天等个人信息
目前该能力还在灰度测试中,将根据用户体验和反馈持续优化。AI 搜索仅整合公众号及互联网其他公开信息,不会使用用户的个人信息和相关隐私信息。
2/16/2025 3:43:49 PM
汪淼
景嘉微发布全国产 AI 加固服务器:预置 DeepSeek,开箱即用
服务器内置 Deepseek-R1 1.5B ~ 70B 蒸馏模型,支持零配置启动大模型的交互演示。开发者可快速调用预置模型接口。
2/16/2025 12:34:21 PM
汪淼
不蒸馏 R1 也能超越 DeepSeek,上海 AI Lab 用 RL 突破数学推理极限
从 Qwen2.5-32B-Base 模型出发,仅通过微调和基于结果反馈的强化学习,在不蒸馏超大模型如 DeepSeek-R1 的情况下,就能超越 DeepSeek-R1-Distill-Qwen32B 和 OpenAI-O1 系列的超强数学推理性能。
2/16/2025 12:14:22 PM
汪淼
深圳首批 70 名“AI 员工”上岗:基于 DeepSeek,覆盖公文处理、民生服务等 240 个场景
福田区已上线 11 大类 70 名“数智员工”,覆盖公文处理、民生服务、应急管理、招商引资等多元场景。
2/16/2025 11:53:31 AM
汪淼
OpenAI CEO 奥尔特曼称 ChatGPT 4o 已更新,是“网上最好的搜索产品”
OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)今日在社交平台 X 上表示,该公司对 ChatGPT 4o 进行了更新,并表示其已成为“网上最佳的搜索产品”。奥尔特曼在帖子中提到,ChatGPT 4o 表现“相当出色”,并且“很快会变得更好”。他还转发了一些称赞该聊天机器人写作能力“难以置信地好”且“类似人类”的帖子。
2/16/2025 8:38:18 AM
远洋
消息称微信正在内测接入 DeepSeek-R1 大模型
网友 @赛博禅心 今日爆料称,微信正在内测接入 DeepSeek-R1 大模型。IT之家注意到,该路径位于微信页面-搜索-AI 搜索。
2/15/2025 9:47:38 PM
浩渺
大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠
问题挺严重,大模型说的话可不能全信。 最近 DeepSeek 非常热门,我们也能在网上看到大量或严肃有用或幽默搞怪使用案例。 其中一个很有趣的现象是不少用户发现 DeepSeek 会见风使舵。
2/15/2025 8:00:00 PM
机器之心
月之暗面因 DeepSeek 调整工作重心?内部人士:强化学习或许会是个方向
2 月 15 日下午消息,据媒体报道,月之暗面内部已经将“持续拿到 SOTA 结果”确定为当下最重要的工作目标。2025 年,月之暗面围绕模型能力的关键方向除了继续强化多模态部分外,还会继续强化长文本推理能力。
2/15/2025 4:51:20 PM
凌辰