DeepSeek首发国产类o1模型！人人可以免费使用！

2024-11-25 05:23

20日晚8点，DeepSeek在自己官方公众号上放出了一个大杀器：全新自研的DeepSeek-R1-Lite 预览版正式上线。据介绍，DeepSeek R1 系列模型使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果，并为用户展现了 o1 没有公开的完整思考过程。

20日晚8点，DeepSeek在自己官方公众号上放出了一个大杀器：

全新自研的DeepSeek-R1-Lite 预览版正式上线。据介绍，DeepSeek R1 系列模型使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。

该系列模型在数学、代码以及各种复杂逻辑推理任务上，取得了媲美 o1-preview 的推理效果，并为用户展现了 o1 没有公开的完整思考过程。

图片

等不及看下文的朋友，大家可以自行登录DeepSeek官网（chat.deepseek.com），前往体验与国产版的o1模型的深度对话。

不过，这次的深度推理，DeepSeek选择的只有数学竞赛和编程方面的测评，虽然没有其他领域的测评数据，但这两项的难度也足以说明这个模型的厉害了！

在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权威评测中，DeepSeek的表现大幅超越了 GPT-4o 等知名模型，前者L1获得了91.6的成绩，而o1仅有85.5分，Qwen2.5表现也不错83.1。

值得注意的是，所有测评的最大推理长度是有限制的，是32k。

图片

为什么说这一点值得注意，因为据介绍，DeepSeek-R1-Lite 的推理过程包含了大量的反思和验证。模型在数学竞赛上的得分与测试所允许思考的长度紧密正相关。

即，允许思考过程的token越长，所获得推理结果得分越高。

图片

小遗憾地是，DeepSeek-R1-Lite 目前仍处于迭代开发阶段，仅支持网页使用，暂不支持 API 调用。DeepSeek-R1-Lite 所使用的也是一个较小的基座模型，无法完全释放长思维链的潜力。

不过DeepSeek表示模型还会持续进行迭代，正式版 DeepSeek-R1 模型将完全开源，而相关的技术报告也会公开，同时也会部署 API 服务。

小编实测了一道高中奥数题，DeepSeek-R1 全程只用了15s就给了正确的思考过程，不过可惜的是，输在了最后一个合并同类项的数学错误上。

图片

唉，不得不说，功亏一篑呀，大模型的数学能力的确有待提升，推理层还得加油！

想了解更多AIGC的内容，请访问：

51CTO AI.x社区

https://www.51cto.com/aigc/

相关标签：

DeepSeek o1

相关资讯

DeepSeek-R1 模型发布，性能对标 OpenAI o1 正式版

DeepSeek-R1 模型发布，性能对标 OpenAI o1 正式版

幻方量化旗下 AI 公司深度求索（DeepSeek）今日正式发布 DeepSeek-R1 模型，并同步开源模型权重。据官方介绍，DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

OpenAI o1 模型登场：开启 AI 通用复杂推理新篇章，国际奥数正确率 83%

OpenAI o1 模型登场：开启 AI 通用复杂推理新篇章，国际奥数正确率 83%

感谢OpenAI 传闻中的“草莓”（Strawberry）AI 模型现已面世，正式名称为“o1”，是该公司首款具备“推理”能力的模型。o1 和 o1-miniOpenAI 表示对该模型进行特殊训练，能够比人类更快地回答更复杂的问题。与之同时发布的还有 o1-mini，一个更小、成本更低的版本。OpenAI 表示 o1 模型的发布，是其迈向类人 AI 宏伟目标的关键一步。AI在线注：o1 模型目前处于“预览”阶段，官方强调该模型相关开发尚处于初期阶段，相比较 GPT-4o 模型，使用成本更高且速度更慢，但在编写代码和

因类人通用推理、可辅助制作生物武器等因素，OpenAI o1 AI 模型归类为“中等风险”

因类人通用推理、可辅助制作生物武器等因素，OpenAI o1 AI 模型归类为“中等风险”

科技媒体 The Decoder 昨日（9 月 13 日）发布博文，报道称在 OpenAI 自家的“防备框架”（Preparedness Framework）下，将最新发布的 o1 AI 模型归类为“中等风险”（medium risk）。防备框架简介AI在线曾于 2023 年 12 月报道，OpenAI 成立了新的“防备”（Preparedness）团队，并提出“防备框架”指导方针。防备团队将反复评估 OpenAI 最先进、尚未发布的 AI 模型，根据不同类型的感知风险评为四个等级，从低到高依次是“低”、“中”、“

资讯热榜

使用 VLLM 部署 DeepSeek：基于 Ubuntu 22.04 + RTX 4090 + Docker 的完整指南 Ollama的配置修改与接口调用一条神奇的指令，DeepSeek直接文生图 OpenAI突然发布智能体API！支持网络和文件搜索以及computer use 最新版DeepSeek保姆喂饭级安装教程：本地部署+避坑指南（升级版）从DeepSeek MoE专家负载均衡谈起基于Dify与DeepSeek：零门槛训练自己的专属AI大模型 OpenAI深夜大招暴打Manus！智能体全家桶杀器一统API，4行代码轻松上手

标签云