DeepSeek
基于Dify与DeepSeek:零门槛训练自己的专属AI大模型
在人工智能(AI)技术日益普及的今天,训练属于自己的AI大模型不再是遥不可及的梦想。 随着DeepSeek R1的发布,其部署成本仅为ChatGPT的十分之一,这一突破让更多企业和个人能够轻松参与AI开发。 未来,垂直领域的AI大模型和应用将如雨后春笋般涌现,这无疑是一个巨大的机遇。
DeepSeek级AI?训练自己的推理模型仅需七个步骤
译者 | 布加迪审校 | 重楼谁需要超级计算机? 仅用15GB VRAM就可以训练你自己的功能强大的AI推理模型! DeepSeek的R1模型在不需要人类反馈的情况下就能进行更深思熟虑的推理,已颠覆了大语言模型(LLM)领域。
从DeepSeek MoE专家负载均衡谈起
上周中的时候, 同事给我了一份线上DeepSeek-R1推理的Expert激活的数据用来研究一些专家负载均衡的算法, 当然这些线上数据来自于公司内部的请求, 从中观测出前面10层专家基本上是相对均衡的, 而越到后面不均衡程度差异越大. 当时讨论到这个问题时, 是怀疑内部的一些请求是否专注于电商领域而带来的不平衡特性, 于是做了一些研究. 恰好搜到Intel的一篇论文《Semantic Specialization in MoE Appears with Scale: A Study of DeepSeek-R1 Expert Specialization》[1]有一些基于语义的MoE分析专家的专业性相关的问题, 再加上前几天看到某个公众号采访某院长的一个比较有趣的说法:“Dense模型适合toB业务,MoE模型适合toC业务”.
一条神奇的指令,DeepSeek直接文生图
最近又发现一条神奇的提示词指令,借助Markdown的image标签可以直接在DeepSeek当前窗口得到我们想要的图片。 效果预览我们先看看这条指令的效果:图片这是岳哥在DeepSeek官网直接生成的一辆高铁行驶在海面上生成的图片,可以在DeepSeek上直接预览和下载图片。 提示词指令这条提示词指令具体如下:复制提示词解读这条这里分为3部分第一部分的描述性内容是告诉DeepSeek要生成AI图片,并且指出要如何生成第二部分的url则是具体的AI图片生成的指令,通过替换Prompt的内容来生成第三部分则是希望DeepSeek将AI绘画的提示词以中文的形式显示出来虽然是在DeepSeek当前窗口直接输出,但其实上这里还是借助了第三方AI绘画网站生成图片的功能。
00后用DeepSeek直播1天卖出3.3亿元
近日,在浙江杭州,随着 AI 工具 DeepSeek 的走红,越来越多的创业者开始借助其强大的功能来实现盈利。 日前,关于一位00后主播在使用 DeepSeek 进行直播时,仅一天就成功销售了价值3.3亿元的商品,引起了广泛关注。 据报道,在 DeepSeek 的帮助下,许多商家和个人都尝试了新的销售方式。
LeCun 最新访谈对 DeepSeek 一顿猛夸,还谈了 AI 发展需理解物理世界
他表示,DeepSeek 是一项很出色的成果,它的开源不只是成果创造者受益,全世界都能从中受益。
报名|这可能是讨论 Deepseek 部署与实践最有深度的闭门会
DeepSeek “接入潮” 持续火热,如何安全、可靠、高效地集成 DeepSeek 等先进 AI 能力,已成为各行各业当前关注的焦点。 为系统性解决企业从技术选型到价值落地的全链路挑战,加速企业部署 DeepSeek 步伐,由张江集团、AI在线主办,模力社区协办的「DeepSeek 部署应用与技术开发」闭门研讨会,将于 3 月 13 日(周四)在上海浦东模力社区举办。 本次研讨会汇聚垂类模型企业、AI 芯片厂商、模型部署服务厂商等企业在内的多位重磅嘉宾,围绕 DeepSeek 部署策略与选择、应用落地与场景、技术实践与挑战等热门话题,将带来两场精彩的主题演讲与三场高质量圆桌对话。
董明珠:将基于 DeepSeek 等打造格力智能家居垂类大模型
格力董明珠透露:“格力电器已成功将自有的多模型框架与 DeepSeek R1 满血版大模型深度融合。”
大模型本地部署的“隐形炸弹”,你的数据安全吗?
作者 | 朱雀实验室随着DeepSeek R1等开源大模型的火爆,越来越多的开发者、企业甚至开始尝试在本地部署大语言模型,享受AI带来的便利。 然而近期腾讯混元安全团队-朱雀实验室发现:这些广受欢迎的AI工具中有不少存在安全隐患。 如果使用不当,攻击者可能窃取用户数据、滥用算力资源,甚至控制用户设备。
北京大学联合华为发布全栈开源 DeepSeek 推理方案
据介绍,该方案基于北大自研 SCOW 算力平台系统、鹤思调度系统,并整合 DeepSeek、openEuler、MindSpore 与 vLLM / RAY 等社区开源组件,实现华为昇腾上的 DeepSeek 高效推理,并支持大规模算力集群训推一体化部署。所有开发者均可获取源码并根据需求二次开发,性能接近闭源方案。
最新版DeepSeek保姆喂饭级安装教程:本地部署+避坑指南(升级版)
本文旨在提供一个全面且详细的DeepSeek本地部署指南,帮助大家在自己的设备上成功运行DeepSeek模型。 无论你是AI领域的初学者还是经验丰富的开发者,都能通过本文的指导,轻松完成DeepSeek的本地部署。 一、本地部署的适用场景DeepSeek本地部署适合以下场景:高性能硬件配置:如果你的电脑配置较高,特别是拥有独立显卡和足够的存储空间,那么本地部署将能充分利用这些硬件资源。
Manus是智能体的"DeepSeek时刻"?DeepSeek本尊怎么看?
Manus从一夜爆火到一码难求,市场开始出现不同的声音。 支持者认为,Manus是智能体的"DeepSeek时刻";反对者认为,Manus是一场精心策划的“炒作”。 Manus成色究竟如何,不妨来听听作为对标对象的DeepSeek的回答。
Mistral 拥抱开源:预告新 AI 模型,将超越 DeepSeek
法国公司 Mistral AI 计划拥抱开源策略,发布超越 DeepSeek 的新模型。CEO Arthur Mensch 表示,开源模式有助于低成本开发强大 AI 技术,推动全球 AI 生态协作发展。#MistralAI #开源AI
小布助手接入 DeepSeek-R1 满血版,OPPO 公布 40 多款适配机型
据介绍,目前共有 40+ 款 OPPO / 一加机型覆盖支持,相关机型已在 2 月 26 日开始陆续推送。OPPO Find N5 出厂默认接入 DeepSeek-R1 满血版。
美团开源首发 INT8 无损满血版 DeepSeek R1,部署 A100 实现 50% 吞吐提升
目前,量化代码已经合入到了开源 LLM 推理框架 SGLang,量化模型已经发布到了 Hugging Face 社区,方便用户使用。
QQ音乐推出"AI音乐播客"创新功能:可以边听边懂边互动
QQ音乐近日推出了首创性的"AI音乐播客"技术功能,这一突破性技术将人工智能技术与播客形式深度融入音乐场景,通过Deepseek以及自研的琴语TTS大模型、文曲大模型等领先AI技术与多模态内容整合,为用户创造"边听歌边解读"的沉浸式体验,以技术手段进一步构建音乐新生态。 这项创新功能的核心在于三大引擎技术的深度融合,构建了从内容生成到情感传递的完整AI音乐生态链。 首先,利用DeepSeek语义引擎通过深度学习精准解析歌曲创作故事、文化背景与情感脉络,结合歌手经历、时代背景及歌词意象,将碎片化信息整合为结构化知识图谱,深化音乐内涵解读。
二次增长!ChatGPT周活用户数据翻倍到2亿!一文梳理OpenAI的流量暴涨之路。DeepSeek紧随其后!
知名风险投资公司 Andreessen Horowitz (a16z) 周四刚刚发布了新报告。 报告显示,OpenAI 旗下的聊天机器人ChatGPT在 2024 年下半年恢复了稳健增长。 报告发现,ChatGPT 用了 9 个月的时间从 2023 年 11 月的每周 1 亿活跃用户增长到 2024 年 8 月的 2 亿,但现在该应用程序只用了不到六个月的时间就再次将这一数字翻了一番。
小时级部署交付,分钟级AI应用构建,这款火山引擎AI一体机如何做到的?
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)当前,DeepSeek的推出为企业智能化转型带来新的想象空间。 然而,想要短期内快速用好DeepSeek来服务企业自身的业务场景,绝非易事。 最为明显的一个现象是:没有进行整体的应用规划而直接本地部署DeepSeek,一旦接入实际的业务场景和数据,往往会导致效果不达预期,甚至适得其反。