Gemini Canvas 全民玩疯了!免费可用!谷歌:我们的TPU烫麻了,简直火上浇油!皮查伊:我们是SOTA!氛围编程来了
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)自Gemini2.5 Pro发布后,被OpenAI的“吉卜力”画风成功“阻击”的谷歌,逆势火了一把。 4月1日凌晨,谷歌发布了“Google Gemini Canvas”,引起了社媒用户的疯狂转发。 图片从提示到原型只需几分钟,任何人都可以使用Canvas进行编码和创作。
代码显示谷歌正在开发儿童版 Gemini:能编故事,还能辅导作业
谷歌在 Gemini 的安全页面上提到,该 AI 针对青少年用户设有“更严格”的内容政策和默认保护措施。
DeepSeek 首次用于地震国际救援,7 小时攻克缅甸救灾语言关
近日缅甸发生7.9级地震,中国团队用DeepSeek 7小时开发中缅英互译系统,助力救援。至今700余人使用该平台,这是中国大模型首用于地震国际救援。#DeepSeek #地震国际救援 #中缅英互译系统
DeepSeek 新专利公布:减少数据采集时网络资源消耗
可对未下载的链接进行质量推断,通过择优下载分配额度的方式,减少低质量网页下载和重复下载,提高数据质量及下载效率,减少在数据采集过程中网络资源的消耗。
DeepSeek-V3击败R1开源登顶!杭州黑马撼动硅谷AI霸主,抹去1万亿市值神话
DeepSeek依然很能打,春节余波还在扩散! 据AI产品分析平台aitools.xyz统计,DeepSeek每月新增网站访问量超过了ChatGPT。 作为异军突起的现象级产品,DeepSeek的增长速度除了创造AI产品的增长奇迹,更是重新定义了全球的AI竞赛格局。
DeepSeek R1本地训练全流程实操指南,手把手教你打通其“任督二脉”
作者 | asher许多关于 DeepSeek R1 的复现文章,主要聚焦在“rewards的设计、训练指标的变化、benchmark测评”这些内容,但是对于“本地训练”这个开启深度探索的关键前置步骤,却很少有人深挖。 可能有人觉得,照着readme操作就能轻松训练了吧? 太天真啦!
OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的” 关注前沿科技 量子位 2025年04月01日 08:38
一夜之间,OpenAI更新三大动向,开源、融资、用户暴增。 第一,将开源一个具备推理能力的大语言模型,包含参数权重那种。 上一次这样开源还是6年前推出GPT-2。
人工智能应用就是大模型能力+场景,基于大模型构建应用,首先要了解大模型的能力圈
在关于大模型应用方面,虽然也了解和应用过其中的一些技术;但经过这段时间的实践和思考发现,对大模型应用的认识还很浅显,因此在此记录一下自己的思考。 大模型应用的思考大模型作为人工智能应用的底座技术,所有应用场景和技术都是构建在大模型之上;但很多时候我们都搞错了一件事,那就是我们没有搞清楚大模型能力和其它技术的关联和区别。 因此,在这里我们要搞清楚一个概念,那就是大模型能力;所谓大模型的能力,就是模型开发人员怎么把模型做的更好更强,其中设计到模型的设计,训练等;具体有神经网络架构,模型蒸馏等等。
ChatGPT 图像生成功能火爆,OpenAI CEO 称容量问题将导致产品延期
OpenAI CEO山姆・奥尔特曼透露,ChatGPT新推出的图像生成工具因人气过高导致服务延迟,团队正加班加点解决容量问题。该功能因能出色重现吉卜力等艺术风格备受关注,但也引发版权讨论。#OpenAI##ChatGPT#
3分钟完成3天工作量!实测GPT-4o外挂级生图效果
一、技术革新:AI 绘图从专业工具到自然语言交互的范式跃迁. OpenAI 这次给 GPT-4o 的图像功能直接掀桌了! 现在大家还在纠结"生成质量够不够高清""边缘有没有锯齿",人家早就玩起了"意念绘图"——你根本不用懂什么ControlNet、LoRA,对着手机唠嗑就能把专业设计师在SD里折腾半天的活儿全包圆了!
随着OpenAI每小时新增一百万用户,企业AI主导地位的竞争进入新阶段
这一里程碑式的投资凸显了AI日益上升的重要性,也标志着企业技术格局的转变。 有了如此庞大的资金储备,OpenAI在与谷歌、AWS等巨头的较量中,将有更强的持久力,在与合作伙伴微软的敏感关系中也将拥有更大的筹码,更不用说还有资金与Anthropic和马斯克创办的新公司xAI等强劲对手抗衡。 在这轮融资结束之前,OpenAI是否有资金继续在顶级行列中竞争,仍是个未知数。
别怕AI抢饭碗!设计师未来最值钱的技能根本不是画图
想象一下,你是一个忙得焦头烂额的设计师,手上有个项目 deadline 近在眼前。 需求方要的是一套复杂的设计方案,你却还在为一张图的细节调整抓耳挠腮。 就在你准备熬夜加班时,一个 AI 助手跳出来,轻声说:“别急,我来帮你。
「DeepSeek-V3 技术解析」:无辅助损失函数的负载均衡
在混合专家模型(MoE)的实践中,负载不均衡俨然已成为制约模型性能提升的关键瓶颈之一。 传统的均衡策略往往需要引入复杂的辅助损失函数,不仅增加了训练的复杂度,还可能干扰模型的核心学习目标。 工程师们在提升模型效率的道路上,一直苦苦追寻着一个优雅而高效的平衡解决方案。
DeepSeek-R1之后推理模型发展如何?Raschka长文梳理后R1时代14篇重要论文
近日,Deepseek R1 等一系列推理大语言模型已成为 2025 年最热门的话题之一。 在过去的几周里,研究人员推出了许多改进推理的新策略,包括扩展简单测试 - 时间规模化(S1)、关联思维链(Chain of Associated thoughts)、Inner Transformer 等方法。 不仅如此,还有来自腾讯实验室的研究人员探索了 Thoughts Are All Over the Place,通过衡量不正确答案中的 token 效率来鼓励模型对每条推理路径进行更深入的探索;来自美国马里兰大学和橡树岭国家实验室等机构联合提出了 Recurrent Block,通过重复调用同一个循环体的方式,在推理阶段可以迭代任意多次;以及来自美国 Zoom 视频通讯公司的研究团队提出了 Chain of Draft(CoD),基于更接近人类推理的提示策略提出了草稿图,这是一种优先考虑效率和推理的提示词策略。
关于大模型智能体意图识别不准确问题:function call 的缺陷
最近在研究大模型智能体也就是Agent的过程中,遇到了一个很严重的问题,直接影响到Agent的质量和效果;那就是意图识别不准确,也可以说是Agent的幻觉问题。 其产生的原因就在于大模型有时无法准确识别出用户意图,无法准确调用相应的函数。 意图识别不准确现在大模型技术在应用方面,主要有两大方向;其一就是大模型的创作能力,简单来说就是内容生成方面,如生成图片,文字,视频,也包括RAG等。
GPT-2后首次!OpenAI将开源带推理能力的开源权重模型!网友:能比DeepSeek R1强吗?
出品 | 51CTO技术栈(微信号:blog51cto)奥特曼发布X文,宣布了一个重磅推理开源权重模型:长话短说:我们即将在未来几个月发布一个强大的开源语言模型,具备推理能力,并希望与开发者交流如何让它更有用:! 我们计划发布自 GPT-2 以来的首个开源语言模型。 我们已经考虑了很久,但之前有其他优先事项。
刚刚,奥特曼官宣开源:自GPT-2之后,我们要发首个带推理能力的开放权重模型
OpenAI 终于又要「Open」一回了! 今天凌晨,奥特曼发推宣布,OpenAI 将在未来几个月发布一款具备推理能力的强大新型开放权重模型。 OpenAI 希望与广大开发者、研究者和社区交流合作,探讨如何让这个模型发挥最大作用。
AI算法 | 如何训练自己的大模型?
1、第一阶段:二次预训练模型选择与转换在开始训练之前,需要选择一个合适的基础模型。 本文以LLaMA-7B为例,简单介绍下。 为了方便后续的操作,将LLaMA-7B模型转换为Hugging Face格式。