OpenAI o3 模型运行成本估算大幅上调:单次任务从 3000 美元涨至 3 万美元
Arc Prize Foundation 大幅上调 OpenAI o3 模型运行成本估算,从 3000 美元涨至 3 万美元。高昂成本凸显 AI 模型特定任务的高成本难题,控制成本成行业挑战。##AI模型成本##
AI算法 | 训练数据的数量、质量及语言分布等因素对中文大模型性能的影响
已有LLM研究探索了训练数据对模型性能的影响,但这些研究大多集中在英文模型上,对于中文模型的研究相对较少。 今天来看一篇来自贝壳的研究团队在2023年的一篇工作——《Towards Better Instruction Following Language Models for Chinese: Investigating the Impact of Training Data and Evaluation》。 这篇工作的核心目标是提升中文指令跟随语言模型的性能。
谷歌 AI 笔记应用 NotebookLM 新增“发现资料”功能,可自动检索相关网络资源
谷歌NotebookLM推出“发现资料”新功能,基于Gemini技术自动搜索网络资源,提升学习研究效率。用户只需输入兴趣点,AI即可推荐相关资源并生成摘要。#AI学习工具##NotebookLM#
深度解析:通过 AIBrix 多节点部署 DeepSeek-R1 671B 模型
原文链接: AIBrix 分布式推理平台实现 DeepSeek-R1 671B 的多节点部署。 DeepSeek-R1 通过渐进式训练框架展现出优秀的逻辑推理能力 —— 在 6710 亿总参数量中,其动态激活的 370 亿参数与 128k 上下文窗口,使其在复杂任务处理中表现卓越。 然而,如此庞大的模型规模对部署环境提出了严苛挑战,尤其是分布式推理的资源调度与性能优化。
GPT-4o深度体验10大场景!可能ComfyUI工作流真不用学了
上周我介绍了 gemini 生图模型,我觉得已经算是实用性很强了,但紧接着 Open AI 就卷起来了,也更新了一波图像生成模型,然后迅速在全网刷屏。 那它的效果到底好不好用呢? 是不是被吹的很厉害?
美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭
3月26号,ETH等团队的一项研究一经发布,就引起了圈内热议。 这项研究彻底撕开遮羞布,直接击碎了「LLM会做数学题」这个神话! 论文地址:,MathArena团队使用最近的2025年美国数学奥林匹克竞赛进行了详细评估,结果令人大吃一惊——所有大模型的得分,都低于5%!
DeepSeek再度升级,厉害了!
当代的程序员,避免不了各种AI工具打交道,可以说,这些AI工具早已成为我们生活和工作的一部分。 从之前的ChatGpt,到今年年初开源的DeepSeek爆火,国产新锐 DeepSeek 犹如一匹黑马,将中国的 AI 技术从“追赶者”转变为“引领者”。 现在各个大厂也都纷纷部署了DeepSeek,我也把重心从国外的产品转向了国内 AI。
基于DeepSeek + VSCode 实现AI辅助编程
随着人工智能技术的飞速发展,AI 辅助编程逐渐成为提升开发效率、优化代码质量的重要工具。 本文通过结合 DeepSeek 的强大语言模型和 VSCode 的高效开发环境,展示了如何利用 AI 辅助编程完成一个经典的 MapReduce 词频统计任务。 这一实践不仅展示了 AI 在编程中的应用潜力,还为开发者提供了一个高效、便捷的开发流程示例,帮助读者快速上手 AI 辅助编程,并探索其在实际项目中的应用价值。
2025美国最新奥数题,让大模型集体翻车,DeepSeek R1平均分也不到5%
当 AI 翻开奥数题,CPU 也烧了! 还记得那些被奥数题折磨得彻夜难眠的日子吗? 当你在凌晨三点对着一道几何证明题抓耳挠腮、怀疑人生的时候,你可能会想:「要是有个超级大脑能帮我解决这些问题该多好啊!
Gemini Canvas 全民玩疯了!免费可用!谷歌:我们的TPU烫麻了,简直火上浇油!皮查伊:我们是SOTA!氛围编程来了
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)自Gemini2.5 Pro发布后,被OpenAI的“吉卜力”画风成功“阻击”的谷歌,逆势火了一把。 4月1日凌晨,谷歌发布了“Google Gemini Canvas”,引起了社媒用户的疯狂转发。 图片从提示到原型只需几分钟,任何人都可以使用Canvas进行编码和创作。
代码显示谷歌正在开发儿童版 Gemini:能编故事,还能辅导作业
谷歌在 Gemini 的安全页面上提到,该 AI 针对青少年用户设有“更严格”的内容政策和默认保护措施。
DeepSeek 首次用于地震国际救援,7 小时攻克缅甸救灾语言关
近日缅甸发生7.9级地震,中国团队用DeepSeek 7小时开发中缅英互译系统,助力救援。至今700余人使用该平台,这是中国大模型首用于地震国际救援。#DeepSeek #地震国际救援 #中缅英互译系统
DeepSeek 新专利公布:减少数据采集时网络资源消耗
可对未下载的链接进行质量推断,通过择优下载分配额度的方式,减少低质量网页下载和重复下载,提高数据质量及下载效率,减少在数据采集过程中网络资源的消耗。
DeepSeek-V3击败R1开源登顶!杭州黑马撼动硅谷AI霸主,抹去1万亿市值神话
DeepSeek依然很能打,春节余波还在扩散! 据AI产品分析平台aitools.xyz统计,DeepSeek每月新增网站访问量超过了ChatGPT。 作为异军突起的现象级产品,DeepSeek的增长速度除了创造AI产品的增长奇迹,更是重新定义了全球的AI竞赛格局。
DeepSeek R1本地训练全流程实操指南,手把手教你打通其“任督二脉”
作者 | asher许多关于 DeepSeek R1 的复现文章,主要聚焦在“rewards的设计、训练指标的变化、benchmark测评”这些内容,但是对于“本地训练”这个开启深度探索的关键前置步骤,却很少有人深挖。 可能有人觉得,照着readme操作就能轻松训练了吧? 太天真啦!
OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的” 关注前沿科技 量子位 2025年04月01日 08:38
一夜之间,OpenAI更新三大动向,开源、融资、用户暴增。 第一,将开源一个具备推理能力的大语言模型,包含参数权重那种。 上一次这样开源还是6年前推出GPT-2。
人工智能应用就是大模型能力+场景,基于大模型构建应用,首先要了解大模型的能力圈
在关于大模型应用方面,虽然也了解和应用过其中的一些技术;但经过这段时间的实践和思考发现,对大模型应用的认识还很浅显,因此在此记录一下自己的思考。 大模型应用的思考大模型作为人工智能应用的底座技术,所有应用场景和技术都是构建在大模型之上;但很多时候我们都搞错了一件事,那就是我们没有搞清楚大模型能力和其它技术的关联和区别。 因此,在这里我们要搞清楚一个概念,那就是大模型能力;所谓大模型的能力,就是模型开发人员怎么把模型做的更好更强,其中设计到模型的设计,训练等;具体有神经网络架构,模型蒸馏等等。
ChatGPT 图像生成功能火爆,OpenAI CEO 称容量问题将导致产品延期
OpenAI CEO山姆・奥尔特曼透露,ChatGPT新推出的图像生成工具因人气过高导致服务延迟,团队正加班加点解决容量问题。该功能因能出色重现吉卜力等艺术风格备受关注,但也引发版权讨论。#OpenAI##ChatGPT#