AIGC宇宙 AIGC宇宙

文章列表

全能且实用!实战测评谷歌最新模型Gemini 2.5 Pro

自从春节期间的 deepseek 出圈后,各家大模型就开始疯狂内卷,真应了那句话,AI 一天,人间一年。 尤其是到了近一个月,AI 圈更是打的火热,各大 AI 大厂都在玩命更新,那在这些更新里到底哪个更好用呢? 不知道大家能不能清楚,反正我是有点分不清,所以这个假期花了几天时间,实验对比了一圈,最终发现谷歌最新的模型 Gemini 2.5 Pro 成了最好用的。
4/8/2025 7:52:09 AM
彩云Sky

谷歌向 Pixel 9 /三星 Galaxy S25 推出 Gemini Live AI“实时拍摄”及识图导购助手功能

谷歌Gemini Live AI推出实时拍摄和识图导购功能,支持Pixel 9和Galaxy S25,可识别物体并比价购物。#谷歌AI##智能手机#
4/8/2025 7:36:23 AM
漾仔

大模型部署工具 Ollama 使用指南:技巧与问题解决全攻略

一、Ollama 是什么? Ollama 是一个开源的本地大模型部署工具,旨在简化大型语言模型(LLM)的运行和管理。 通过简单命令,用户可以在消费级设备上快速启动和运行开源模型(如 Llama、DeepSeek 等),无需复杂配置。
4/8/2025 3:22:00 AM
wayn

比DeepSeek更惊艳,生成式决策如何让机器人拥有创造力?

当传统机器人遇见生成式AI,会擦出什么样的火花? 技术的演进从不停滞。 如今,我们正处在具身智能发展的关键节点,生成式决策技术正悄然改变着这个领域的游戏规则。
4/8/2025 2:00:00 AM
大数据AI智能圈

谷歌研究:合成数据使大模型数学推理能力提升八倍

最近,来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。 据专注于人工智能发展的研究机构 Epoch AI 报告显示,目前全球约有 300 万亿个公开可用的高质量文本训练标记。 然而,随着类似 ChatGPT 这样的大模型的迅猛发展,对训练数据的需求呈指数级增长,预计到 2026 年之前,这些数据将被耗尽。
4/8/2025 12:40:00 AM
远洋

OpenAI宣布GPT-5推迟数月发布 技术整合难度成倍上升

OpenAI 首席执行官萨姆·奥特曼(Sam Altman)近日通过社交媒体宣布,GPT-5 的发布计划将推迟,预计在未来几个月内正式推出。 此前,OpenAI 计划在 2025 年初发布 GPT-5,但最终决定延后,以便将该模型做得比预期更好。 奥特曼表示,推迟发布的原因是 GPT-5 的能力远超预期,整合所需资源和生态准备超出了当前可控范围。
4/8/2025 12:20:00 AM

论文读得慢,可能是工具的锅,一手实测科研专用版「DeepSeek」

「未来,99% 的 attention 将是大模型 attention,而不是人类 attention。 」这是 AI 大牛 Andrej Karpathy 前段时间的一个预言。 这里的「attention」可以理解为对内容的需求、处理和分析。
4/7/2025 1:30:00 PM
机器之心

中美 AI 挑战东京大学入学考试:双双合格,英语优异,数学欠佳

大学入学共通考试和二次考试合计的理科得分(满分 550 分)中,o1 获得了 374 分,R1 获得了 369 分,两者均超过了东大在 3 月 10 日公布的理科 3 类合格最低分数线(368.7 分)。
4/7/2025 11:53:05 AM
清源

消息称 OpenAI 考虑收购 AI 设备初创公司 io Products,后者由 Jony Ive 与 Sam Altman 共同创立

OpenAI正讨论收购由前苹果设计师Jony Ive和OpenAI CEO Sam Altman共同创立的io Products公司,该公司专注于研发AI个人设备,或将革新用户与技术互动方式。#OpenAI# #JonyIve#
4/7/2025 10:29:46 AM
远洋

中国自主量子计算机“本源悟空”全球首次运行十亿级 AI 微调大模型

据《科创板日报》从安徽省量子计算工程研究中心获悉,本源量子、合肥综合性国家科学中心人工智能研究院等机构联合攻关,在中国第三代自主超导量子计算机“本源悟空”真机上,全球首次运行十亿参数 AI 大模型微调任务。
4/7/2025 9:41:45 AM
远洋

LLM「想太多」有救了!高效推理让大模型思考过程更精简

LLM的推理能力显著增强,然而,这个「超级大脑」也有自己的烦恼。 有时候回答会绕好大一个圈子,推理过程冗长又复杂,虽能得出正确答案,但耗费了不少时间和计算资源。 比如问它「2加3等于多少」,它可能会从数字的概念、加法原理开始,洋洋洒洒说上一大通,这在实际应用中可太影响效率啦。
4/7/2025 9:23:00 AM
新智元

DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布! 新智元 新智元 2025年04月04日 17:33

DeepSeek R2,果然近了。 最近,DeepSeek和清华的研究者发表的这篇论文,探讨了奖励模型的推理时Scaling方法。 论文地址:,强化学习(RL)已广泛应用于LLM的大规模后训练阶段。
4/7/2025 8:42:00 AM
新智元

一文读懂开源 Llama 4 模型

Hello folks,我是 Luga,今天我们来聊一下人工智能领域的最新大模型技术进展 - 构建高效、灵活、以及开源的的大模型 - Llama 4 。 在人工智能领域,随着技术的不断进步,越来越多的强大语言模型应运而生。 Llama 4 作为 Meta 推出的最新一代大规模语言模型,凭借其卓越的性能和创新的架构设计,成为了当前 AI 领域的焦点之一。
4/7/2025 8:40:00 AM
Luga Lee

大模型除了聊天还能做什么?关于大模型的分类和应用

大模型技术发展到今天,其功能可以说是日新月异;并且很多企业已经在探索大模型的应用场景和技术实现;但是很多人到现在对大模型的了解仅仅只限于能聊个天,问个问题。 但实际上,大模型能够做的事要远比我们想象中的要多的多;因此,今天我们就从用户和技术两个角度来介绍一下大模型的应用。 关于大模型的分类和应用问题如果想弄清楚大模型是怎么使用的,首先要知道大模型的分类;不同类型的模型适合不同的应用场景,其功能和实现也各不相同。
4/7/2025 8:15:00 AM
DFires

吉卜力风格 AI 图刷屏之际,消息称 OpenAI 正测试 GPT-4o 生图模型水印

消息人士也称,OpenAI近期确实开始尝试在免费账户生成的图片中加入水印。而只要订阅了 ChatGPT Plus,就可以保存没有水印的图像。
4/7/2025 8:00:33 AM
清源

实测700多张图!深度测评最懂设计的AI生图模型:Ideogram 3.0

大家好,我是言川。 最近 GPT-4o 发布的图像功能太炸裂了,整个圈子里都是 4o 生成的作品。 但我要告诉大家的是,就在 GPT-4o 图像功能发布的第二天,有一款图像模型也升级了。
4/7/2025 7:33:05 AM
言川Artie

Llama 4开源王者归来!推理、编码打平DeepSeek V3但参数减一半,一张H100就能跑,还有巨兽2万亿参数模型!

编辑 | 李美涵出品 | 51CTO技术栈(微信号:blog51cto)深夜,Meta如期发布了全新的开源大型模型系列——Llama 4,并未出现任何“跳票”传闻中的推迟情况! 图片此次发布也标志着Meta与近来崛起的开源新王 DeepSeek 正面硬钢。 Meta官推更是表示:表示:“今天开启了原生多模态AI创新的新时代”。
4/7/2025 7:00:00 AM
李美涵

模态编码器|EVA改进之EVA-02

来自智源曹越团队在EVA的优化改进方面的工作EVA-02,项目地址::在CV领域,训练、调优和评估非常大的视觉模型需要大量的计算资源,限制了许多研究人员和开发者的参与。 因此,本研究主要目的是提供一种高效且性能强大的预训练方法,不仅能够在多种下游任务中展现出色的迁移学习能力,而且还能显著减少参数数量和计算成本。 01、模型架构EVA-02的基础是一个改进版的纯Transformer架构,该架构在原始ViT的基础上进行了若干重要的修改,以更好地适应大规模预训练任务的需求。
4/7/2025 6:30:00 AM
Goldma