大模型

OpenAI发布新年目标，Agent智能体或将迎来百模大战

2025年1月1日，OpenAI CEO 奥特曼公布了公司的新年目标，涵盖AGI、智能体、4o升级、模型更好记忆、更长上下文等等。图片关于智能体，有网友爆料，OpenAI 可能在 1 月份发布一个名为 “operator” 的 Agent，这个 Agent 将具备直接控制电脑的能力。图片其实24年10月份的时候，Claude 就已经发布了基于 Claude 3.5 Sonnet 多模态大模型，可操作电脑的智能体。

1/3/2025 11:02:38 AM

渡码

阿里云与零一万物达成战略合作，成立“产业大模型联合实验室” ，加速落地应用

近期，阿里云和大模型头部企业零一万物达成模型平台业务的战略合作，双方将成立“产业大模型联合实验室”，联手加速大模型从技术到应用的落地，进一步扩大产业大模型的生态整合。据悉，双方深度战略合作的产业大模型联合实验室包含技术、业务、人才等板块，阿里和零一万物将结合两个团队全球顶尖的大模型研发实力，形成从下一代基座模型技术探索到产业落地大模型服务的组合拳，全面通过阿里云百炼大模型平台的模型服务层面向市场，针对 ToB 行业打造更强更全面的大模型解决方案，加速大模型穿透千行百业。在开展的合作中，阿里云拥有从技术到算力到服务层的平台级完整链条，通义系列大模型将作为具有强大通用能力的“教师模型”，零一万物拥有国际前沿的高性价比模型能力，能够敏捷批量训练垂直定向的产业智能模型，双方联手将加速大模型的产业落地，拓宽大模型生态前景。

1/3/2025 10:32:00 AM

新闻助手

金融风控领域的大模型落地实践

Akulaku 作为一个海外互联网金融平台，运用大模型优化金融风控、客服及电商推荐等场景，通过集成图像（如 KYC 人脸识别）、文本（如智能客服）与设备数据，增强风控系统效能与用户体验。大模型的引入旨在提升效率，通过优化小模型构建与工作流程自动化，减轻业务人员负担。智能体在金融领域的应用包括欺诈调查与数据分析助手，预示着通过大模型辅助构建类 AGI 系统的可能性，能够进一步提升金融风控的效率与效果，在金融领域拥有广泛的应用前景。

1/3/2025 8:26:17 AM

黄泓

别再将LLM当成数据库了

译者 | 布加迪审校 | 重楼想象一下，你戴着耳机驾驶一辆汽车，每五分钟才更新一次路况信息，而不是持续不断地提供当前位置情况的视频流。过不了多久，你就会撞车。虽然这种类型的批处理在现实世界中并不适用，却是当今许多系统运行的方式。

1/3/2025 8:13:08 AM

布加迪

智象未来多模态大模型3.0全球首发，创始人兼CEO梅涛演讲实录来了

2024年12月28日，智象未来科技有限公司在安徽省人工智能产业先导区启动仪式中，宣布智象多模态生成大模型3.0与智象多模态理解大模型1.0同时发布。上海电影集团、中国移动咪咕音乐、科大讯飞等企业参加。加拿大工程院外籍院士、智象未来创始人兼CEO梅涛进行现场演讲。

1/2/2025 4:20:00 PM

新闻助手

全新模型RoboVLMs解锁VLA无限可能，真实机器人实验交出满分答卷

本文作者来自清华大学、字节跳动、中科院自动化所、上海交通大学和新加坡国立大学。作者列表：李兴航、李沛言、刘明桓、王栋、刘济榕、康炳易、马骁、孔涛、张翰博和刘华平。第一作者李兴航是清华大学计算机系博士生。

1/2/2025 2:30:00 PM

机器之心

多模态模型已落地多领域，OpenBayes贝式计算获评「大模型最具潜力创业企业 TOP 10」

缩放定律的放缓带来的技术路径演变在 2024 年的 NeurIPS 会议上，Ilya Sutskever 提出了一系列关于人工智能发展的挑战性观点，尤其集中于 Scaling Law 的观点：「现有的预训练方法将会结束」，这不仅是一次技术的自然演进，也可能标志着对当前「大力出奇迹」方法的根本性质疑。 Ilya 讨论了预训练模型的局限性，预见 AI 系统需要发展出更加接近人类思考方式的推理能力。他强调，为了突破当前的局限并继续提升 AI 的能力，必须寻找新的训练方法。

1/2/2025 2:20:00 PM

机器之心

全面打破GPT-4垄断、DeepSeek打下训练成本...2024年大模型领域进展全复盘

刚刚过去的 2024 年是生成式 AI 大发展的一年，我们见证了 OpenAI Sora 的崛起，大模型服务价格的飞速下降，以及国内开源大模型的奋起直追。这全方位的快速发展让我们对下一波 AI 的新技术大规模应用充满了信心。对于身在 AI 领域的工程师和学者们来说，他们看待这一年的观点会有不同吗？

1/2/2025 1:15:00 PM

机器之心

微软论文意外「走光」，OpenAI参数全泄密！GPT-4o仅200B，o1 300B

谁能想到，微软在一篇医学领域的论文里，竟然把OpenAI模型的参数全「曝光」了！ GPT-4参数约1.76万亿GPT-4o参数约2000亿GPT-4o mini参数约80亿o1-preview参数约3000亿o1-mini参数约1000亿Claude 3.5 Sonnet参数约1750亿研究人员：参数均为估算值让所有人难以置信的是，GPT-4o系列的参数如此少，mini版甚至只有8B。有网友猜测，4o mini是一个大约有40B参数的MoE模型，其中激活参数为8B。

1/2/2025 1:00:00 PM

新智元

上交大揭露大模型审稿风险：一句话就能让论文评分飞升

大语言模型（LLMs）正以前所未有的方式，深刻影响着学术同行评审的格局。同行评审作为科学研究的基石，其重要性毋庸置疑。然而，随着大语言模型逐渐渗透到这一核心过程，我们是否已经准备好面对它可能带来的深远影响？

1/2/2025 7:00:00 AM

2025 年考研数学一得 126 分，智谱深度推理模型 GLM-Zero 预览版上线

GLM-Zero-Preview 是 GLM 家族中专注于增强 AI 推理能力的模型，擅长处理数理逻辑、代码和需要深度推理的复杂问题。

12/31/2024 5:53:12 PM

沛霖（实习）

黄仁勋自掏腰包50亿，开源英伟达GPU管理工具

离2025年只剩十几个小时，黄仁勋拿出50亿真金白银给大家发红包了！他刚花7亿美金（51亿RMB）收购了一家初创公司，专门做GPU管理工具的。并且立刻就宣布：开源所有平台和技术，买了英伟达GPU就能免费用。

12/31/2024 3:00:00 PM

量子位

ViT作者飞机上也要读的改进版Transformer论文，花2个小时详细批注解读分享出来

ViT核心作者Lucas Beyer，长文分析了一篇改进Transformer架构的论文，引起推荐围观。他前不久从谷歌跳槽到OpenAI，这次是在飞机上阅读论文并写下了分析。这篇论文被他简写为DiffTranformer，不过不是Sora底层架构的那个Diffusion Transformer，而是不久前来自微软的Differencial Transformer。

12/31/2024 2:30:00 PM

量子位

AI能力权威认证！用友大易入选最佳大模型产品及应用TOP20

近日，「AI中国」AI在线2024年度榜单正式揭晓，基于YonGPT用友企业服务大模型的AI招聘系统成功上榜「最佳大模型产品及应用TOP20」。用友大易依托于YonGPT的强大功能，探索并实现AI技术在招聘方面的深度应用和商业价值，助力企业实现招聘的提效增质。凭借其突出的创新性和实用性荣获「最佳大模型产品及应用TOP20」奖项。

12/31/2024 11:32:00 AM

新闻助手

G行人工智能与大模型技术的应用与发展

一、人工智能与大模型技术在银行业的普遍应用1. 客户服务和智能客服客户服务是人工智能应用的核心领域之一。传统银行客户服务依赖专业的人工客服，虽然能提供较高的情感交互，但因响应时间较长、服务覆盖面有限以及成本较高，难以满足现代客户对高效、便捷服务的需求。

12/31/2024 8:46:28 AM

王涛刘丁

减少LLM幻觉的五大技巧和方法

译者 | 布加迪审校 | 重楼本文介绍了使用LangGraph减少LLM幻觉的简单技巧。如果你使用过LLM，就知道它们有时会产生幻觉。这意味着它们生成的文本要么毫无意义，要么与输入数据相矛盾。

12/31/2024 8:03:12 AM

布加迪

DeepSeek的V3，爆火了

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）上周四，12月26日那个晚上非常不平凡，一件大事注定要被AI界写进里程碑。一夜之间，全球开源界最强模型不再是Llama了，而是中国开源界的新星DeepSeek最新研发的前言模型V3，甚至可以比肩世界顶尖的闭源模型。根据DeeSeek披露的基准测试分数，简单来讲，八个字：开源最强，闭源比肩。

12/30/2024 8:32:36 PM

言征

大模型 DeepSeek：未授权任何人员参与机构投资者交流会，网传交流信息不实

据财联社报道，近期，一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此，DeepSeek 回应称，公司未授权任何人员参与券商投资者交流会，所谓“DeepSeek 专家”非公司人员，所交流信息不实。

12/30/2024 5:03:59 PM

浩渺

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 AI视频用哪个？6个知名的AI视频工具使用测评报告

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型