AIGC宇宙 AIGC宇宙

大模型

OpenAI发布新年目标,Agent智能体或将迎来百模大战

2025年1月1日,OpenAI CEO 奥特曼公布了公司的新年目标,涵盖AGI、智能体、4o升级、模型更好记忆、更长上下文等等。 图片关于智能体,有网友爆料,OpenAI 可能在 1 月份发布一个名为 “operator” 的 Agent,这个 Agent 将具备直接控制电脑的能力。 图片其实24年10月份的时候,Claude 就已经发布了基于 Claude 3.5 Sonnet 多模态大模型,可操作电脑的智能体。
1/3/2025 11:02:38 AM
渡码

阿里云与零一万物达成战略合作,成立“产业大模型联合实验室” ,加速落地应用

近期,阿里云和大模型头部企业零一万物达成模型平台业务的战略合作,双方将成立“产业大模型联合实验室”,联手加速大模型从技术到应用的落地,进一步扩大产业大模型的生态整合。 据悉,双方深度战略合作的产业大模型联合实验室包含技术、业务、人才等板块,阿里和零一万物将结合两个团队全球顶尖的大模型研发实力,形成从下一代基座模型技术探索到产业落地大模型服务的组合拳,全面通过阿里云百炼大模型平台的模型服务层面向市场,针对 ToB 行业打造更强更全面的大模型解决方案,加速大模型穿透千行百业。 在开展的合作中,阿里云拥有从技术到算力到服务层的平台级完整链条, 通义系列大模型将作为具有强大通用能力的“教师模型”,零一万物拥有国际前沿的高性价比模型能力,能够敏捷批量训练垂直定向的产业智能模型,双方联手将加速大模型的产业落地,拓宽大模型生态前景。
1/3/2025 10:32:00 AM
新闻助手

金融风控领域的大模型落地实践

Akulaku 作为一个海外互联网金融平台,运用大模型优化金融风控、客服及电商推荐等场景,通过集成图像(如 KYC 人脸识别)、文本(如智能客服)与设备数据,增强风控系统效能与用户体验。 大模型的引入旨在提升效率,通过优化小模型构建与工作流程自动化,减轻业务人员负担。 智能体在金融领域的应用包括欺诈调查与数据分析助手,预示着通过大模型辅助构建类 AGI 系统的可能性,能够进一步提升金融风控的效率与效果,在金融领域拥有广泛的应用前景。
1/3/2025 8:26:17 AM
黄泓

别再将LLM当成数据库了

译者 | 布加迪审校 | 重楼想象一下,你戴着耳机驾驶一辆汽车,每五分钟才更新一次路况信息,而不是持续不断地提供当前位置情况的视频流。 过不了多久,你就会撞车。 虽然这种类型的批处理在现实世界中并不适用,却是当今许多系统运行的方式。
1/3/2025 8:13:08 AM
布加迪

智象未来多模态大模型3.0全球首发,创始人兼CEO梅涛演讲实录来了

2024年12月28日,智象未来科技有限公司在安徽省人工智能产业先导区启动仪式中,宣布智象多模态生成大模型3.0与智象多模态理解大模型1.0同时发布。 上海电影集团、中国移动咪咕音乐、科大讯飞等企业参加。 加拿大工程院外籍院士、智象未来创始人兼CEO梅涛进行现场演讲。
1/2/2025 4:20:00 PM
新闻助手

全新模型RoboVLMs解锁VLA无限可能,真实机器人实验交出满分答卷

本文作者来自清华大学、字节跳动、中科院自动化所、上海交通大学和新加坡国立大学。 作者列表:李兴航、李沛言、刘明桓、王栋、刘济榕、康炳易、马骁、孔涛、张翰博和刘华平。 第一作者李兴航是清华大学计算机系博士生。
1/2/2025 2:30:00 PM
机器之心

多模态模型已落地多领域,OpenBayes贝式计算获评「大模型最具潜力创业企业 TOP 10」

缩放定律的放缓带来的技术路径演变在 2024 年的 NeurIPS 会议上,Ilya Sutskever 提出了一系列关于人工智能发展的挑战性观点,尤其集中于 Scaling Law 的观点:「现有的预训练方法将会结束」,这不仅是一次技术的自然演进,也可能标志着对当前「大力出奇迹」方法的根本性质疑。 Ilya 讨论了预训练模型的局限性,预见 AI 系统需要发展出更加接近人类思考方式的推理能力。 他强调,为了突破当前的局限并继续提升 AI 的能力,必须寻找新的训练方法。
1/2/2025 2:20:00 PM
机器之心

全面打破GPT-4垄断、DeepSeek打下训练成本...2024年大模型领域进展全复盘

刚刚过去的 2024 年是生成式 AI 大发展的一年,我们见证了 OpenAI Sora 的崛起,大模型服务价格的飞速下降,以及国内开源大模型的奋起直追。 这全方位的快速发展让我们对下一波 AI 的新技术大规模应用充满了信心。 对于身在 AI 领域的工程师和学者们来说,他们看待这一年的观点会有不同吗?
1/2/2025 1:15:00 PM
机器之心

微软论文意外「走光」,OpenAI参数全泄密!GPT-4o仅200B,o1 300B

谁能想到,微软在一篇医学领域的论文里,竟然把OpenAI模型的参数全「曝光」了! GPT-4参数约1.76万亿GPT-4o参数约2000亿GPT-4o mini参数约80亿o1-preview参数约3000亿o1-mini参数约1000亿Claude 3.5 Sonnet参数约1750亿研究人员:参数均为估算值让所有人难以置信的是,GPT-4o系列的参数如此少,mini版甚至只有8B。 有网友猜测,4o mini是一个大约有40B参数的MoE模型,其中激活参数为8B。
1/2/2025 1:00:00 PM
新智元

上交大揭露大模型审稿风险:一句话就能让论文评分飞升

大语言模型(LLMs)正以前所未有的方式,深刻影响着学术同行评审的格局。 同行评审作为科学研究的基石,其重要性毋庸置疑。 然而,随着大语言模型逐渐渗透到这一核心过程,我们是否已经准备好面对它可能带来的深远影响?
1/2/2025 7:00:00 AM

2025 年考研数学一得 126 分,智谱深度推理模型 GLM-Zero 预览版上线

GLM-Zero-Preview 是 GLM 家族中专注于增强 AI 推理能力的模型,擅长处理数理逻辑、代码和需要深度推理的复杂问题。
12/31/2024 5:53:12 PM
沛霖(实习)

黄仁勋自掏腰包50亿,开源英伟达GPU管理工具

离2025年只剩十几个小时,黄仁勋拿出50亿真金白银给大家发红包了! 他刚花7亿美金(51亿RMB)收购了一家初创公司,专门做GPU管理工具的。 并且立刻就宣布:开源所有平台和技术,买了英伟达GPU就能免费用。
12/31/2024 3:00:00 PM
量子位

ViT作者飞机上也要读的改进版Transformer论文,花2个小时详细批注解读分享出来

ViT核心作者Lucas Beyer,长文分析了一篇改进Transformer架构的论文,引起推荐围观。 他前不久从谷歌跳槽到OpenAI,这次是在飞机上阅读论文并写下了分析。 这篇论文被他简写为DiffTranformer,不过不是Sora底层架构的那个Diffusion Transformer,而是不久前来自微软的Differencial Transformer。
12/31/2024 2:30:00 PM
量子位

AI能力权威认证!用友大易入选最佳大模型产品及应用TOP20

近日,「AI中国」AI在线2024年度榜单正式揭晓,基于YonGPT用友企业服务大模型的AI招聘系统成功上榜「最佳大模型产品及应用TOP20」。 用友大易依托于YonGPT的强大功能,探索并实现AI技术在招聘方面的深度应用和商业价值,助力企业实现招聘的提效增质。 凭借其突出的创新性和实用性荣获「最佳大模型产品及应用TOP20」奖项。
12/31/2024 11:32:00 AM
新闻助手

G行人工智能与大模型技术的应用与发展

一、人工智能与大模型技术在银行业的普遍应用1. 客户服务和智能客服客户服务是人工智能应用的核心领域之一。 传统银行客户服务依赖专业的人工客服,虽然能提供较高的情感交互,但因响应时间较长、服务覆盖面有限以及成本较高,难以满足现代客户对高效、便捷服务的需求。
12/31/2024 8:46:28 AM
王涛 刘丁

减少LLM幻觉的五大技巧和方法

译者 | 布加迪审校 | 重楼本文介绍了使用LangGraph减少LLM幻觉的简单技巧。 如果你使用过LLM,就知道它们有时会产生幻觉。 这意味着它们生成的文本要么毫无意义,要么与输入数据相矛盾。
12/31/2024 8:03:12 AM
布加迪

DeepSeek的V3,爆火了

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)上周四,12月26日那个晚上非常不平凡,一件大事注定要被AI界写进里程碑。 一夜之间,全球开源界最强模型不再是Llama了,而是中国开源界的新星DeepSeek最新研发的前言模型V3,甚至可以比肩世界顶尖的闭源模型。 根据DeeSeek披露的基准测试分数,简单来讲,八个字:开源最强,闭源比肩。
12/30/2024 8:32:36 PM
言征

大模型 DeepSeek:未授权任何人员参与机构投资者交流会,网传交流信息不实

据财联社报道,近期,一份关于 DeepSeek 发布历程、优化方向的专家会议纪要文件在业内流传。对此,DeepSeek 回应称,公司未授权任何人员参与券商投资者交流会,所谓“DeepSeek 专家”非公司人员,所交流信息不实。
12/30/2024 5:03:59 PM
浩渺