文章列表

TurboAttention:基于多项式近似和渐进式量化的高效注意力机制优化方案,降低LLM计算成本70%

随着大型语言模型(LLMs)在AI应用领域持续发展,其计算成本也呈现显著上升趋势。 数据分析表明,GPT-4的运行成本约为700美元/小时,2023年各企业在LLM推理方面的总支出超过50亿美元。 这一挑战的核心在于注意力机制——该机制作为模型处理和关联信息的计算核心,同时也构成了主要的性能瓶颈。

大模型版生命游戏来了!「AI科学家」背后公司联手MIT&OpenAI等打造

大模型版生命游戏来了。 ALife,即人工生命,旨在通过人工手段研究生命和类生命过程。 程序员们深深着迷的康威生命游戏,就属于这一研究领域。

国产AI之光!TeleAI星辰大模型入选央企十大国之重器评选

近日,国务院国资委新闻中心发起“十大国之重器”年度盘点,从2024年中央企业建设的众多重点项目中精心选出20项既有影响力又有创新力的大国重器,诚邀广大网友评选“年度十大国之重器”。 由中电信人工智能科技有限公司和中国电信人工智能研究院(TeleAI)打造的“全国产化万亿参数星辰大模型发布”光荣入选,成为国产AI的佼佼者,展现了中国电信在人工智能领域的领先地位。 星辰大模型,开启国产AI新时代星辰大模型,是由中国电信自主研发打造的全国产化万亿参数大模型,是国内AI技术的重大突破。

基座大模型「六进二」:南阶跃,北智谱

作者丨陈彩娴今天消息,阶跃星辰完成了 B 轮融资,总融资金额达数亿美元。 AI 科技评论获悉,此次融资有国资、战略和财务投资人等多家参与,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。 据了解,这笔融资将用于继续投入基础模型研发,强化多模态和复杂推理能力,并通过产品和生态加大覆盖 C 端应用场景,提供丰富的用户体验。

“深思熟虑”的 AI:OpenAI 提出全新安全对齐方法

OpenAI 的研究人员提出了一种名为“深思熟虑的对齐”(Deliberative Alignment)的新方法,以提升 AI 模型安全性,并已在 o 系列模型中取得显著成效。

新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生

由哈佛医学院和斯坦福大学组成的科研团队,在医学诊断领域深入评估 OpenAI 的 o1-preview 模型,发现其比人类医生更擅长诊断棘手的医疗案例。

传OpenAI考虑亲自下场打造人形机器人,此前已投资多家机器人公司

据最新报道,人工智能领域的先驱OpenAI正在考虑亲自进入人形机器人市场。 这一消息由The . Information披露,该公司内部人士透露了这一战略动向。

2024年AI领域的四大新闻和2025年的一个重要预测

从各项指标来看,2024年是迄今为止AI领域最具突破性的一年,至少从这项技术的商业化角度来看是如此。 由2022年底ChatGPT的推出所引发的大型语言模型(LLM)热潮并未显现任何减缓迹象,不仅OpenAI和微软、Meta、谷歌等老牌科技巨头推出了众多新的LLM,还有许多其他初创公司和个人开发者也投身其中。 有关AI研究放缓的报道,即便不是毫无根据,至少在目前来看也是被夸大其词了。

OpenAI被曝自研人形机器人,四年前因缺数据解散团队,如今要用机器人数据反哺大模型了

o3之后,OpenAI下一个项目曝光了:人形机器人这次不只是投资像Figure、1x和Physical Intelligence这样的机器人初创公司,也不只是算法团队搞机器人强化学习。 而是自己涉足硬件,研发有双臂、双腿的实体人形机器人。 Information的消息称,两位直接了解这个项目的人透露了这个消息。

谷歌被曝正使用 Anthropic 的 Claude 模型来改进其 Gemini AI

据 TechCrunch 获得的内部通信内容显示,参与改进谷歌 Gemini 人工智能模型的承包商正在将其答案与 Anthropic 的竞品模型 Claude 的输出进行比较。此举引发了谷歌是否获得 Anthropic 授权使用 Claude 进行测试的合规性质疑。

消息称 OpenAI 考虑开发人形机器人,此前已投资多家机器人初创公司

据 The Information 今日报道,OpenAI 内部人士近日透露,该公司正在探讨开发人形机器人的可能性。该媒体从两位“直接知情人士”处获悉了这一消息。然而,关于这一潜在项目的细节仍然很少,目前尚不清楚 OpenAI 计划何时推出该机器人,以及其目标应用场景。

GPT5基本玩崩了!谷歌和Meta胜算很大!AI投资人爆料:Meta承接谷歌搜索后,或收购某独角兽,OpenAI其实贼挣钱

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)临近年尾,相信很多朋友都在盘点这一年。 很多人都在有意无意地在围观大模型这场全明星球赛。 OpenAI、谷歌、Anthropic、Meta,还有马斯克的 XAI,以及AI应用层面比如Perplexity等一众新秀球员,究竟谁会技压群雄,赢得接下来的2025?

OpenAI发布推理模型o3及其精简版o3-mini

12月23日消息,据外媒报道,在为期12天的发布会上,OpenAI宣布了其新一代推理模型o3和精简版o3-mini,专门设计用于在回答问题之前进行更深入的思考,以提高准确性。 据介绍,o3模型在ARC-AGI基准上取得了优异的表现,成为第一个超越这一基准的AI模型,展示了接近人类水平的问题解决能力。 o3系列在ARC-AGI基准上的最低性能可以达到75.7%,加上额外的计算资源,性能可以提高到87.5%。

时隔6年BERT升级!仅编码器架构没被杀死,更快更准确更长上下文

时隔6年,一度被认为濒死的“BERT”杀回来了——更现代的ModernBERT问世,更快、更准、上下文更长,发布即开源! 去年一张“大语言模型进化树”动图在学术圈疯转,decoder-only枝繁叶茂,而曾经盛极一时的encoder-only却似乎走向没落。 ModernBERT作者Jeremy Howard却说:encoder-only被低估了。

OpenAI被曝数据崩溃GPT-5难产,团队抢算力冲突激烈!Ilya预言成真?

OpenAI轰轰烈烈搞出一场12天圣诞特别活动,结果期间发布最轰动成果的,居然是谷歌。 谷歌一发发密集的核弹,让OpenAI分成12天的挤牙膏黯然失色,毫无还手之力。 原生多模态Gemini 2.0 Flash,demo惊艳的Project Astra,组团出道的AI智能体,效果吊打Sora掀起全网狂潮的Veo 2……显得OpenAI的圣诞活动仿佛是个笑话。

o3智商高达157?每13333人中才有一个这么高,网友:编码分数无意义

从韦氏智商测试来看,如果 o3 的 IQ 真这么高,则称得上非常优秀。 OpenAI o3 的智商(IQ)竟然已经这么高了吗今天,Reddit 上一则热帖宣称「OpenAI o3 的 IQ 估计为 157」,并放出了一张数据图。 这意味着什么呢?

o3曝智商高达157,比肩爱因斯坦碾压99%人类!陶哲轩水平AI或出现

o3智商竟有157,堪比爱因斯坦? 今天,一张OpenAI模型智商图,在全网传遍了。 基于编程竞赛Codeforces排名评分图中清晰可见,能够达到o3智商水平的人类大约占比仅有0.0075%。

近1.4万星,腾讯混元大模型开源成绩单公布,多次登顶开源趋势热榜

记者获悉,腾讯云副总裁,腾讯混元大模型负责人刘煜宏在2024开放原子开发者大会暨首届开源技术学术大会上表示,腾讯将开源协同作为公司的核心技术战略,积极推动内外部技术开源共享。 腾讯混元大模型语言大模型、文生图大模型、文生3D大模型以及文生视频大模型等多个模态模型均已开源,未来大模型各版本也将进一步开源,与社区开发者一起共同推动技术生态繁荣发展。 (腾讯云副总裁,腾讯混元大模型负责人 刘煜宏)腾讯混元大模型的开源模型已经全面覆盖文生文、文生图、文生3D以及文生视频多个模态,是开源系列模型中较全的,其模型性能也得到了开源社区的高度认可,总GitHub Star(星星)数量近1.4万颗,并且多次登顶趋势榜。