理论 - AIGC宇宙

超越Claude 3.5紧追o1！DeepSeek-V3-Base开源，编程能力暴增近31％

英伟达年终核弹！全新B300为o1推理大模型打造，RTX5090也曝光了

英伟达老黄，成了今年的圣诞老黄。 AI芯片大礼包刚刚曝光：GPU新核弹B300，以及附带CPU的超级芯片GB300。高算力，在产品层面上相比B200在FLOPS上提高50%大显存，从192GB提升到288GB，也是提高了50%。

o3挑战ARC-AGI，遇见大网格就懵圈？英国工程师：ARC-AGI不适合大模型

o3在超难推理任务ARC-AGI上的成绩，属实给人类带来了不少震撼。但有人专门研究了它不会做的题之后，有了更有趣的发现——o3之所以不会做这些题，原因可能不是因为太难，而是题目的规模太大了。来自英国的ML工程师Mikel Bober-Irizar（不妨叫他米哥），对ARC题目进行了细致观察。

网页多模态建模思考

1.综述网页本质上是一种超文本，一般由超文本标记语言来定义（例如HTML）。 HTML是一种基础技术，常与CSS、JavaScript一起被众多网站用于设计网页、网页应用程序以及移动应用程序的用户界面。网页浏览器内核通过解释HTML文件，通过视觉引擎将其渲染成可视化网页。

机器学习|从0开始大模型之模型LoRA训练

1、LoRA是如何实现的? 在深入了解 LoRA 之前，我们先回顾一下一些基本的线性代数概念。 1.1、秩给定矩阵中线性独立的列（或行）的数量，称为矩阵的秩，记为 rank(A) 。

Bolt.new vs Cursor ，怎么选？

大家好，我是汤师爷~这篇聊聊 Bolt.new 和 Cursor 的对比。图片Bolt.new 是一款基于 SaaS 的 AI 编码平台。它由 LLM 驱动的智能体作为底层，并结合 WebContainers 技术，让用户可以直接在浏览器中进行编码和运行。

TurboAttention：基于多项式近似和渐进式量化的高效注意力机制优化方案，降低LLM计算成本70%

随着大型语言模型(LLMs)在AI应用领域持续发展，其计算成本也呈现显著上升趋势。数据分析表明，GPT-4的运行成本约为700美元/小时，2023年各企业在LLM推理方面的总支出超过50亿美元。这一挑战的核心在于注意力机制——该机制作为模型处理和关联信息的计算核心，同时也构成了主要的性能瓶颈。

大模型版生命游戏来了!「AI科学家」背后公司联手MIT&OpenAI等打造

大模型版生命游戏来了。 ALife，即人工生命，旨在通过人工手段研究生命和类生命过程。程序员们深深着迷的康威生命游戏，就属于这一研究领域。

传OpenAI考虑亲自下场打造人形机器人，此前已投资多家机器人公司

据最新报道，人工智能领域的先驱OpenAI正在考虑亲自进入人形机器人市场。这一消息由The . Information披露，该公司内部人士透露了这一战略动向。

2024年AI领域的四大新闻和2025年的一个重要预测

从各项指标来看，2024年是迄今为止AI领域最具突破性的一年，至少从这项技术的商业化角度来看是如此。由2022年底ChatGPT的推出所引发的大型语言模型(LLM)热潮并未显现任何减缓迹象，不仅OpenAI和微软、Meta、谷歌等老牌科技巨头推出了众多新的LLM，还有许多其他初创公司和个人开发者也投身其中。有关AI研究放缓的报道，即便不是毫无根据，至少在目前来看也是被夸大其词了。

OpenAI被曝自研人形机器人，四年前因缺数据解散团队，如今要用机器人数据反哺大模型了

o3之后，OpenAI下一个项目曝光了：人形机器人这次不只是投资像Figure、1x和Physical Intelligence这样的机器人初创公司，也不只是算法团队搞机器人强化学习。而是自己涉足硬件，研发有双臂、双腿的实体人形机器人。 Information的消息称，两位直接了解这个项目的人透露了这个消息。

GPT5基本玩崩了！谷歌和Meta胜算很大！AI投资人爆料：Meta承接谷歌搜索后，或收购某独角兽，OpenAI其实贼挣钱

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）临近年尾，相信很多朋友都在盘点这一年。很多人都在有意无意地在围观大模型这场全明星球赛。 OpenAI、谷歌、Anthropic、Meta，还有马斯克的 XAI，以及AI应用层面比如Perplexity等一众新秀球员，究竟谁会技压群雄，赢得接下来的2025？

12月23日消息，据外媒报道，在为期12天的发布会上，OpenAI宣布了其新一代推理模型o3和精简版o3-mini，专门设计用于在回答问题之前进行更深入的思考，以提高准确性。据介绍，o3模型在ARC-AGI基准上取得了优异的表现，成为第一个超越这一基准的AI模型，展示了接近人类水平的问题解决能力。 o3系列在ARC-AGI基准上的最低性能可以达到75.7%，加上额外的计算资源，性能可以提高到87.5%。

时隔6年BERT升级！仅编码器架构没被杀死，更快更准确更长上下文

时隔6年，一度被认为濒死的“BERT”杀回来了——更现代的ModernBERT问世，更快、更准、上下文更长，发布即开源！去年一张“大语言模型进化树”动图在学术圈疯转，decoder-only枝繁叶茂，而曾经盛极一时的encoder-only却似乎走向没落。 ModernBERT作者Jeremy Howard却说：encoder-only被低估了。

OpenAI被曝数据崩溃GPT-5难产，团队抢算力冲突激烈！Ilya预言成真？

OpenAI轰轰烈烈搞出一场12天圣诞特别活动，结果期间发布最轰动成果的，居然是谷歌。谷歌一发发密集的核弹，让OpenAI分成12天的挤牙膏黯然失色，毫无还手之力。原生多模态Gemini 2.0 Flash，demo惊艳的Project Astra，组团出道的AI智能体，效果吊打Sora掀起全网狂潮的Veo 2……显得OpenAI的圣诞活动仿佛是个笑话。

o3曝智商高达157，比肩爱因斯坦碾压99%人类！陶哲轩水平AI或出现

o3智商竟有157，堪比爱因斯坦？今天，一张OpenAI模型智商图，在全网传遍了。基于编程竞赛Codeforces排名评分图中清晰可见，能够达到o3智商水平的人类大约占比仅有0.0075%。

使用LLaMA 3.1、Firebase和Node.js，构建一个音控的智能厨房应用程序

译者 | 布加迪审校 | 重楼这篇指南逐步介绍了创建一个自动化的厨房助理的过程，附有语音命令、实时购物清单管理以及食谱建议。我在本教程中将介绍创建一个智能厨房应用程序（Chent），它可以根据个性化偏好简化杂货清单管理。该应用程序通过语音命令操作，简化了人机交互和添加商品。

ABCoder 在大模型编程领域的探索

前言大语言模型（以下简称大模型或 LLM）真正意义上火出圈，应该算是 OpenAI 发布 ChatGPT 后（22 年底）。从这个时间开始，到现在为止，已经过了很长一段时间了，市面上也出现了一些编程工具，比如 MarsCode、Copilot 或者 Cursor 等比较火的结合 IDE 的插件和工具。而实际上：经过了这么长时间的 LLM 产品发展，大家的编程方式真的被改变了吗？

理论