文章列表

分类

标签

超越Claude 3.5紧追o1！DeepSeek-V3-Base开源，编程能力暴增近31％

12/26/2024 4:43:19 PM

机器之心

英伟达年终核弹！全新B300为o1推理大模型打造，RTX5090也曝光了

英伟达老黄，成了今年的圣诞老黄。 AI芯片大礼包刚刚曝光：GPU新核弹B300，以及附带CPU的超级芯片GB300。高算力，在产品层面上相比B200在FLOPS上提高50%大显存，从192GB提升到288GB，也是提高了50%。

12/26/2024 11:45:48 AM

o3挑战ARC-AGI，遇见大网格就懵圈？英国工程师：ARC-AGI不适合大模型

o3在超难推理任务ARC-AGI上的成绩，属实给人类带来了不少震撼。但有人专门研究了它不会做的题之后，有了更有趣的发现——o3之所以不会做这些题，原因可能不是因为太难，而是题目的规模太大了。来自英国的ML工程师Mikel Bober-Irizar（不妨叫他米哥），对ARC题目进行了细致观察。

12/26/2024 11:42:56 AM

OpenAI 阿尔特曼在线征集“新年愿望”，网友期待新增家庭账户、优化语音聊天等

不少网友开始在评论区许愿或建言献策，而阿尔特曼也对部分建议给出了回复。

12/26/2024 8:30:50 AM

清源

研究称 ChatGPT 搜索功能存在被操纵风险：可被恶意网站诱导输出不可信内容

ChatGPT被测试如何应对包含隐藏内容的网页摘要。这些隐藏内容可能包括来自第三方的指令，干扰ChatGPT的回应，或是包含旨在影响回应的内容，如大量隐藏的文字推销某个产品或服务的优点。

12/26/2024 7:03:57 AM

清源

网页多模态建模思考

1.综述网页本质上是一种超文本，一般由超文本标记语言来定义（例如HTML）。 HTML是一种基础技术，常与CSS、JavaScript一起被众多网站用于设计网页、网页应用程序以及移动应用程序的用户界面。网页浏览器内核通过解释HTML文件，通过视觉引擎将其渲染成可视化网页。

12/26/2024 1:20:53 AM

百度Geek说

机器学习|从0开始大模型之模型LoRA训练

1、LoRA是如何实现的? 在深入了解 LoRA 之前，我们先回顾一下一些基本的线性代数概念。 1.1、秩给定矩阵中线性独立的列（或行）的数量，称为矩阵的秩，记为 rank(A) 。

12/26/2024 12:46:25 AM

周末程序猿

Bolt.new vs Cursor ，怎么选？

大家好，我是汤师爷~这篇聊聊 Bolt.new 和 Cursor 的对比。图片Bolt.new 是一款基于 SaaS 的 AI 编码平台。它由 LLM 驱动的智能体作为底层，并结合 WebContainers 技术，让用户可以直接在浏览器中进行编码和运行。

12/26/2024 12:38:10 AM

架构师汤师爷

TurboAttention：基于多项式近似和渐进式量化的高效注意力机制优化方案，降低LLM计算成本70%

随着大型语言模型(LLMs)在AI应用领域持续发展，其计算成本也呈现显著上升趋势。数据分析表明，GPT-4的运行成本约为700美元/小时，2023年各企业在LLM推理方面的总支出超过50亿美元。这一挑战的核心在于注意力机制——该机制作为模型处理和关联信息的计算核心，同时也构成了主要的性能瓶颈。

12/25/2024 4:42:18 PM

Tim Urista

大模型版生命游戏来了!「AI科学家」背后公司联手MIT&OpenAI等打造

大模型版生命游戏来了。 ALife，即人工生命，旨在通过人工手段研究生命和类生命过程。程序员们深深着迷的康威生命游戏，就属于这一研究领域。

12/25/2024 3:36:44 PM

国产AI之光！TeleAI星辰大模型入选央企十大国之重器评选

近日，国务院国资委新闻中心发起“十大国之重器”年度盘点，从2024年中央企业建设的众多重点项目中精心选出20项既有影响力又有创新力的大国重器，诚邀广大网友评选“年度十大国之重器”。由中电信人工智能科技有限公司和中国电信人工智能研究院（TeleAI）打造的“全国产化万亿参数星辰大模型发布”光荣入选，成为国产AI的佼佼者，展现了中国电信在人工智能领域的领先地位。星辰大模型，开启国产AI新时代星辰大模型，是由中国电信自主研发打造的全国产化万亿参数大模型，是国内AI技术的重大突破。

12/25/2024 2:50:00 PM

新闻助手

基座大模型「六进二」：南阶跃，北智谱

作者丨陈彩娴今天消息，阶跃星辰完成了 B 轮融资，总融资金额达数亿美元。 AI 科技评论获悉，此次融资有国资、战略和财务投资人等多家参与，核心投资方包括上海国有资本投资有限公司及其旗下基金，战略和财务投资人包括腾讯投资、五源资本、启明创投等。据了解，这笔融资将用于继续投入基础模型研发，强化多模态和复杂推理能力，并通过产品和生态加大覆盖 C 端应用场景，提供丰富的用户体验。

12/25/2024 2:38:00 PM

陈彩娴

“深思熟虑”的 AI：OpenAI 提出全新安全对齐方法

OpenAI 的研究人员提出了一种名为“深思熟虑的对齐”（Deliberative Alignment）的新方法，以提升 AI 模型安全性，并已在 o 系列模型中取得显著成效。

12/25/2024 2:27:18 PM

故渊

新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生

由哈佛医学院和斯坦福大学组成的科研团队，在医学诊断领域深入评估 OpenAI 的 o1-preview 模型，发现其比人类医生更擅长诊断棘手的医疗案例。

12/25/2024 2:10:43 PM

故渊

传OpenAI考虑亲自下场打造人形机器人，此前已投资多家机器人公司

据最新报道，人工智能领域的先驱OpenAI正在考虑亲自进入人形机器人市场。这一消息由The . Information披露，该公司内部人士透露了这一战略动向。

12/25/2024 11:30:43 AM

小菲

2024年AI领域的四大新闻和2025年的一个重要预测

从各项指标来看，2024年是迄今为止AI领域最具突破性的一年，至少从这项技术的商业化角度来看是如此。由2022年底ChatGPT的推出所引发的大型语言模型(LLM)热潮并未显现任何减缓迹象，不仅OpenAI和微软、Meta、谷歌等老牌科技巨头推出了众多新的LLM，还有许多其他初创公司和个人开发者也投身其中。有关AI研究放缓的报道，即便不是毫无根据，至少在目前来看也是被夸大其词了。

12/25/2024 11:26:28 AM

Carl Franzen

OpenAI被曝自研人形机器人，四年前因缺数据解散团队，如今要用机器人数据反哺大模型了

o3之后，OpenAI下一个项目曝光了：人形机器人这次不只是投资像Figure、1x和Physical Intelligence这样的机器人初创公司，也不只是算法团队搞机器人强化学习。而是自己涉足硬件，研发有双臂、双腿的实体人形机器人。 Information的消息称，两位直接了解这个项目的人透露了这个消息。

12/25/2024 10:58:29 AM

谷歌被曝正使用 Anthropic 的 Claude 模型来改进其 Gemini AI

据 TechCrunch 获得的内部通信内容显示，参与改进谷歌 Gemini 人工智能模型的承包商正在将其答案与 Anthropic 的竞品模型 Claude 的输出进行比较。此举引发了谷歌是否获得 Anthropic 授权使用 Claude 进行测试的合规性质疑。

12/25/2024 9:28:55 AM

远洋

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体 OpenAI发布GPT-4.1指令提示工程指南 Midjourney图像编辑器迎来重大更新：全新UI、图层功能与智能工具上线

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测人形机器人伟达 Transformer 百度深度学习 AI视频苹果模态 xAI 字节跳动驾驶文本搜索大语言模型具身智能 Claude Copilot 神器推荐 LLaMA 算力安全应用视频生成视觉科技亚马逊大型语言模型干货合集特斯拉 2024 AGI 训练