文章列表

分类

标签

图数据库的剪枝在大型语言模型中的知识表示

译者 | 李睿审校 | 重楼图数据库的剪枝通过删除不必要的信息并加以改进，可以使LLM更快、更高效，同时节省电力和资源。大型语言模型（LLM）通过从庞大的数据集中学习复杂的语言模式，极大地推进了自然语言处理（NLP）的发展。然而，当这些模型与结构化知识图谱（用于表示实体之间关系的数据库）结合在一起时，可能面临一些挑战。

1/15/2025 7:52:53 AM

李睿

2025，大厂们的「大模型牌桌」战

随着大模型六小虎在AGI上的后撤第一枪被正式打响，中国大模型行业的分水岭快速露出水面、更加清晰。初创公司在下一代超大规模模型竞争中的局限性开始被广泛关注，大厂「不下桌」的资本筹码变得更加明显。无论是百度宣布2025年将推出下一代基座模型，还是阿里、字节在AI人才和资金上的继续投入，潮水退去，大模型在决胜战场的主导权还是来到了大厂手中。

1/14/2025 2:52:00 PM

陈彩娴

同时提升摄像机控制效率、视频质量，可控视频生成架构AC3D来了

可控的视频生成需要实现对摄像机的精确控制。然而，控制视频生成模型的摄像机运动（camera control）总是不可避免地伴随着视频质量的下降。近期，来自多伦多大学、Vector Institute、Snap Research 和西蒙・弗雷泽大学（SFU）的研究团队推出了 AC3D (Advanced 3D Camera Control)。

1/14/2025 2:02:05 PM

机器之心

思维链？思维树？华为诺亚：现在到了思维森林时刻！

OpenAI 接连发布 o1 和 o3 模型，大模型的高阶推理能力正在迎来爆发式增强。在预训练 Scaling law “撞墙” 的背景下，探寻新的 Scaling law 成为业界关注的热点。高阶推理能力有望开启新的 Scaling law，为大模型的发展注入新的活力。

1/14/2025 1:52:56 PM

国产推理大模型决战2025考研数学，看看谁第一个上岸？

随着上个月 2025 研究生考试的结束，最新的考研数学真题成为大语言模型尤其是推理模型的「试炼场」，将考验它们的深度思考能力。业内曾有着这样一种共识：大语言模型在文字水平上的表现令人印象深刻，但说到数学就不甚令人满意了。去年一度火出圈的「9.9 与 9.11」比大小的问题，包括 GPT-4o 在内的很多大模型都翻车了，直到深度推理模型出现后才从根本上改善了这一状况。

1/14/2025 1:51:18 PM

物理学家发现新型量子粒子！表现介于玻色子费米子之间 | Nature

新型量子粒子出现了，相关论文已经登上Nature。事情是这样的，美国布朗大学物理学家发现了一类既不属于玻色子，也不属于费米子的新粒子，这种粒子的表现介于两种基本粒子之间，被称为“分数激子”。研究人员表示，这种新粒子不携带整数电荷，却遵循独特的量子统计规律。

1/14/2025 12:28:01 PM

量子位

抢先OpenAI“虚拟员工”！清华复旦斯坦福联手，让Agent接管电脑帮你工作

抢先OpenAI的“Operator”，清华、复旦、斯坦福等研究者联合起来整了个大活～他们提出了一个名为“Eko”的Agent开发框架，开发者只需用简洁的代码和自然语言，就能快速构建可用于生产的“虚拟员工”：Agent可以接管用户的电脑和浏览器，代替人类完成各种任务。而这个操作，正是之前OpenAI被爆出的“Operator”所能实现的。爆料称OpenAI将会这个月发布“Operator”，现在直接被截胡了。

1/14/2025 12:22:10 PM

刚刚OpenAI发布经济蓝图：AI发展要一切以美国为中心，基础设施建设是决定因素「附全文」

刚刚OpenAI 发布了一份名为“OpenAI 经济蓝图”的重要文件，我第一时间研究了一下这份蓝图，给大家划个重点，一起来看看 OpenAI 眼中的 AI 未来是什么样子的！一句话概括：这份蓝图阐述了 OpenAI 对美国如何最大化 AI 利益、加强国家安全和推动经济增长的政策建议核心内容抢先看：• AI 时代，时不我待！ OpenAI 认为，随着 AI 技术的飞速发展，美国需要立即行动，才能在未来的竞争中立于不败之地。

1/14/2025 8:52:10 AM

AI寒武纪

霉霉用中文拜早年！国风年味视频免费生成，可任意切换主角，0帧起手小白友好

新一年，霉霉也来送祝福啦，完全中文版哦。几十米高的大熊猫爬上了长城。鱼尾狮成了它把玩的玩具。

1/13/2025 1:50:25 PM

量子位

会用AI才能多发论文，LLM助力科研效率提升！新研究登Nature子刊

都说大模型被广泛应用于学术研究的文献回顾、摘要筛选和稿件撰写等方面，然而具体多少人在使用、如何使用，却缺少定量的调查研究。为此，研究人员进行了一项调查，识别受访者们在学术研究和发表中使用大模型的情况。以评估全球研究人员对大模型的认知水平。

1/13/2025 1:00:00 PM

新智元

o1不是聊天模型？24小时热度暴涨，奥特曼、Brockman在线围观

不要再将 o1 当做聊天模型了。如何定位 o1 模型？你是否常常将其当做一个聊天模型来使用。

1/13/2025 12:30:58 PM

最高工资322万！OpenAI开招机器人工程师

OpenAI真的要重启机器人计划了。总裁Brockman转发了一则招聘公告，招募机器人硬件工程师。这则通告由OpenAI从Meta挖过来的技术人员Caitlin Kalinowski（被挖前任Orion眼镜负责人）发布，一共包含三大岗位，开出了最高44万美元（约322万人民币）的薪水。

1/13/2025 11:49:37 AM

基于阿里开源Qwen2.5-7B-Instruct模型进行多代理RAG开发实战

译者 | 朱先忠审校 | 重楼引言大型语言模型已经展现出令人印象深刻的能力，并且随着每一代新模型的发布，它们仍在稳步改进。例如，聊天机器人和自动摘要器等应用程序可以直接利用LLM的语言能力，因为这些LLM只要求生成文本输出——这也是该类模型的自然设置。此外，大型语言模型还表现出了理解和解决复杂任务的令人印象深刻的能力，但是只要它们的解决方案保持“纸上谈兵”，即纯文本形式，那么它们就需要外部人类用户代表它们行事并报告所提议操作的结果。

1/13/2025 10:55:53 AM

朱先忠

LLM注意力Attention，Q、K、V矩阵通俗理解

QKV的重要性要理解大语言模型效果的底层实现原理，很大一部分就是理解Transformers Block里面的QKV矩阵。现在前沿的大模型研究工作很大一部分都是围绕着QKV矩阵去做的，比如注意力、量化、低秩压缩等等。其本质原因是因为QKV权重占比着大语言模型50%以上的权重比例，在推理过程中，QKV存储量还会随着上下文长度的增长而线性增长，计算量也平方增加。

1/13/2025 8:23:07 AM

咚咚呛

GAN已死？GAN万岁！布朗康奈尔新作爆火，一夜碾压扩散模型

GAN已死？不，GAN又回来了！此前曾掀起AI圈巨大风暴的GAN，后来却逐渐沉寂了，甚至有人发出了「GAN已死」的论调。

1/13/2025 8:20:00 AM

新智元

OpenAI 不装了？左手赚钱，右手就一定有「神奇药水」吗？

近期，OpenAI CEO Sam Altman 一反此前的「故弄玄虚」「卖关子」，在其博客文章中明确表示，「已经知道如何构建通用人工智能（AGI）」。为何 Sam Altman 这次如此笃定地表示已经明确知道如何做 AGI？要知道，在此前 OpenAI 官方发布的 AGI 路线图中，OpenAI 表示目前尚在 AGI 的 L2（推理者）阶段，在朝着 L3 阶段前进。

1/13/2025 8:00:00 AM

机器之心

可灵AI破解电车难题全员无伤！网友：这就是东方智慧吗

大跌眼镜！经典电车难题就这样被可灵AI解决了？！

1/13/2025 7:30:00 AM

量子位

OpenAI疯狂爬虫，把一家公司都给爬宕机了，CEO：堪比DDoS

万万没想到，能把一家公司网站给搞宕机的元凶，竟然是OpenAI疯狂爬虫的机器人——GPTBot。（GPTBot是OpenAI早年前推出的一款工具，用来自动抓取整个互联网的数据。）就在这两天，一家7人团队公司（Triplegangers）的网站突然宕机，CEO和员工们赶忙排查问题到底出在的哪里。

1/13/2025 7:30:00 AM

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体 OpenAI发布GPT-4.1指令提示工程指南 Midjourney图像编辑器迎来重大更新：全新UI、图层功能与智能工具上线

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测人形机器人伟达 Transformer 百度深度学习 AI视频苹果模态 xAI 字节跳动驾驶文本搜索大语言模型具身智能 Claude Copilot 神器推荐 LLaMA 算力安全应用视频生成视觉科技亚马逊大型语言模型干货合集特斯拉 2024 AGI 训练