文章列表

分类

标签

全网都在扒的DeepSeek团队，是清北应届生撑起一片天

DeepSeek-v3大模型横空出世，以1/11算力训练出超过Llama 3的开源模型，震撼了整个AI圈。紧接着，“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻，也使得人们把目光聚焦向DeepSeek的人才。这下不只科技圈，全网都在好奇，连小红书上都有人发帖询问，这究竟是一只怎样的团队？

1/6/2025 7:45:00 AM

Just keep scaling！思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式

关注 AI 领域的人对 Jason Wei 这个名字一定不陌生。他是 OpenAI 的一位资深研究科学家，也常在 OpenAI 的发布活动中露脸。更重要的是，他是思维链概念开山之作《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》的第一作者。

1/4/2025 5:50:00 PM

机器之心

从DeepSeek-V3发布谈大模型的技术突破与未来机遇

在AI技术日新月异的今天，大型语言模型已成为推动AI发展的重要力量。 2024年12月26日，DeepSeek AI正式发布了其最新的大型语言模型——DeepSeek-V3。这款开源模型采用了高达6710亿参数的混合专家（MoE）架构，每秒能够处理60个token，比V2快了3倍。

1/3/2025 7:38:33 PM

张诚

你的专属“钢铁侠”助手OS Agents来了！浙大联手OPPO、零一万物等10个机构推出全新综述

电影《钢铁侠》中，托尼·斯塔克的助手贾维斯（J.A.R.V.I.S.）能帮他控制各种系统并自动完成任务，曾让无数观众羡慕不已。现在，这样的超级智能助手，终于变成现实了！随着多模态大语言模型的爆发式进化，OS Agents横空出世，它们能无缝操控电脑和手机，为你自动搞定繁琐任务。

1/3/2025 3:44:09 PM

量子位

动物版谷歌翻译来了？Nature：用AI解码野性的呼唤！

每一种动物都有其独特的历史。来自加拿大Carleton University的鲸鱼生物学家Shane Gero，花了20年时间试图了解鲸鱼是如何交流的。比如，同一个家族的鲸鱼会发出特定的声音，而不同区域的抹香鲸（Physeter macrocephalus）有自己的「方言」。

1/3/2025 1:00:00 PM

新智元

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器？仅50%性能优化，未来可期

编辑 | 萝卜皮粒子加速器的自主调节是一个活跃且具有挑战性的研究领域，其目标是实现先进的加速器技术和尖端的高影响力应用，例如物理发现、癌症研究和材料科学。但是，自主加速器调节仍然严重依赖经验丰富的熟练操作员的手动操作。德国亥姆霍兹协会旗下 DESY（Deutsches Elektronen Synchrotron）的研究人员建议使用大型语言模型（LLM）来调整粒子加速器。

1/3/2025 11:56:00 AM

ScienceAI

2025年1月1日，OpenAI CEO 奥特曼公布了公司的新年目标，涵盖AGI、智能体、4o升级、模型更好记忆、更长上下文等等。图片关于智能体，有网友爆料，OpenAI 可能在 1 月份发布一个名为 “operator” 的 Agent，这个 Agent 将具备直接控制电脑的能力。图片其实24年10月份的时候，Claude 就已经发布了基于 Claude 3.5 Sonnet 多模态大模型，可操作电脑的智能体。

1/3/2025 11:02:38 AM

渡码

阿里云与零一万物达成战略合作，成立“产业大模型联合实验室” ，加速落地应用

近期，阿里云和大模型头部企业零一万物达成模型平台业务的战略合作，双方将成立“产业大模型联合实验室”，联手加速大模型从技术到应用的落地，进一步扩大产业大模型的生态整合。据悉，双方深度战略合作的产业大模型联合实验室包含技术、业务、人才等板块，阿里和零一万物将结合两个团队全球顶尖的大模型研发实力，形成从下一代基座模型技术探索到产业落地大模型服务的组合拳，全面通过阿里云百炼大模型平台的模型服务层面向市场，针对 ToB 行业打造更强更全面的大模型解决方案，加速大模型穿透千行百业。在开展的合作中，阿里云拥有从技术到算力到服务层的平台级完整链条，通义系列大模型将作为具有强大通用能力的“教师模型”，零一万物拥有国际前沿的高性价比模型能力，能够敏捷批量训练垂直定向的产业智能模型，双方联手将加速大模型的产业落地，拓宽大模型生态前景。

1/3/2025 10:32:00 AM

新闻助手

金融风控领域的大模型落地实践

Akulaku 作为一个海外互联网金融平台，运用大模型优化金融风控、客服及电商推荐等场景，通过集成图像（如 KYC 人脸识别）、文本（如智能客服）与设备数据，增强风控系统效能与用户体验。大模型的引入旨在提升效率，通过优化小模型构建与工作流程自动化，减轻业务人员负担。智能体在金融领域的应用包括欺诈调查与数据分析助手，预示着通过大模型辅助构建类 AGI 系统的可能性，能够进一步提升金融风控的效率与效果，在金融领域拥有广泛的应用前景。

1/3/2025 8:26:17 AM

黄泓

别再将LLM当成数据库了

译者 | 布加迪审校 | 重楼想象一下，你戴着耳机驾驶一辆汽车，每五分钟才更新一次路况信息，而不是持续不断地提供当前位置情况的视频流。过不了多久，你就会撞车。虽然这种类型的批处理在现实世界中并不适用，却是当今许多系统运行的方式。

1/3/2025 8:13:08 AM

布加迪

智象未来多模态大模型3.0全球首发，创始人兼CEO梅涛演讲实录来了

2024年12月28日，智象未来科技有限公司在安徽省人工智能产业先导区启动仪式中，宣布智象多模态生成大模型3.0与智象多模态理解大模型1.0同时发布。上海电影集团、中国移动咪咕音乐、科大讯飞等企业参加。加拿大工程院外籍院士、智象未来创始人兼CEO梅涛进行现场演讲。

1/2/2025 4:20:00 PM

新闻助手

“人工智能教父”辛顿公开支持马斯克起诉 OpenAI

本周一，由年轻人领导的全球倡导组织 Encode 向法院提交了一份支持埃隆・马斯克（Elon Musk）诉讼的法律意见书，试图阻止 OpenAI 的企业化转型。这一举措得到了人工智能领域重量级人物、诺贝尔奖和图灵奖得主杰弗里・辛顿（Geoffrey Hinton）的公开支持。

1/2/2025 3:16:58 PM

辰辰

全新模型RoboVLMs解锁VLA无限可能，真实机器人实验交出满分答卷

本文作者来自清华大学、字节跳动、中科院自动化所、上海交通大学和新加坡国立大学。作者列表：李兴航、李沛言、刘明桓、王栋、刘济榕、康炳易、马骁、孔涛、张翰博和刘华平。第一作者李兴航是清华大学计算机系博士生。

1/2/2025 2:30:00 PM

机器之心

联手OpenAI，吴恩达推出一门o1推理新课程，还免费

在刚刚过去的 2024 年，OpenAI 推出了 o 系列模型。相比于以往大型语言模型，o 系列模型使用更多的计算进行更深入的「思考」，能够回答更复杂、更细致的问题。通过在推理时执行思维链推理，o 系列模型在新兴用例中表现出色，包括多步骤规划、图像推理和长期编码。

1/2/2025 2:23:00 PM

机器之心

多模态模型已落地多领域，OpenBayes贝式计算获评「大模型最具潜力创业企业 TOP 10」

缩放定律的放缓带来的技术路径演变在 2024 年的 NeurIPS 会议上，Ilya Sutskever 提出了一系列关于人工智能发展的挑战性观点，尤其集中于 Scaling Law 的观点：「现有的预训练方法将会结束」，这不仅是一次技术的自然演进，也可能标志着对当前「大力出奇迹」方法的根本性质疑。 Ilya 讨论了预训练模型的局限性，预见 AI 系统需要发展出更加接近人类思考方式的推理能力。他强调，为了突破当前的局限并继续提升 AI 的能力，必须寻找新的训练方法。

1/2/2025 2:20:00 PM

机器之心

全面打破GPT-4垄断、DeepSeek打下训练成本...2024年大模型领域进展全复盘

刚刚过去的 2024 年是生成式 AI 大发展的一年，我们见证了 OpenAI Sora 的崛起，大模型服务价格的飞速下降，以及国内开源大模型的奋起直追。这全方位的快速发展让我们对下一波 AI 的新技术大规模应用充满了信心。对于身在 AI 领域的工程师和学者们来说，他们看待这一年的观点会有不同吗？

1/2/2025 1:15:00 PM

机器之心

2024年AI安全五大热点回顾

在ChatGPT推出两年后，生成式AI已成为网络安全领域的重要力量。 2024年生成式AI技术的影响无处不在，从深伪欺诈到“影子AI”的风险，再到AI安全法规的出现和AI驱动的漏洞研究潜力。以下，我们将盘点过去一年AI与网络安全的五大热点话题。

1/2/2025 1:10:56 PM

佚名

微软论文意外「走光」，OpenAI参数全泄密！GPT-4o仅200B，o1 300B

谁能想到，微软在一篇医学领域的论文里，竟然把OpenAI模型的参数全「曝光」了！ GPT-4参数约1.76万亿GPT-4o参数约2000亿GPT-4o mini参数约80亿o1-preview参数约3000亿o1-mini参数约1000亿Claude 3.5 Sonnet参数约1750亿研究人员：参数均为估算值让所有人难以置信的是，GPT-4o系列的参数如此少，mini版甚至只有8B。有网友猜测，4o mini是一个大约有40B参数的MoE模型，其中激活参数为8B。

1/2/2025 1:00:00 PM

新智元

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体 OpenAI发布GPT-4.1指令提示工程指南 Midjourney图像编辑器迎来重大更新：全新UI、图层功能与智能工具上线

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测人形机器人伟达 Transformer 百度深度学习 AI视频苹果模态 xAI 字节跳动驾驶文本搜索大语言模型具身智能 Claude Copilot 神器推荐 LLaMA 算力安全应用视频生成视觉科技亚马逊大型语言模型干货合集特斯拉 2024 AGI 训练

文章列表

全网都在扒的DeepSeek团队，是清北应届生撑起一片天

Just keep scaling！思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式

从DeepSeek-V3发布谈大模型的技术突破与未来机遇

你的专属“钢铁侠”助手OS Agents来了！浙大联手OPPO、零一万物等10个机构推出全新综述

动物版谷歌翻译来了？Nature：用AI解码野性的呼唤！

Science子刊 | GPT4、Llama等LLM可以调节粒子加速器？仅50%性能优化，未来可期

OpenAI发布新年目标，Agent智能体或将迎来百模大战

阿里云与零一万物达成战略合作，成立“产业大模型联合实验室” ，加速落地应用

金融风控领域的大模型落地实践

别再将LLM当成数据库了

智象未来多模态大模型3.0全球首发，创始人兼CEO梅涛演讲实录来了

“人工智能教父”辛顿公开支持马斯克起诉 OpenAI

全新模型RoboVLMs解锁VLA无限可能，真实机器人实验交出满分答卷

联手OpenAI，吴恩达推出一门o1推理新课程，还免费

多模态模型已落地多领域，OpenBayes贝式计算获评「大模型最具潜力创业企业 TOP 10」

全面打破GPT-4垄断、DeepSeek打下训练成本...2024年大模型领域进展全复盘

2024年AI安全五大热点回顾

微软论文意外「走光」，OpenAI参数全泄密！GPT-4o仅200B，o1 300B