大模型

7B级形式化推理与验证小模型，媲美满血版DeepSeek-R1，全面开源！

研究团队构成：香港科技大学、中国科学院软件研究所、西安电子科技大学和重庆大学。团队核心成员：香港科技大学的研究助理教授曹嘉伦，主要研究领域包括 AI&SE、人工智能测试、形式化验证等；中国科学院软件研究所副研究员陆垚杰，主要研究领域包括大语言模型及其应用。随着 DeepSeek-R1 的流行与 AI4Math 研究的深入，大模型在辅助形式化证明写作方面的需求日益增长。

3/8/2025 3:46:00 PM

机器之心

阿里通义千问推理大模型QwQ-32B勇夺全球开源社区榜榜首

在全球最大的 AI 开源社区 HuggingFace 的最新更新中，阿里巴巴近期推出的通义千问推理模型 QwQ-32B 成功夺得了大模型榜单的第一名。这一模型在刚发布后便引起了广泛关注，超越了诸如微软的 Phi-4和 DeepSeek-R1等知名模型，展现出了强大的性能。 QwQ-32B 模型在数学、代码处理及通用能力等多个方面都取得了质的飞跃，特别是其参数数量较小的特点，使得其整体性能能够与 DeepSeek-R1相媲美。

3/7/2025 1:58:00 PM

AI在线

FP8 训练新范式：减少 40% 显存占用，训练速度提高 1.4 倍

近期DeepSeek V3 引爆国内外的社交媒体，他们在训练中成功应用了 FP8 精度，显著降低了 GPU 内存使用和计算开销。这表明，FP8 量化技术在优化大型模型训练方面正发挥着越来越重要的作用。近期，来自伯克利，英伟达，MIT 和清华的研究者们提出了显存高效的 FP8 训练方法：COAT（Compressing Optimizer states and Activation for Memory-Efficient FP8 Training），致力于通过 FP8 量化来压缩优化器状态和激活值，从而提高内存利用率和训练速度。

3/7/2025 10:02:10 AM

机器之心

如何理解模型的蒸馏和量化

在LLM领域内，经常会听到两个名词：蒸馏和量化。这代表了LLM两种不同的技术，它们之间有什么区别呢？本次我们就来详细聊一下。

3/7/2025 8:00:00 AM

Gemini或将新增功能Image to Code 应用亮相AI Studio

2025 年 3 月 6 日消息，根据X平台用户最新爆料，一款名为“Image to Code”的隐藏初创应用悄然出现在AI Studio中。这款应用由Gemini技术驱动，能够以图像作为输入，通过分析和推理，最终生成相应的程序代码，绘制出程序化的图像。这一消息迅速引发了科技爱好者和开发者的广泛关注。

3/6/2025 10:12:00 AM

AI在线

基于BLIP-2和Gemini开发多模态搜索引擎代理

译者 | 朱先忠审校 | 重楼本文将利用基于文本和图像的联合搜索功能来开发一个多模态时装辅助代理应用程序。简介传统模型只能处理单一类型的数据，例如文本、图像或表格数据。多模态是人工智能研究界的一个流行概念，指的是模型能够同时从多种类型的数据中学习。

3/6/2025 8:50:44 AM

朱先忠

大模型系列：DeepSeek大模型与应用场景介绍

今天给大家聊聊DeepSeek 究竟有哪些强大的模型？这些模型又适用于哪些具体的场景呢？希望对大家了解 DeepSeek 大模型提供一些参考。

3/6/2025 7:28:31 AM

郝光明

为什么 Qwen 能自我改进推理，Llama 却不行？斯坦福找到了原理

给到额外的计算资源和「思考」时间，为什么有的模型能好好利用，把性能提升一大截，而有的模型就不行？当遇到困难问题时，人类会花时间深入思考以找到解决方案。在 AI 领域，最近的一些大语言模型在通过强化学习进行自我改进训练时，也已经开始表现出类似的推理行为。

3/6/2025 6:00:00 AM

机器之心

为什么Qwen能自我改进推理，Llama却不行？斯坦福找到了原理

虽然 Qwen「天生」就会检查自己的答案并修正错误。但找到原理之后，我们也能让 Llama 学会自我改进。给到额外的计算资源和「思考」时间，为什么有的模型能好好利用，把性能提升一大截，而有的模型就不行？

3/5/2025 2:54:00 PM

机器之心

硅基流动:下线部分未备案模型，用户请注意迁移

近日，硅基流动在其更新公告中宣布，为了进一步优化资源配置，提供更先进、优质、合规的技术服务，将于2025年3月6日对部分模型进行下线处理。此次下线的模型主要为未经审查的国外模型，特别是生图模型，仅保留KColor。请用户注意，如果之前接入了公告中提及的模型，务必在3月6日前完成迁移。

3/5/2025 10:00:25 AM

AI在线

如何高效使用DeepSeek-R1：推理大模型调优指南

如何高效使用DeepSeek-R1：推理大模型提示工程调优指南LLM 中 DeepSeek-R1 与传统非推理模型的交互方式存在本质差异。在数学推导、代码生成等复杂任务中展现出色能力。但与通用大模型不同，推理型模型需要特殊的交互策略，博文内容列举几个常见的优化手段，帮助开发者构建高效的交互范式。

3/5/2025 3:00:00 AM

山河已无恙

谷歌客场作战和“苹果牌 AI”抢客户：iPhone 版 Gemini 上线锁屏小组件，主要功能一步直达

用户可通过这些快捷方式直接打开应用和键盘，方便立即输入提示。

3/4/2025 6:27:21 PM

清源

生物版DeepSeek的隐秘竞争，中国模型被视为更强对手，赛诺菲10亿美金押宝！

编辑 | ScienceAI上周，美国斯坦福大学、英伟达等机构联合发布的生物学AI模型Evo2引起广泛关注，被誉为「生物版Deepseek」。正当全球科研人员为这一突破性成果热议时，该论文中的特殊标注揭开了中国AI的实力——来自中国公司百图生科xTrimo系列大模型，被Evo2的研究人员列为「参数规模更大但尚未开源的竞争对手」，揭示中国生物大模型的崛起。实际上，百图生科公司一直被美国市场认定为生命科学基础大模型的先行者，自2020年起一直前瞻性地在该领域布局。

3/4/2025 6:22:00 PM

ScienceAI

自变量机器人成功融资，迈向具身智能新纪元

在最新的产业动态中，南京市创投集团宣布国产机器人初创企业自变量机器人（X Square Robot）成功完成 Pre-A 轮融资。这一轮融资的领投方为光速光合与君联资本，北京机器人产业基金及神骐资本等机构也参与了跟投，融资金额将用于下一代统一具身智能通用大模型的训练与场景落地。自变量机器人成立于2023年12月，目标是通过研发具身智能通用大模型，推动通用机器人技术的发展，最终实现通用机器人如人类一般，能够通过交互、感知和行动自主执行任务。

3/4/2025 4:16:00 PM

AI在线

周鸿祎谈AI幻觉与网络安全:问题不可夸大也不应忽视

在今年全国两会前夕，全国政协委员、360集团创始人周鸿祎就DeepSeek大模型及AI安全问题发表看法，强调正确认识AI安全，既不可夸大也不应忽视。周鸿祎指出，当前AI安全议题需警惕被夸大的趋势。他批评以OpenAI为代表的美国五大AI公司倾向于通过渲染AI不安全来为其垄断和闭源策略辩护，借此推动政府加强监管，阻挠后来者追赶。

3/4/2025 12:00:28 PM

AI在线

火山引擎宣布大模型应用开源：上线“大模型应用实验室”，释放 AI 创新潜力

火山引擎今日通过 X 平台宣布，其大模型应用正式开源，并推出全新“大模型应用实验室”平台。这一举措标志着火山引擎在 AI 技术生态建设上的重大突破，旨在通过开放核心应用和技术资源，加速开发者社区的创新步伐。此次开源的应用包括手机助手、Deep Research、DeepSeek 联网版、实时视频理解、互动双语视频生成器以及语音实时通话-青青等一系列前沿 AI 工具，引发了 X 用户的广泛热议。

3/4/2025 11:23:00 AM

AI在线

企业实施RAG过程中：常见误解与澄清，内含项目升级预告

春节之后的一个月的时间内，微信和小红书上数了下大概有 150 多个过来咨询 RAG 在企业落地的网友，一路聊下来按照对方的诉求大概分为三类，第一种是最多的就是年后返工公司领导让落地 RAG，但是一时没有头绪的过来咨询的；第二种是看过我公众号上的相关案例后，想外包给我来做具体实施的；第三种有点出乎意料的是，相关的媒体来交流行业观察的。第一种类型也是最开始比较多的，最初我也是问啥答啥，但是大概聊了五六个之后发现情况有点不对，大部分其实是比较基础的问题，或者我认为问大模型能比问我更快扫盲的，再加上后来确实肉眼可见的人在变多，我索性和每个人说如果是咨询的话 200 块每小时（现在涨到了 500），这样就大部分人就索性不问了，虽说前后也是有十几个人很干脆的问完问题后直接发了红包，不过不得不说收费确实是个很好的互相筛选。以上是碎碎念，言归正传，这篇给大家介绍下我目前几个项目实践踩坑过程中总结出的些经验。

3/4/2025 10:53:59 AM

韦东东

谷歌 Gemini 助手升级:支持实时视频分析与屏幕共享

在今年的世界移动通信大会（MWC）上，谷歌宣布为其 Gemini 助手新增实时视频分析和屏幕共享功能。 Gemini Advanced 的 Google One AI Premium 订阅用户将于本月晚些时候率先体验这项新功能。此次更新将赋予 Gemini Live 两大核心能力:一是通过外部摄像头实时分析视频内容，二是支持屏幕共享，让 AI 助手能够直接解读用户手机上的信息并提供反馈。

3/4/2025 9:34:00 AM

AI在线

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 OPPO 小布助手网页版上线，接入满血版 DeepSeek 本地部署DeepSeek+DiFy平台构建智能体应用谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了如何用AI做好情感化设计？来看大厂的实战案例！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

大模型

7B级形式化推理与验证小模型，媲美满血版DeepSeek-R1，全面开源！

​阿里通义千问推理大模型QwQ-32B勇夺全球开源社区榜榜首

FP8 训练新范式：减少 40% 显存占用，训练速度提高 1.4 倍

如何理解模型的蒸馏和量化

Gemini或将新增功能Image to Code 应用亮相AI Studio

基于BLIP-2和Gemini开发多模态搜索引擎代理

大模型系列：DeepSeek大模型与应用场景介绍

为什么 Qwen 能自我改进推理，Llama 却不行？斯坦福找到了原理

为什么Qwen能自我改进推理，Llama却不行？斯坦福找到了原理

硅基流动:下线部分未备案模型，用户请注意迁移

如何高效使用DeepSeek-R1：推理大模型调优指南

谷歌客场作战和“苹果牌 AI”抢客户：iPhone 版 Gemini 上线锁屏小组件，主要功能一步直达

生物版DeepSeek的隐秘竞争，中国模型被视为更强对手，赛诺菲10亿美金押宝！

自变量机器人成功融资，迈向具身智能新纪元

周鸿祎谈AI幻觉与网络安全:问题不可夸大也不应忽视

火山引擎宣布大模型应用开源：上线“大模型应用实验室”，释放 AI 创新潜力

企业实施RAG过程中：常见误解与澄清，内含项目升级预告

谷歌 Gemini 助手升级:支持实时视频分析与屏幕共享

阿里通义千问推理大模型QwQ-32B勇夺全球开源社区榜榜首