大模型

Meta 新模型 Llama-4-Maverick 排名骤降，引发刷榜质疑

近日，Meta 公司发布的开源大模型 Llama-4-Maverick 在 LMArena 的排行榜上从第二名直降至第32名，这一剧烈波动引发了开发者们的广泛质疑，认为 Meta 可能通过提交特供版本以刷榜。事情的起因要追溯到4月6日，Meta 发布了其最新的大模型 Llama4，包括 Scout、Maverick 和 Behemoth 三个版本。其中，Llama-4-Maverick 在初期的评估中表现亮眼，位列 LMArena 排行榜的第二名，仅次于 Gemini2.5Pro。

4/14/2025 6:01:07 PM

AI在线

商汤大装置SenseCore 2.0全新升级推出1亿元代金券计划

4月14日，在北京举办的2025商汤技术交流日上，商汤科技正式宣布其大装置SenseCore2.0全面升级。作为AI基础设施领域的领军者，商汤大装置SenseCore2.0致力于为企业提供敏捷、灵活、可靠的全栈AI基础设施服务，以极致性价比推动大模型技术的高效落地与规模化应用。商汤大装置SenseCore2.0的升级，旨在应对当前大模型产业面临的三大挑战:开源模型和工具的主流化、性价比的生死线以及多模态技术带来的新场景需求。

4/14/2025 4:01:07 PM

AI在线

WOT大会7月北京启幕！12大AI主题诚征议题和嘉宾

WOT全球人工智能技术峰会是由51CTO开创的面向人工智能领域的高端技术会议品牌，它与另一大会品牌WOT全球技术创新大会一道，自2012年首次举办以来，历时十余年沉淀，累计吸引超过万名技术人员现场参与，同时吸引了数百家国内外知名科技企业和行业龙头、近千位技术领军人物深度合作。 ChatGPT引爆的热潮没有丝毫减缓之势，而DeepSeek又给这一热度添了一把火。伴随大模型的快速迭代、持续演进，生成式AI技术从理念到实践，从应用落地到产品百花齐放，创新速度之快令人瞩目，这也正是WOT全球人工智能技术峰会2025召开的目的和初衷。

4/14/2025 1:55:31 PM

阿里全模态Qwen2.5-Omni技术报告万字解读！

Qwen 团队最近发布了一款统一多模态大模型 Qwen2.5-Omni，开放了 7B 版本的权重。能够同时处理文本、图像、音频和视频输入，并以流式方式生成文本和语音响应。下面来详细看下：开源地址：论文地址：：地址： Face：：：官方体验：：：在日常生活中，人类能够同时感知视觉和听觉信息，并通过大脑处理这些信息后，以书写、说话或使用工具等方式进行反馈，从而与世界上的各种生物进行信息交流并展现智能。

4/14/2025 12:20:00 AM

Goldma

斯坦福权威报告盖章！阿里通义千问贡献排名全球第三！用算力优势重塑全球竞争格局！

近日，斯坦福大学人工智能研究所发布了《2025年人工智能指数报告》，为全球人工智能领域的发展提供了新的视角。报告指出，阿里巴巴在全球重要大模型贡献中位居第三，成为中国科技公司的领军代表。报告显示，2024年，中国在全球 AI 大模型中贡献了15项，而阿里巴巴的6个模型入选，紧随谷歌与 OpenAI 的7个模型之后。

4/13/2025 7:34:53 AM

AI在线

商汤日日新 SenseNova V6 多模态融合大模型发布

“商汤日日新 SenseNova V6”多模态融合大模型于今日发布，具备最长 64K 思维链、数理分析、多模态深度推理、全局记忆等能力，支持 10 分钟的视频推理及深度推理。

4/10/2025 4:16:29 PM

远洋

大模型“自动修 bug”能力将提升，豆包团队开源首个多语言代码修复基准 Multi-SWE-bench

4 月 10 日消息，豆包大模型团队今日通过官方公众号宣布，首个多语言类 SWE 数据集 Multi-SWE-bench 现已正式开源，可用于评估和提升大模型“自动修 Bug”能力。在 SWE-bench 基础上，Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言，是真正面向“全栈工程”的评测基准。其数据均来自 GitHub issue，历时近一年构建，以尽可能准确测评和提高大模型高阶编程智能水平。

4/10/2025 2:30:12 PM

清源

算法面试80%会问：大模型评估指标全解析

从训练到部署的评估链条大模型的评估贯穿了从研发到部署的全生命周期：训练阶段：使用交叉熵等损失函数指导模型优化方向生成评估：通过BLEU、ROUGE等指标量化生成内容质量能力测试：利用GLUE、MMLU等标准化基准评估多维度能力实战对比：在竞技场上与其他模型直接PK，检验实际效果交叉熵与困惑度熵最初源自物理学，用于描述系统无序程度。在信息论中，熵衡量信息的不确定性：$H(X) = -\sum_{x} P(x)log_b P(x)$交叉熵是评估预测分布与真实分布差异的指标，也是大模型训练中最常用的损失函数：$H(p, q) = -\sum_{i} p(i) \log q(i)$困惑度是评估语言模型的老牌指标，简单说就是预测下一个词有多"困难"。计算公式：复制在实际项目中，我们常用它监控预训练过程。

4/10/2025 7:00:00 AM

贝塔街的万事屋

阿里云刘伟光：AI正在推动各行各业的生产力变革

“阿里云大模型的战略就是服务企业市场创造社会价值，AI正在推动各行各业的生产力变革，通义大模型将深耕企业市场。 ”4月9日，阿里云在京召开AI势能大会，阿里云智能集团资深副总裁、公共云事业部总裁刘伟光称，大模型的社会价值正在企业市场释放，阿里云将坚定投入，打造全栈领先的技术，持续开源开放，为AI应用提速。近一年多来，通义大模型技术加速迭代，在to B和to C赛道都取得了一些进展，在消费端表现为用户体验的优化，在产业侧表现为生产力的极大提升。

4/9/2025 2:35:50 PM

"是我创造了第一个LLM"！Kaggle前首席科学家一句话引发AI学术圈考古行动

论如何在技术圈争论中一句话噎到对方：哥们，是我创造了第一个大语言模型。发言者Jeremy Howard为澳大利亚昆士兰大学名誉教授、曾任Kaggle创始总裁和首席科学家，现answer.ai与fast.ai创始人，。事情的起因是有人质疑他最近的项目llms.txt在帮助大模型爬取互联网信息上并没太大作用，从而引发了这段争论，迅速引起众人围观。

4/9/2025 9:23:00 AM

量子位

一文彻底搞懂 MCP：AI 大模型的标准化工具箱

MCP 最近在 AI 领域引发了广泛关注，特别是在海外各大社区中，大家热烈讨论，热度相当高。我打开了 Google Trends[1]，这是一个专门用于查看全球热点趋势的网站。图片输入关键词后，可以查看其热度变化。

4/9/2025 8:25:20 AM

程序员NEO

模态编码器 | CLIP改进之SigLIP，采用sigmoid损失的图文预训练

DeepMind对CLIP改进的一篇工作--SigLIP，发表在2023CVPR。简单看下研究动机：传统的对比学习方法如CLIP等依赖于 softmax 归一化，这需要一个全局视角来计算成对相似度，从而限制了批处理大小的扩展能力，并且在小批处理大小下表现不佳。因此本文提出了一个简单的成对 Sigmoid 损失函数用于语言-图像预训练（SigLIP）。

4/9/2025 2:10:00 AM

Goldma

大模型+数据分析：下一代智能查询优化体系的先行探索

当你每天面对万亿级数据、日均百万次查询请求时，你会怎么做？处理海量数据查询犹如在迷雾中寻路，方向稍有不慎就会迷失。数据负载高到屏幕只显示超时，查询速度慢到让你有时间泡一杯咖啡再来检查结果。

4/9/2025 1:00:00 AM

大数据AI智能圈

大模型部署工具 Ollama 使用指南：技巧与问题解决全攻略

一、Ollama 是什么？ Ollama 是一个开源的本地大模型部署工具，旨在简化大型语言模型（LLM）的运行和管理。通过简单命令，用户可以在消费级设备上快速启动和运行开源模型（如 Llama、DeepSeek 等），无需复杂配置。

4/8/2025 3:22:00 AM

wayn

谷歌研究：合成数据使大模型数学推理能力提升八倍

最近，来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。据专注于人工智能发展的研究机构 Epoch AI 报告显示，目前全球约有 300 万亿个公开可用的高质量文本训练标记。然而，随着类似 ChatGPT 这样的大模型的迅猛发展，对训练数据的需求呈指数级增长，预计到 2026 年之前，这些数据将被耗尽。

4/8/2025 12:40:00 AM

远洋

中国自主量子计算机“本源悟空”全球首次运行十亿级 AI 微调大模型

据《科创板日报》从安徽省量子计算工程研究中心获悉，本源量子、合肥综合性国家科学中心人工智能研究院等机构联合攻关，在中国第三代自主超导量子计算机“本源悟空”真机上，全球首次运行十亿参数 AI 大模型微调任务。

4/7/2025 9:41:45 AM

远洋

LLM「想太多」有救了！高效推理让大模型思考过程更精简

LLM的推理能力显著增强，然而，这个「超级大脑」也有自己的烦恼。有时候回答会绕好大一个圈子，推理过程冗长又复杂，虽能得出正确答案，但耗费了不少时间和计算资源。比如问它「2加3等于多少」，它可能会从数字的概念、加法原理开始，洋洋洒洒说上一大通，这在实际应用中可太影响效率啦。

4/7/2025 9:23:00 AM

新智元

一文读懂开源 Llama 4 模型

Hello folks，我是 Luga，今天我们来聊一下人工智能领域的最新大模型技术进展 - 构建高效、灵活、以及开源的的大模型 - Llama 4 。在人工智能领域，随着技术的不断进步，越来越多的强大语言模型应运而生。 Llama 4 作为 Meta 推出的最新一代大规模语言模型，凭借其卓越的性能和创新的架构设计，成为了当前 AI 领域的焦点之一。

4/7/2025 8:40:00 AM

Luga Lee

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 OPPO 小布助手网页版上线，接入满血版 DeepSeek 本地部署DeepSeek+DiFy平台构建智能体应用谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了如何用AI做好情感化设计？来看大厂的实战案例！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

大模型

Meta 新模型 Llama-4-Maverick 排名骤降，引发刷榜质疑

商汤大装置SenseCore 2.0全新升级 推出1亿元代金券计划

WOT大会7月北京启幕！12大AI主题诚征议题和嘉宾

阿里全模态Qwen2.5-Omni技术报告万字解读！

斯坦福权威报告盖章！阿里通义千问贡献排名全球第三！用算力优势重塑全球竞争格局！

商汤日日新 SenseNova V6 多模态融合大模型发布

大模型“自动修 bug”能力将提升，豆包团队开源首个多语言代码修复基准 Multi-SWE-bench

算法面试80%会问：大模型评估指标全解析

阿里云刘伟光：AI正在推动各行各业的生产力变革

"是我创造了第一个LLM"！Kaggle前首席科学家一句话引发AI学术圈考古行动

一文彻底搞懂 MCP：AI 大模型的标准化工具箱

模态编码器 | CLIP改进之SigLIP，采用sigmoid损失的图文预训练

大模型+数据分析：下一代智能查询优化体系的先行探索

大模型部署工具 Ollama 使用指南：技巧与问题解决全攻略

谷歌研究：合成数据使大模型数学推理能力提升八倍

中国自主量子计算机“本源悟空”全球首次运行十亿级 AI 微调大模型

LLM「想太多」有救了！高效推理让大模型思考过程更精简

一文读懂开源 Llama 4 模型

商汤大装置SenseCore 2.0全新升级推出1亿元代金券计划