大模型

加速追赶！腾讯拆分AI团队，豪掷研发资源

据央广网消息，4月29日，公司对其混元大模型研发体系进行全面重构，聚焦算力、算法和数据三大核心，调整团队部署并加大研发投入。此次调整的核心是成立两个新的部门:大语言模型部和多模态模型部，分别负责探索前沿技术、迭代基础模型。同时，腾讯加强了底层支撑，设立数据平台部和机器学习平台部，专注于数据管理和AI平台建设，为混元大模型的研发提供全面支持。

4/30/2025 11:00:50 AM

AI在线

Meta 发布 Llama API，开发者可体验最新 AI 模型

在刚刚结束的首届 LlamaCon AI 开发者大会上，Meta 公司正式发布了其 Llama 系列 AI 模型的 API，名为 Llama API。该 API 目前处于有限预览阶段，旨在让开发者能够探索和试验基于不同 Llama 模型的产品。 Meta 表示，这一新工具将与公司的 SDK 配合使用，允许开发者创建由 Llama 模型驱动的服务、工具和应用程序。

4/30/2025 11:00:50 AM

AI在线

Qwen3来了！新一代高性能与混合推理能力兼备的大语言模型！

阿里云正式发布通义千问Qwen3系列大模型，这一里程碑式更新在性能、训练规模和推理能力等多个维度实现重大突破。作为国产大模型的领军者，Qwen3不仅以2350亿参数的MoE架构刷新性能记录，更通过创新的"混合思考模式"和360万亿token的超大规模训练，成为当前性能领先的开源大语言模型。 1、Qwen3的性能表现Qwen3系列包含多个版本，涵盖MoE混合专家模型和Dense稠密模型。

4/30/2025 10:59:04 AM

Meta Llama AI模型下载量突破12亿，开发者热情高涨

在人工智能领域，Meta 公司近期传来了一个令人振奋的消息:其 “开放式” AI 模型系列 Llama 的下载量已突破12亿次。这个数字在不久前的3月中旬刚刚达到10亿次，显示出 Llama 模型在开发者和用户中获得的广泛认可和热情。在首届 LlamaCon 开发者大会上，Meta 的首席产品官 Chris Cox 在主题演讲中透露了这一令人瞩目的数据。

4/30/2025 10:00:55 AM

AI在线

万兴科技与华为云携手推进 AI 大模型技术创新

近日，万兴科技集团股份有限公司（以下简称 “万兴科技”）与华为云计算技术有限公司(以下简称 “华为云”)在深圳签署了战略合作协议。此次合作旨在结合双方的优势，共同推动 AI 大模型的技术和应用创新，进一步开拓数字创意领域的潜力。根据协议，万兴科技将充分发挥其在音视频大模型和 AI 应用方面的专业能力，而华为云则将利用其强大的云基础设施和市场拓展优势，建立深度合作关系。

4/30/2025 10:00:50 AM

AI在线

AI知识库的真相，你知道吗？

很多人对AI知识库的想象是这样的，他们以为只需将所有资料一股脑地拖进AI客户端，比如 Cherry Studio 内。图片这样，AI就会认真阅读所有内容，并自动生成完美结论。然而，实际体验后，许多人发现AI知识库的效果远没有想象中理想，经常遇到各种奇怪的问题。

4/30/2025 9:06:23 AM

程序员NEO

2024 年中国 MaaS 与 AI 大模型解决方案市场迎来爆发式增长

根据国际数据公司（IDC）发布的最新报告，2024年中国模型即服务(MaaS)及 AI 大模型解决方案市场将迎来显著增长，全年市场规模预计达到7.1亿元人民币，相较于2023年实现215.7% 的同比激增。其中，2024年下半年市场规模将达到4.6亿元人民币。展望未来五年，这一市场将以66.1% 的年均复合增长率继续扩张，预计到2029年市场规模将达到90亿元人民币。

4/29/2025 6:00:40 PM

AI在线

蚂蚁数科发布金融智能体开发平台Agentar 内测上线超百个金融MCP服务

4月29日，在数字中国建设峰会期间，蚂蚁数科正式对外发布智能体开发平台Agentar，为金融机构提供一站式、全栈的智能体开发工具，助力金融机构高效打造能够自主决策、可信可靠的金融智能体应用，加速AI技术从“辅助工具”真正成为驱动体验变革、效率跃升的“生产力引擎”。随着生成式AI的快速发展，行业大模型及智能体应用正在重塑金融服务。然而，大模型训练成本高昂难以在普惠场景中规模化复制;金融行业数据的高敏感性与安全合规要求;以及金融核心场景数据样本量较小、通用模型在金融专业场景中泛化能力不足等问题都在制约大模型技术在金融行业应用的深度与广度。

4/29/2025 4:00:40 PM

AI在线

52页PPT，谷歌Gemini预训练负责人首次揭秘！扩展定律最优解

谷歌凭借Gemini 2.5 Pro在激烈的大模型竞争中一举翻盘。近日，Geimini Flash预训练负责人Vlad Feinberg在普林斯顿大学分享了相关内容。他深入分析了Gemini预训练的方法、挑战以及方向，如何在模型大小、算力、数据和推理成本间取得平衡。

4/29/2025 9:16:00 AM

新智元

深夜突袭，阿里Qwen3登顶全球开源王座！暴击DeepSeek-R1，2小时狂揽17k星

就在今天凌晨，备受全球期待的阿里新一代通义千问模型Qwen3开源！一经问世，它立刻登顶全球最强开源模型王座。它的参数量仅为DeepSeek-R1的1/3，但成本大幅下降，性能全面超越R1、OpenAI-o1等全球顶尖模型。

4/29/2025 8:14:14 AM

新智元

“大模型失联”的凌晨，我靠这四个配置救了全组！LangChain4j API 进阶指南

1.引言大家好，我是小米，一个31岁、依然热爱编码的程序员大哥哥～今天给大家分享一个我最近在项目里踩坑无数、最后“高光时刻”拯救全组的进阶配置经验——LangChain4j 的 API 进阶配置四大件：日志、监控、重试、超时。你以为 LangChain4j 就只是个 Java 包装器？配置对了，它能稳定、健壮、可观测，能用得安心、跑得漂亮！

4/29/2025 3:40:00 AM

软件求生

谷歌每月向三星支付巨额款项，确保 Gemini AI 助理成为默认选择

在谷歌的反垄断审判中，有关谷歌与三星之间财务交易的细节浮出水面。根据《彭博社》的报道，谷歌为了将 Gemini AI 应用程序预装在三星设备上，每月向三星支付 “巨额资金”。这一消息是在法官阿米特・梅塔裁定谷歌的搜索引擎构成非法垄断的背景下披露的。

4/28/2025 4:00:40 PM

AI在线

阿里 AI 工程师余亮荣获 “全国劳动模范” 称号

在 “庆祝中华全国总工会成立100周年暨全国劳动模范和先进工作者表彰大会” 上，阿里巴巴的员工余亮荣获 “全国劳动模范” 荣誉称号，这也是阿里 AI 工程师首次获得这一殊荣。余亮是一位专注于大数据和智慧城市领域的杰出工程师，他的贡献在行业内得到了广泛认可。余亮毕业于武汉大学，曾在浙江大学及海外顶尖高校和研究机构进行博士后研究，并担任研究员和科学家等职务。

4/28/2025 3:00:50 PM

AI在线

Gemini-2.0夺冠！全球首个几何推理专项评测出炉，淘天集团出品

多模态大模型几何解题哪家强？首个从几何原理视角出发，全面评估多模态大模型几何解题能力的双语综合基准来了！ GeoSense，系统评测多模态大模型在几何原理识别和应用中的表现，评测基准的数据和评测代码均已开源。

4/28/2025 2:04:03 PM

量子位

字节跳动启动 “Top Seed” 计划，面向 2026 届博士生招募 AI 人才

字节跳动近日宣布正式启动2026届 “Top Seed” 大模型顶尖人才校招计划，计划招募约30位优秀博士生。这一项目专注于前沿的人工智能领域，涵盖大语言模型、机器学习算法与系统、多模态生成与理解、语音处理等研究方向。字节跳动希望通过此举，吸引那些在大模型研究领域具备极强潜力和热情的年轻才俊。

4/28/2025 12:00:40 PM

AI在线

ICLR 2025：顶尖科学家最关心的 AI 趋势有哪些？丨GAIR Live

自 GPT-4 发布至今已有两年，但对大语言模型的研究并没有放缓，我们仍处在一个技术进步涌现的时代。 Anthropic 于 2024 年11月发布 MCP，成为接通 AI 生态的桥梁，自主的 Agent 工作流距我们更进一步。 GPT-4o、GPT-4.1时隔仅一个月先后发布，实现上下文处理能力八倍提升。

4/28/2025 11:19:00 AM

郑佳美||梁丙鉴

谷歌被曝每月巨资贿赂三星，助推 Gemini 应用预装

近日，谷歌在反垄断审判中陷入了新的风波。据报道，谷歌每月向三星支付巨额资金，以促使其在 Galaxy S25系列智能手机中预装 Gemini 人工智能应用。这一消息引发了广泛关注，尤其是在谷歌被指控违反反垄断法后，这种商业行为是否构成新的不当竞争仍待观察。

4/28/2025 10:01:33 AM

AI在线

大模型重复生成内容：根因剖析与优化策略

前言最近在调试大模型应用过程中，遇到了如下问题：复制大模型首次生成内容与「重新生成」两次返回的内容近乎完全相同，几乎没有体现出任何差异性。面对这种情况，造成大模型输出高度相似的原因是什么呢？我们又该采取怎样的调整策略，才能使重新生成的内容与前次存在明显差异，提升输出的多样性呢？

4/28/2025 2:22:00 AM

张张

资讯热榜

腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线 OpenAI低调更新GPT4o模型，多项能力反超DeepSeek 腾讯云上线DeepSeek全系API接口并打通联网搜索东风日产N7首款接入DeepSeek大模型，实现智能化人机交互 DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型自有歪果仁为DeepSeek「辩经」：揭穿围绕DeepSeek的谣言 IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程 Copilot 视觉

大模型

加速追赶！腾讯拆分AI团队，豪掷研发资源

​Meta 发布 Llama API，开发者可体验最新 AI 模型

Qwen3来了！新一代高性能与混合推理能力兼备的大语言模型！

Meta Llama AI模型下载量突破12亿，开发者热情高涨

万兴科技与华为云携手推进 AI 大模型技术创新

AI知识库的真相，你知道吗？

​2024 年中国 MaaS 与 AI 大模型解决方案市场迎来爆发式增长

蚂蚁数科发布金融智能体开发平台Agentar 内测上线超百个金融MCP服务

52页PPT，谷歌Gemini预训练负责人首次揭秘！扩展定律最优解

深夜突袭，阿里Qwen3登顶全球开源王座！暴击DeepSeek-R1，2小时狂揽17k星

“大模型失联”的凌晨，我靠这四个配置救了全组！LangChain4j API 进阶指南

​谷歌每月向三星支付巨额款项，确保 Gemini AI 助理成为默认选择

​阿里 AI 工程师余亮荣获 “全国劳动模范” 称号

Gemini-2.0夺冠！全球首个几何推理专项评测出炉，淘天集团出品

字节跳动启动 “Top Seed” 计划，面向 2026 届博士生招募 AI 人才

ICLR 2025：顶尖科学家最关心的 AI 趋势有哪些？丨GAIR Live

谷歌被曝每月巨资贿赂三星，助推 Gemini 应用预装

大模型重复生成内容：根因剖析与优化策略

Meta 发布 Llama API，开发者可体验最新 AI 模型

2024 年中国 MaaS 与 AI 大模型解决方案市场迎来爆发式增长

谷歌每月向三星支付巨额款项，确保 Gemini AI 助理成为默认选择

阿里 AI 工程师余亮荣获 “全国劳动模范” 称号