大模型

100天后，阶跃星辰交出了第二份答卷

今年 3 月，「借着」 2024 全球开发者先锋大会的场子，「国内最后一家通用大模型公司」——阶跃星辰发布了 Step 系列通用大模型，包括 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态大模型以及 Step-2 万亿参数 MoE 语言大模型预览版，正式进入大众视野，并成功跻身国内六大大模型独角兽行列。另外五家分别是月之暗面、智谱、MiniMax、百川、零一万物。当然，这一份成绩很是亮眼，一举将国内大模型卷到万亿参数赛道（预览版）。

7/5/2024 9:29:00 PM

晓楠

无限光年发布光语大模型，以灰盒可信技术深耕专业场景，赋能千行百业

7月4日，可信大模型公司无限光年（INF）在2024年世界人工智能大会（WAIC）上发布可信光语大模型及其技术报告。可信光语大模型结合大语言模型与符号推理，有效解决幻觉问题，大幅增强模型可信度，赋能金融服务、医疗诊断等垂直领域，让生成式AI真正成为新质生产力工具。在“人工智能：科研范式变革与产业发展”主题论坛上，无限光年联合创始人徐盈辉博士表示，幻觉问题是大模型被用作生产力工具的核心挑战之一：如果大模型生成的内容不可控、难以解释，就很难满足专业领域对准确性、可靠性、严谨性的要求。

7/5/2024 2:30:00 PM

晓楠

亮点剧透丨大模型产业应用如何落地，WAIC 探讨技术突破与最新实践

以大模型为代表的新一代人工智能技术变革仍在加速迭代，为“新质生产力”的发展注入强劲动力，助力产业智能化升级和经济发展。目前，大模型在产业端，已经开始从任务简单、容错率高的场景向任务复杂、容错率低的场景渗透，这个趋势既得益于基础技术的提升与创新实践的探索，也进一步推动着技术变革与实践深化。由世界人工智能大会组委会办公室指导，新一代人工智能产业技术创新战略联盟（AITISA）主办，蚂蚁集团承办的“可信大模型助力产业创新发展论坛”，将于7月5日在上海·世博中心金厅举行。

7/2/2024 12:04:00 PM

我在思考中

计算效率提升100倍以上，上交李金金团队开发基于Transformer的大模型用于从头算分子动力学

作者 | 陶科豪编辑 | 白菜叶精确模拟原子与分子的动态行为对于开发新一代高效能材料至关重要。然而，传统的从头算分子动力学（AIMD）模拟虽然提供了高精度的预测能力，但由于其高昂的计算成本和漫长的模拟时间，大大限制了研究的进度。例如，完成一个含 100 个原子的材料系统的 30 皮秒模拟，常常需要数月时间，这对于需要快速迭代和优化的新材料研发构成了巨大挑战。在这种背景下，一个能够显著加快这一过程的人工智能模型具有重要价值。面对这些挑战，上海交通大学人工智能与微结构实验室（AIMS-lab）开发了名为 T-AIMD

6/17/2024 3:06:00 PM

ScienceAI

全球科技巨头集体「卷」AI，华为又在憋什么大招？

生成式 AI 的竞争，今年更加激烈了。今年 5 月以来，全球科技巨头们不约而同地开始展示在 AI 领域的最新成果和战略部署，一系列引人瞩目的发布和合作活动相继展开，预示着 AI 技术的快速发展和广泛应用。5 月 15 日，谷歌推出了 Gemini 1.5 Pro 和 Gemini 1.5 Flash 两款新的大型语言模型，并发布了声称效果超过 GPT-3 的生成视频模型 Veo。微软在 Build 2024 开发者大会上发布了 50 多项与 AI 相关的更新，包括 Team Copilot、Microsoft Fa

6/17/2024 10:04:00 AM

新闻助手

共话大模型技术进展与挑战，CCF大模型论坛北京会议圆满落幕！

2024 年 6 月 6 日中国计算机学会大模型论坛（CCF FoLM）主题会议在北京顺利举办。本次会议主题为“大模型技术进展与挑战”，各位专家围绕大模型技术的前沿动态、发展趋势及技术挑战等议题展开深入探讨，为广大从业者、研究者提供了一场丰富的学术盛宴。本次会议还宣布了“CCF 大模型安全挑战赛”的正式启动！

6/14/2024 2:44:00 PM

我在思考中

价格战之后，智谱来到商业化的下一站

这次价格战的两股势力分别是互联网大厂和大模型创业公司，以字节、阿里云、腾讯和智谱为主要参战代表。面对这场突如其来的价格战，大家讨论最多的是，创业公司很难承受得住这样的比拼。相比互联网大厂底子厚、钱多，大模型创业公司跟大厂打价格战，风险很大，一些人认为「价格战」是大模型玩家的淘汰加速赛。

6/7/2024 11:05:00 AM

张进

1.8B参数，阿里云首个联合DNA、RNA、蛋白质的生物大模型，涵盖16.9W物种

编辑 | 萝卜皮不久之前，Google DeepMind 发布了 AlphaFold3，再次引发了人们对「AI 生命科学」的讨论。在学界，科学家的目标往往是先认识世界，然后在认识的基础上改造世界。但是在生命科学领域，人类对整个生命的理解与认识还如九牛一毛、冰山一角；建立对生命系统的多维度深刻认识是当前人类研究的重要一步，AI 是达成这一步的重要工具。近期，阿里云飞天实验室发布并开源了业界首个联合 DNA、RNA、蛋白质的生物大模型「LucaOne」。这是一种新型预训练基础模型，旨在综合学习遗传和蛋白质组语言，涵

6/4/2024 3:32:00 PM

ScienceAI

阿里云 all in AI 的决心

如何抓住 AI 的机会？这是进入大模型时代后，面对新的起点，各大云厂商在不断思考的问题。毋庸置疑，AI 与云已经成为紧密的拍档。

5/30/2024 5:32:00 PM

晓楠

独家｜杨红霞创业入局“端侧模型”，投后估值 1.5 亿美元

近日，关于字节跳动大语言模型研发技术专家杨红霞离职创业的事情，坊间传得沸沸扬扬。此前，杨红霞为大家所熟知的是，她曾是阿里达摩院万亿参数规模多模态预训练模型 M6 的技术负责人，参与过北京智源研究院主导的“悟道”大模型项目，而该项目是中国最早的大模型项目之一。 2007 年，杨红霞从南开大学本科毕业后，赴杜克大学攻读博士，师从著名统计学家 David Dunson，著有超过 100 篇杰出学术论文。

5/30/2024 5:18:00 PM

晓楠

对话零一万物：大模型产品要找到 TC-PMF

上次零一万物（以下简称“零一”）开发布会还是在 2023 年 11 月，宣布成立后的模型首秀：发布中英双语大模型“Yi”，并将其开源。这一次，时隔半年，零一不仅将基座模型卷到千亿量级，甚至还直接拿出一款 C 端新品“万知”，零一万物创始人李开复称其为“AI-First 版 office”。在模型层，零一发布了千亿参数的 Yi-Large 闭源模型，在第三方评测基准斯坦福大学的英语排行 AlpacaEval 2.0上，Yi-Large 可与 GPT-4 比肩（如下图所示）；并全面升级了开源模型系列 Yi-1.5，分为 34B、9B、6B三个版本，且提供了 Yi-1.5-Chat 微调模型可供开发者选择。

5/16/2024 3:54:00 PM

张进

字节跳动发布豆包大模型，主力模型比行业价格低99.3%

5月15日，字节跳动豆包大模型在火山引擎原动力大会上正式发布。火山引擎总裁谭待介绍，经过一年时间的迭代和市场验证，豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一，目前日均处理1200亿Tokens文本，生成3000万张图片。 “大的使用量，才能打磨出好模型，也能大幅降低模型推理的单位成本。

5/15/2024 11:15:00 AM

代聪飞

在 ICLR 2024，看见中国大模型的力量

作者 | 赖文昕编辑 | 陈彩娴近日（5.7-5.11），第十二届国际学习表征会议（ICLR）在奥地利维也纳的展览会议中心召开。 ICLR 2024 的论文终审工作自 1 月份启动以来，共收到了7262篇提交论文，相较于上一年度的 4966 篇，增幅达到了 46.1%，接近翻了一番。在严格的评审过程中，大会最终接受了 2260 篇论文，整体接收率维持在 31%，与去年的31.8%基本持平，其中 Spotlights 和 Oral 两种类型的论文展示分别有 367 篇（占5%）和 86 篇（占1.2%）论文获选。

5/13/2024 12:05:00 PM

赖文昕

别再说国产大模型技术突破要靠 Llama 3 开源了

Meta 表示，Llama 3 已经在多种行业基准测试上展现了最先进的性能，提供了包括改进的推理能力在内的新功能，是目前市场上最好的开源大模型。根据Meta的测试结果，Llama 3 8B模型在语言（MMLU）、知识（GPQA）、编程（HumanEval）等多项性能基准上均超过了Gemma 7B和Mistral 7B Instruct，70B 模型则超越了名声在外的闭源模型 Claude 3的中间版本 Sonnet，和谷歌的 Gemini Pro 1.5 相比三胜两负。 Meta还透露，Llama 3的 400B 模型仍在训练中。

4/29/2024 7:54:00 PM

张进

当「养老」遇上 AI 大模型

作者：赖文昕编辑：陈彩娴鲜少有人关注到这样一个现象：在大模型的发展初期，「研发」与「产品」往往来自同一个群体——程序员。由于大模型技术的系统复杂，新一代大模型产品经理的数量稀少，程序员往往既是技术、又是产品。因此，程序员对 AI 大模型「究竟能解决什么问题」、「如何解决某个问题」的思考，也就在一定程度上刻画了第一批大模型落地应用的模样。

4/26/2024 4:49:00 PM

赖文昕

从 0 到 1，揭秘中国首个 AI 音乐 SOTA 模型

音乐早已成为人类表达情感的最佳载体。但音乐创作是一件门槛很高的事情，因为音乐创作不是某一个人的独角戏，而一个团队高度协作的过程。从作词、作曲到编曲、混音，再到歌曲录制，每个环节都需要专业音乐人付出努力，并伴随着高昂的成本投入。

4/22/2024 10:57:00 AM

张进

浪潮信息彭震：AI+是目标也是机会，要推动AI成为百行千业的生产力

去年以来，ChatGPT引爆了新一轮的AI浪潮，随后国内大模型进入“百模大战”的热闹中。如今，一年多过去，国内外的大模型开启了不同的叙事方式，OpenAI已在酝酿GPT5，继续探求通往AGI的路径，而国内，大模型公司开始考虑商业化，落地应用成为国内大模型的主旋律。但在这个过程中，当大模型走进应用，如何更好地落地，已然成为一众AI领域厂商关注的焦点所在。

4/19/2024 6:40:00 PM

晓楠

开源大模型Llama 3王者归来！最大底牌4000亿参数，性能直逼GPT-4

ChatGPT 拉开了大模型竞赛的序幕，Meta 似乎要后来居上了。本周四，AI 领域迎来重大消息，Meta 正式发布了人们等待已久的开源大模型 Llama 3。扎克伯格在 Facebook 上发帖：Big AI news today.与此同时，扎克伯格宣布：基于最新的 Llama 3 模型，Meta 的 AI 助手现在已经覆盖 Instagram、WhatsApp、Faceboo

4/19/2024 2:44:00 AM

机器之心

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 OPPO 小布助手网页版上线，接入满血版 DeepSeek 本地部署DeepSeek+DiFy平台构建智能体应用谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了如何用AI做好情感化设计？来看大厂的实战案例！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型