大模型

谁将替代 Transformer？

Transformer 由于其处理局部和长程依赖关系的能力以及可并行化训练的特点，一经问世，逐步取代了过去的 RNN（循环神经网络）与 CNN（卷积神经网络），成为 NLP（自然语言处理）前沿研究的标准范式。今天主流的 AI 模型和产品——OpenAI 的ChatGPT、谷歌的 Bard、Anthropic 的 Claude，Midjourney、Sora到国内智谱 AI 的 ChatGLM 大模型、百川智能的 Baichuan 大模型、Kimi chat 等等——都是基于Transformer 架构。 Transformer 已然代表了当今人工智能技术无可争议的黄金标准，其主导地位至今无人能撼动。

3/27/2024 7:06:00 PM

张进

手机大模型崛起：荣米 OV 的战场厮杀

作者丨郭思编辑丨陈彩娴数据显示，2023年全球智能手机出货量同比下滑3.2%，总数仅为11.7亿部。手机市场的饱和，早已是行业共识。尽管如此，智能手机作为主流的通讯和娱乐工具，业界人士表示，其地位在未来五年内不太可能被迅速替代。

3/27/2024 2:05:00 PM

郭思

零一万物 API 上线，用户反馈多模态中文能力超过 GPT-4V

零一万物由创新工场董事长兼首席执行官李开复创办于 2023 年 6 月，六个月后，零一万物便成功发布了 Yi 系列模型，包含 6B 和 34B 两个版本，并开源，打破了当时国产开源模型一直难以超过 14B 的现状。 34B也是黄金尺寸的模型，既达到了大模型“涌现”能力的门槛，同时也能在消费级显卡上训练，对开发者相对友好。此后较长一段时间 Yi-34B 在 Hugging Face 英文开源社区平台跻身前列，一举打响了零一万物的模型名声。

3/19/2024 7:25:00 PM

张进

“创新落地，生态共赢”，澜舟科技提出大模型落地应用“九字诀”

历经持续一年多的百模大战后，市场竞争逐渐深化，如何更快、更好地推进大模型的落地应用，开始成为各大大模型公司思考的焦点所在。 3月18日，澜舟科技在中关村国家自主创新示范区展示中心隆重举行了“创新落地，生态共赢”大模型技术和产品发布会。会上，澜舟科技展示了澜舟科技的大模型的最新进展和大模型技术的实际应用落地、生态构建的成果，更体现了其对未来发展的深度思考和战略布局。

3/19/2024 10:06:00 AM

晓楠

「创新落地，生态共赢」，2024澜舟科技大模型技术和产品发布会圆满举办

2024 年将是大模型落地元年。

3/18/2024 10:11:00 PM

机器之心

对话南佛罗里达大学孙宇教授：当大语言模型用于机器人任务规划丨IJAIRR

现代化社会，哪些工作场景最需要机器人的帮助？在工业领域，有著名的机器人“四大家族”——发那科、ABB、安川、库卡，经过百余年的发展技术越发成熟，在工业场景已经得到深入而广泛的应用。相比之下，生活场景中的服务型机器人历史则短得多。

3/15/2024 4:03:00 PM

乔燕薇

智谱AI狂飙：与商业化博弈的一年

2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时，张帆如是说。张帆在 2023 年 3 月加入中国大模型领域“当红炸子鸡”智谱负责商业化，他感慨：“大模型不仅把知识给压缩了，还把时间给压缩了。 ”最直接的体现是，在过去的 9 个月，张帆以每个月见大约 100 家客户的速度在推进智谱的大模型商业化，2023 年结束时，张帆团队已拜访了上千家客户。

3/15/2024 3:36:00 PM

张进

Pieter Abbeel 新工作“大世界模型”：轻松玩转1小时长视频，一对一QA视频内容细节

作者：赖文昕编辑：陈彩娴自3天前Sora发布以来，由图灵奖得主、Meta首席科学家Yann LeCun提出的“世界模型”又一次引起了广泛关注。 “世界模型”作为Sora的一大核心亮点，被OpenAI写在技术报告中。但Sora是否真的如Open AI所说，是一个世界模型，却引起了行业内的争论。

3/7/2024 3:13:00 PM

赖文昕

“国家队”评测30个大模型数学能力，九章、文心、星火位列前三

去年ChatGPT横空出世后，我国也迎来“百模大战”，大模型能力测评成为业界前沿课题。近日，大模型数学能力权威测评基准MathEval围绕数学能力，对国内外30个大模型（含同一模型的不同版本）开展测评。根据测评结果，学而思九章、百度文心一言4.0、讯飞星火V3.5摘得前三名。其中，学而思旗下九章大模型在整体表现和中文、英文、各学段子榜单中，都具备领先优势。数据显示，截至去年10月，国内累计发布大模型超200个。大模型越来越多地被运用到数学应用领域，包括数学问题解决、数据分析、学术研究、学习辅导等。目前，通用或垂类

3/1/2024 6:01:00 PM

新闻助手

仅用 53 秒，商汤办公小浣熊就能助你化身高级打工人

作者丨郭思编辑丨陈彩娴继推出ChatGPT后，龙年伊始，OpenAI公司又推出了最新人工智能文生视频大模型Sora，其火爆效果被誉为即将重塑视频内容创作的未来。而无论是ChatGPT还是Sora，众多身处职场的「男工女工」都在一边期待一边害怕，工作方式被彻底颠覆。这一切都是因为AI可以通过现有的网络、数据、资料、知识，展示出超出一般人类的记忆、逻辑、分析、综合能力，如果它能够突破与人交互的界面（语言也是一种界面），那这种能力不仅会超过人类，而且超过几万倍，能较大限度地提高生产效率，也可能会取代部分传统工种。

2/28/2024 10:44:00 AM

郭思

优刻得为智谱AI构建千卡推理集群，助力全球用户畅享大模型智能生活

时光倒回到 2021 年的那个夜晚。一位妈妈灵感枯竭，无法继续她的小说创作；一旁的爸爸正忙碌于代码的世界，他想要在工作之余开发一款小游戏，却困于代码调试；而他们的孩子，正眉头紧锁地趴在书桌上，为一道奥数题苦思冥想。2024 年的今天，AI 大模型的出现让这一切发生改变。在「智谱清言」的助力下，妈妈的小说创作焕发新生，她只需将自己的创意和构思输入给大模型，就可以生成自然生动的故事情节和对话；爸爸用大模型进行代码编程和调试，通过分析代码逻辑，大大减少了开发的繁琐流程，减轻了一大半的⼯作量；大模型也成为了小朋友学习上的得

2/28/2024 10:05:00 AM

新闻助手

自动驾驶领域，「决策」和「感知」终于握手言和

作者丨郭思编辑丨陈彩娴围绕大模型应用于自动驾驶的讨论热度持续升温，却呈现出愈发复杂而矛盾的现象。一方面，资本力量的积极投入，行业巨头纷纷抢占先机。例如，特斯拉近期推出了其“端到端”的全自动驾驶软件FSD v12版本，并已在美国和加拿大地区逐步面向非员工用户提供更新服务。

2/27/2024 10:59:00 AM

郭思

独家 | 月之暗面正在进行两亿美元融资，投前估值高达 15 亿美元

作者丨郭思编辑丨陈彩娴AI 科技评论独家获悉，月之暗面近日正在进行 2 亿美元融资，本轮投资由蚂蚁和阿里集团共同投资，投前估值预计 15 亿美元。据了解，月之暗面团队成员人数在100人至200人之间。团队创始人杨植麟是一个90后，本科毕业于清华大学计算机科学与技术系，博士就读于全美自然语言处理排名第一的卡内基梅隆大学语言技术研究所（LTI)，师从苹果AI研究负责人Ruslan Salakhutdinov、谷歌首席科学家William Cohen。

2/4/2024 11:24:00 AM

郭思

蚂蚁集团NextEvo全面开源AI Infra技术，可实现大模型训练“自动驾驶”

近日，蚂蚁集团AI创新研发部门NextEvo全面开源AI Infra技术，可帮助大模型千卡训练有效时间占比超过95%，能实现训练时“自动驾驶”，这推动了AI研发效率。图：蚂蚁集团的自动化分布式深度学习系统DLRover现已全面开源该技术框架名为DLRover，目标在于大规模分布式训练的智能化。目前很多企业的训练作业都是跑在混合部署的集群中，运行环境复杂多变，不管多么“崎岖的地形”，DLRover都可以“轻松行驶”。2023 年大模型技术的发展，带来了工程实践的爆发，如何管理数据，提高训练和推理效率，最大化利用现有算

2/1/2024 6:50:00 PM

新闻助手

百川智能发布超千亿大模型Baichuan 3，中文评测水平超GPT-4

1 月 29 日，百川智能正式发布千亿参数的大语言模型 Baichuan 3。在多个权威通用能力评测如 CMMLU、GAOKAO 和 AGI-Eval 中，Baichuan 3 都展现了出色的能力，尤其在中文任务上更是超越了 GPT-4。而在数学和代码专项评测如 MATH、HumanEval 和 MBPP 中同样表现出色，证明了 Baichuan 3 在自然语言处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的 MCMLE、MedExam、CMExam 等权威医疗评测上的中文效果同样超过了

1/29/2024 2:33:00 PM

新闻助手

搭载卫星通信：荣耀Magic6系列发布，还有保时捷设计折叠屏

几年的快速成长后，作为手机行业「新玩家」的荣耀已开始在一些领域上实现了引领。1 月 11 日，荣耀正式发布了新一代旗舰手机 Magic 6 系列。这代手机搭载了高通骁龙 8Gen3 芯片，使用最新一代 MagicOS 8.0 操作系统，可通过平台级 AI 使能意图识别能力。荣耀 Magic6 系列售价 4399 元起，将于 1 月 18 日正式开售。除上述特性之外，本次发布的荣耀 Magic6 系列带来了荣耀鸿燕通信、第二代青海湖电池、荣耀巨犀玻璃、荣耀鹰眼相机、绿洲护眼技术、魔法 OS 等创新体验。新一代手机采用

1/11/2024 10:05:00 PM

李泽南

大模型+机器人，详尽的综述报告来了，多位华人学者参与

大模型的出色能力有目共睹，而如果将它们整合进机器人，则有望让机器人拥有一个更加智能的大脑，为机器人领域带来新的可能性，比如自动驾驶、家用机器人、工业机器人、辅助机器人、医疗机器人、现场机器人和多机器人系统。预训练的大型语言模型（LLM）、大型视觉 - 语言模型（VLM）、大型音频 - 语言模型（ALM）和大型视觉导航模型（VNM）可以被用于更好地处理机器人领域的各种任务。将基础模型整合进机器人是一个快速发展的领域，机器人社区最近已经开始探索将这些大模型用于感知、预测、规划和控制等机器人领域。近日，斯坦福大学和普林斯

12/27/2023 2:45:00 PM

机器之心

做大模型时代的最佳云底座，百度智能云打出三套「组合拳」

不破不立，重构云计算这件事，百度智能云公布了最新进展。

12/21/2023 2:57:00 PM

机器之心

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 OpenAI发布34页智能体实践指南：从网络搜索到代码编写 OpenAI 新规：组织想要用未来 AI 模型需先“验明正身”

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果人形机器人深度学习 AI视频模态 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型