大模型

如虎添翼，谷歌探索 AI + 机器人未来：836 平方米复杂场景下指令成功率高达 90%

感谢科技媒体 The Verge 昨日报道，谷歌旗下的 DeepMind 团队正在使用 Gemini 训练其机器人，让其能够完成更复杂的任务，且能在复杂的环境下自由穿梭。DeepMind 团队已经发表了最新的研究论文，利用 Gemini 1.5 Pro 的上下文窗口（达到 200 万个词元），让用户可以更轻松地使用自然语言指令与 RT-2 机器人互动。AI在线注：上下文窗口（context window）是指语言模型在进行预测或生成文本时，所考虑的前一个词元（token）或文本片段的大小范围。其工作原理是拍摄指定区

7/13/2024 9:09:12 AM

故渊

“最强开源 AI 模型”，4050 亿参数版 Meta Llama 3 被曝 7 月 23 日发布

感谢科技媒体 The Information 本周五发布博文，援引内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3-405B，在现有 80 亿和 700 亿参数两个版本之外，推出 4050 亿参数版本，号称是最强大的开源大语言模型。Meta 公司今年 4 月发布 Llama 3 AI 模型时，扎克伯格就在采访中透露正在训练 4050 亿像素的密集模型，但当时没有透露太多的信息。AI在线注：上图为机翻字幕，存在错误报道称 Llama 3-405B 是一个多模态 AI 开源模型，

7/13/2024 8:09:19 AM

故渊

机器人大模型新公司！数据规模比同行大1000倍！贝索斯、孙正义等押注

机器之能报道编辑：Sia用 OpenAI 的方式颠覆机器人世界。「GPT-3 时刻正在进入机器人世界。」最近，Sequoia 合伙人 Stephanie Zhan 在投资了一家新机器人初创后说道。无论是在物流、车厂试点的人形机器人，还是四足机器狗，都要有脑子。过去，脑子要定制，「专款专用」，现在，不必了。最近，位于匹兹堡的机器人初创 Skild AI 声称，已经开发出一种通用的智能系统。它就像一个通用的智能模块，可以接入不同机器人，让他们立刻获得一些基本能力，如爬坡、跨过障碍、识别和捡起物品。7 月 9 日，Sk

7/12/2024 3:35:00 PM

机器之能

人形机器人将当上银行“大堂经理”，国内首个场景训练基地在上海浦东启用

据“上海金融官微”公众号，国内首个人形机器人银行大堂经理场景训练基地在建行上海浦东分行正式启用。银行大堂经理场景训练基地是业内首个商业银行场景应用训练基地，其首次采用开放式的创新训练模式，有助于加快提升人形机器人的能力，推动关键技术、重点产品和重点场景应用。据介绍，此次参训的机器人拥有高度仿生的躯干构型和拟人化的运动控制，结合视觉、听觉、语音等人工智能技术，科学家可以通过具身智能的推理和规划等对其进行训练。目前，该银行已对智能人形机器人开展银行大堂业务咨询、业务分流、智慧柜员机个性化操作指南、反欺诈宣传等面向客户的

7/11/2024 6:03:37 PM

清源

三星确认今年将推出 AI 升级版 Bixby，由自研大语言模型提供支持

三星确认 Bixby 将很快获得人工智能升级。在 Galaxy Z Flip 6 和 Galaxy Z Fold 6 发布后，三星移动部门 CEO TM Roh 在接受 CNBC 采访时表示，公司将在今年晚些时候发布升级版 Bixby，并由三星自家的大语言模型（LLM）提供支持。Roh 表示：“我们将通过应用生成式人工智能技术来提升 Bixby 的能力。”几个月前，三星推出过名为“Samsung Gauss”的自研 LLM。此前曾有报道称三星正在研发升级版 Bixby，但这是三星首次确认相关消息，并透露了大致发布时

7/11/2024 3:59:02 PM

远洋

Llama分子嵌入优于GPT，LLM能理解分子吗？这一局Meta赢了OpenAI

编辑 | 萝卜皮OpenAI 的 GPT 和 Meta AI 的 Llama 等大型语言模型（LLM），因其在化学信息学领域的潜力而日益受到认可，特别是在理解简化分子输入行输入系统（SMILES）方面。这些 LLM 还能够将 SMILES 字符串解码为矢量表示。加拿大温莎大学（University of Windsor）的研究人员比较了 GPT 和 Llama 与 SMILES 上的预训练模型在下游任务中嵌入 SMILES 字符串的性能，重点关注两个关键应用：分子特性预测和药物-药物相互作用预测。该研究以「Can

7/11/2024 11:51:00 AM

ScienceAI

LeCun转发，首个半导体设计开源大模型SemiKong问世，重塑芯片制造流程

编辑 | ScienceAI终于，半导体设计行业有了专属的开源大模型！7 月 9 日，国外公司 Aitomatic 宣布推出「Semi Kong」，这是世界上首个专为半导体行业设计的开源 AI 大型语言模型（LLM）。SemiKong 在 2024 年 Semicon West 展会上亮相，旨在彻底改变半导体工艺和制造技术，并有可能在未来五年内重塑价值 5000 亿美元的半导体行业。图示：LeCun 在 X 转发了 SemiKong 内容。（来源：X）Yann LeCun 在 X 转发了这条激动人心的内容：「这是专

7/10/2024 2:53:00 PM

ScienceAI

AI文档搜索公司Hebbia完成1.3亿美元融资，a16z领投；奥特曼成立AI健康公司；大模型最强架构TTT问世丨AI情报局

融资快报Hebbia 完成 1.3 亿美元融资：位于纽约的 AI 初创公司 Hebbia 宣布完成新一轮 1.3 亿美元融资，由 a16z 领投，Index Ventures、Google Ventures 以及 Peter Thiel 参投。据悉，Hebbia 目前估值约为 7 亿美元，公司成立于 2020 年，其软件可分析数字化文档和数据源，包括监管文件、PDF 以及音频和视频剪辑，以帮助客户处理比面向消费者的聊天机器人更复杂的查询，类似 Glean。旷视科技MEGVII上交所提交注册：旷视科技MEGVII以自研视觉感知算法引擎为核心，致力于持续打造在各商业领域的 AIoT 操作系统，以及深度构建具备连接百亿物联网设备能力的生态系统，为 200 多个国家和地区的数十万开发者提供智能物联服务及解决方案。

7/10/2024 11:48:00 AM

我在思考中

又遇到「GPT写的review」了？看看北大&密歇根的这个研究工作

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]本文是对发表在计算经济学顶级会议ACM Conference on Economics and Computation (EC'24)上的论文Eliciting Informative T

7/10/2024 11:27:00 AM

机器之心

小米黑客马拉松落幕，大模型「智能头盔」获一等奖

本届黑客松上，319 位小米人，产出了 63 个新技术作品。

7/9/2024 7:13:00 PM

新闻助手

港大马毅：现在的大模型只有「知识」，没有「智能」

导语：知识与智能是两个概念。访谈 | 陈彩娴撰文丨马蕊蕾编辑丨陈彩娴当多数人将 Scaling Law（规模定律）作为信仰并投身其中时，马毅却选择了一条少有人走的路。「模型无所谓大小，我们说正确的模型，主要看机制是否正确，这才是智能的本质。

7/9/2024 3:31:00 PM

马蕊蕾

开源3D医学大模型SAT，支持497类器官，性能超越72个nnU-Nets，上交大团队发布

作者 | 上海交通大学、上海人工智能实验室编辑 | ScienceAI近日，上海交通大学与上海人工智能实验室联合团队发布3D医学图像分割大模型SAT（Segment Anything in radiology scans, driven by Text prompts），在3D医学图像（CT、MR、PET）上，基于文本提示实现对人体497种器官/病灶的通用分割。所有数据和代码、模型均已开源。论文链接：：：、手术规划和疾病监测等一系列临床任务中都有重要作用。然而，传统的研究针对每个特定的分割任务训练「专用」模型，导致

7/9/2024 1:41:00 PM

ScienceAI

北大千问团队推出数学专用版 CriticGPT，“找茬”让大模型进步更快

批评不仅能让人进步，也能让大模型的能力提升。OpenAI 就用这个思路造了个“找茬模型”CriticGPT。非常巧合的是，就在 CriticGPT 放出的前几天，北大联合千问等团队以类似的思路设计出了“数学专用版”CriticGPT。在无需训练的设置下，验证器能够在推理时辅助模型在 GSM8K 上的准确率从 86.6% 提升到 88.2%。在 GSM8K 数据集上，它可以让模型的准确率从 86.6% 提升到 88.2%。CriticGPT 的核心思路是在代码中故意设置 bug 并进行详细标注，然后用得到的数据训练出

7/8/2024 11:30:24 PM

清源

Anthropic 首席执行官：未来三年内，AI 大模型训练成本将上升至百亿甚至千亿美元

据 Tom's Hardware 今日报道，AI 初创公司 Anthropic 的首席执行官 Dario Amodei 近期接受播客节目采访时表示，目前像 GPT-4o 这样的模型训练成本约为 1 亿美元，而目前正在开发的 AI 大模型训练成本可能高达 10 亿美元（AI在线备注：当前约 72.94 亿元人民币）。当然，10 亿美元还不是“终点”。Dario Amodei 作出预测，未来三年内，AI 大模型的训练成本将上升至 100 亿美元甚至 1000 亿美元（当前约 7294.28 亿元人民币）。Dario A

7/8/2024 3:58:29 PM

清源

启明创投发布2024生成式AI十大展望

7月6日，由启明创投主办的2024世界人工智能大会（WAIC）“启明创投·创业与投资论坛——超级模型、超级应用、超级机遇”在上海世博中心红厅成功举办。大语言模型、多模态模型、具身智能和生成式AI应用领域的著名专家与学者，顶尖投资人和领军创业者汇聚一堂，围绕生成式AI基础技术进展、商业应用前景和创业投资生态等主题展开分享与交流。启明创投从2013年开始系统性布局人工智能领域，从AI 1.0到AI 2.0，经过十余年的深耕与前沿洞察，启明创投在AI领域投资了众多项目，多家上市或成长为独角兽企业。

7/7/2024 10:48:00 PM

晓楠

100天后，阶跃星辰交出了第二份答卷

今年 3 月，「借着」 2024 全球开发者先锋大会的场子，「国内最后一家通用大模型公司」——阶跃星辰发布了 Step 系列通用大模型，包括 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态大模型以及 Step-2 万亿参数 MoE 语言大模型预览版，正式进入大众视野，并成功跻身国内六大大模型独角兽行列。另外五家分别是月之暗面、智谱、MiniMax、百川、零一万物。当然，这一份成绩很是亮眼，一举将国内大模型卷到万亿参数赛道（预览版）。

7/5/2024 9:29:00 PM

晓楠

无限光年发布光语大模型，以灰盒可信技术深耕专业场景，赋能千行百业

7月4日，可信大模型公司无限光年（INF）在2024年世界人工智能大会（WAIC）上发布可信光语大模型及其技术报告。可信光语大模型结合大语言模型与符号推理，有效解决幻觉问题，大幅增强模型可信度，赋能金融服务、医疗诊断等垂直领域，让生成式AI真正成为新质生产力工具。在“人工智能：科研范式变革与产业发展”主题论坛上，无限光年联合创始人徐盈辉博士表示，幻觉问题是大模型被用作生产力工具的核心挑战之一：如果大模型生成的内容不可控、难以解释，就很难满足专业领域对准确性、可靠性、严谨性的要求。

7/5/2024 2:30:00 PM

晓楠

13瓦功耗处理10亿参数，接近大脑效率，消除LLM中的矩阵乘法来颠覆AI现状

编辑 | 萝卜皮通常，矩阵乘法 (MatMul) 在大型语言模型（LLM）总体计算成本中占据主导地位。随着 LLM 扩展到更大的嵌入维度和上下文长度，这方面的成本只会增加。加州大学、LuxiTech 和苏州大学的研究人员声称开发出一种新方法，通过消除过程中的矩阵乘法来更有效地运行人工智能语言模型。这从根本上重新设计了目前由 GPU 芯片加速的神经网络操作方式。研究人员描述了如何在不使用 MatMul 的情况下创建一个自定义的 27 亿参数模型，性能与当前最先进的 Transformer 模型相当。该研究以「Scal

7/4/2024 3:42:00 PM

ScienceAI

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 AI视频用哪个？6个知名的AI视频工具使用测评报告

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型