大模型

谷歌 Gemini 被曝今日起推出多项新功能:定制 GPT、记忆或个性化回复等

根据反向工程师 @testingcatalog 的发现,谷歌将在近期为其 Gemini 人工智能助手带来几项更新。从该工程师发布的截图来看,这一轮更新原计划在 7 月 11 日、7 月 18 日分批推送,但他又声称 7 月 11 日的更新已经推迟至 7 月 15 日(AI在线注:日期即今日,但以具体时区为准),预计当天将带来 1 项功能。而在 7 月 18 日,谷歌计划发布 4 项 Gemini 新功能。媒体 Testing Catalog 披露了近期即将发布的新功能,但未说明这些功能的具体上线日期。文生图工具 I

谷歌 Gemini AI 遭质疑:未经用户同意读取 Google Drive 文档

感谢据 X 用户 @Kevin Bankston 的报告,谷歌的人工智能服务 Gemini AI 似乎在未经用户明确许可的情况下读取 Google Drive 中的私人文档。AI在线注意到,Bankston 在其推文中详细描述了这一问题。最初,他发现 Gemini 似乎在阅读他的 Google Drive 文档,但相关设置中找不到禁用该功能的选项。经进一步调查,他发现这是 Google Drive 本身的问题,而非 Google Docs,但两者可能都存在类似的漏洞。而且,根据 Gemini 人工智能的说法,用于控

模型训练成本“平民化”,前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2

GPT-2 是 OpenAI 于 2019 年推出的模型,其训练费用一度为每小时 256 美元,那么 5 年过后的 GPT-4 时代,软硬件和数据的进步,是否意味着训练同一模型所需的时间和成本会随之减少呢?答案是肯定的。据 Tom's Hardware 今日报道,前特斯拉 AI 总监、OpenAI 联合创始人、项目开发者 Andrej Karpathy 使用 llm.c“重现”了 GPT-2,其成本降到了每小时仅 28 美元(AI在线备注:当前约 204 元人民币),在短短 5 年内降低了近 90%。图源 Pixa

如虎添翼,谷歌探索 AI + 机器人未来:836 平方米复杂场景下指令成功率高达 90%

感谢科技媒体 The Verge 昨日报道,谷歌旗下的 DeepMind 团队正在使用 Gemini 训练其机器人,让其能够完成更复杂的任务,且能在复杂的环境下自由穿梭。DeepMind 团队已经发表了最新的研究论文,利用 Gemini 1.5 Pro 的上下文窗口(达到 200 万个词元),让用户可以更轻松地使用自然语言指令与 RT-2 机器人互动。AI在线注:上下文窗口(context window)是指语言模型在进行预测或生成文本时,所考虑的前一个词元(token)或文本片段的大小范围。其工作原理是拍摄指定区

“最强开源 AI 模型”,4050 亿参数版 Meta Llama 3 被曝 7 月 23 日发布

感谢科技媒体 The Information 本周五发布博文,援引内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3-405B,在现有 80 亿和 700 亿参数两个版本之外,推出 4050 亿参数版本,号称是最强大的开源大语言模型。Meta 公司今年 4 月发布 Llama 3 AI 模型时,扎克伯格就在采访中透露正在训练 4050 亿像素的密集模型,但当时没有透露太多的信息。AI在线注:上图为机翻字幕,存在错误报道称 Llama 3-405B 是一个多模态 AI 开源模型,

机器人大模型新公司!数据规模比同行大1000倍!贝索斯、孙正义等押注

机器之能报道编辑:Sia用 OpenAI 的方式颠覆机器人世界。「GPT-3 时刻正在进入机器人世界。」最近,Sequoia 合伙人 Stephanie Zhan 在投资了一家新机器人初创后说道。无论是在物流、车厂试点的人形机器人,还是四足机器狗,都要有脑子。过去,脑子要定制,「专款专用」,现在,不必了。最近,位于匹兹堡的机器人初创 Skild AI  声称,已经开发出一种通用的智能系统。它就像一个通用的智能模块,可以接入不同机器人,让他们立刻获得一些基本能力,如爬坡、跨过障碍、识别和捡起物品。7 月 9 日,Sk

人形机器人将当上银行“大堂经理”,国内首个场景训练基地在上海浦东启用

据“上海金融官微”公众号,国内首个人形机器人银行大堂经理场景训练基地在建行上海浦东分行正式启用。银行大堂经理场景训练基地是业内首个商业银行场景应用训练基地,其首次采用开放式的创新训练模式,有助于加快提升人形机器人的能力,推动关键技术、重点产品和重点场景应用。据介绍,此次参训的机器人拥有高度仿生的躯干构型和拟人化的运动控制,结合视觉、听觉、语音等人工智能技术,科学家可以通过具身智能的推理和规划等对其进行训练。目前,该银行已对智能人形机器人开展银行大堂业务咨询、业务分流、智慧柜员机个性化操作指南、反欺诈宣传等面向客户的

三星确认今年将推出 AI 升级版 Bixby,由自研大语言模型提供支持

三星确认 Bixby 将很快获得人工智能升级。在 Galaxy Z Flip 6 和 Galaxy Z Fold 6 发布后,三星移动部门 CEO TM Roh 在接受 CNBC 采访时表示,公司将在今年晚些时候发布升级版 Bixby,并由三星自家的大语言模型(LLM)提供支持。Roh 表示:“我们将通过应用生成式人工智能技术来提升 Bixby 的能力。”几个月前,三星推出过名为“Samsung Gauss”的自研 LLM。此前曾有报道称三星正在研发升级版 Bixby,但这是三星首次确认相关消息,并透露了大致发布时

Llama分子嵌入优于GPT,LLM能理解分子吗?这一局Meta赢了OpenAI

编辑 | 萝卜皮OpenAI 的 GPT 和 Meta AI 的 Llama 等大型语言模型 (LLM),因其在化学信息学领域的潜力而日益受到认可,特别是在理解简化分子输入行输入系统(SMILES)方面。这些 LLM 还能够将 SMILES 字符串解码为矢量表示。加拿大温莎大学(University of Windsor)的研究人员比较了 GPT 和 Llama 与 SMILES 上的预训练模型在下游任务中嵌入 SMILES 字符串的性能,重点关注两个关键应用:分子特性预测和药物-药物相互作用预测。该研究以「Can

LeCun转发,首个半导体设计开源大模型SemiKong问世,重塑芯片制造流程

编辑 | ScienceAI终于,半导体设计行业有了专属的开源大模型!7 月 9 日,国外公司 Aitomatic 宣布推出「Semi Kong」,这是世界上首个专为半导体行业设计的开源 AI 大型语言模型(LLM)。SemiKong 在 2024 年 Semicon West 展会上亮相,旨在彻底改变半导体工艺和制造技术,并有可能在未来五年内重塑价值 5000 亿美元的半导体行业。图示:LeCun 在 X 转发了 SemiKong 内容。(来源:X)Yann LeCun 在 X 转发了这条激动人心的内容:「这是专

AI文档搜索公司Hebbia完成1.3亿美元融资,a16z领投;奥特曼成立AI健康公司;大模型最强架构TTT问世丨AI情报局

融资快报Hebbia 完成 1.3 亿美元融资:位于纽约的 AI 初创公司 Hebbia 宣布完成新一轮 1.3 亿美元融资,由 a16z 领投,Index Ventures、Google Ventures 以及 Peter Thiel 参投。 据悉,Hebbia 目前估值约为 7 亿美元,公司成立于 2020 年,其软件可分析数字化文档和数据源,包括监管文件、PDF 以及音频和视频剪辑,以帮助客户处理比面向消费者的聊天机器人更复杂的查询,类似 Glean。 旷视科技MEGVII上交所提交注册:旷视科技MEGVII以自研视觉感知算法引擎为核心,致力于持续打造在各商业领域的 AIoT 操作系统,以及深度构建具备连接百亿物联网设备能力的生态系统,为 200 多个国家和地区的数十万开发者提供智能物联服务及解决方案。

又遇到「GPT写的review」了?看看北大&密歇根的这个研究工作

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本文是对发表在计算经济学顶级会议ACM Conference on Economics and Computation (EC'24)上的论文Eliciting Informative T

小米黑客马拉松落幕,大模型「智能头盔」获一等奖

本届黑客松上,319 位小米人,产出了 63 个新技术作品。

港大马毅:现在的大模型只有「知识」,没有「智能」

导语:知识与智能是两个概念。 访谈 | 陈彩娴撰文丨马蕊蕾编辑丨陈彩娴当多数人将 Scaling Law(规模定律)作为信仰并投身其中时,马毅却选择了一条少有人走的路。 「模型无所谓大小,我们说正确的模型,主要看机制是否正确,这才是智能的本质。

开源3D医学大模型SAT,支持497类器官,性能超越72个nnU-Nets,上交大团队发布

作者 | 上海交通大学、上海人工智能实验室编辑 | ScienceAI近日,上海交通大学与上海人工智能实验室联合团队发布3D医学图像分割大模型SAT(Segment Anything in radiology scans, driven by Text prompts),在3D医学图像(CT、MR、PET)上,基于文本提示实现对人体497种器官/病灶的通用分割。所有数据和代码、模型均已开源。论文链接:::、手术规划和疾病监测等一系列临床任务中都有重要作用。然而,传统的研究针对每个特定的分割任务训练「专用」模型,导致

北大千问团队推出数学专用版 CriticGPT,“找茬”让大模型进步更快

批评不仅能让人进步,也能让大模型的能力提升。OpenAI 就用这个思路造了个“找茬模型”CriticGPT。非常巧合的是,就在 CriticGPT 放出的前几天,北大联合千问等团队以类似的思路设计出了“数学专用版”CriticGPT。在无需训练的设置下,验证器能够在推理时辅助模型在 GSM8K 上的准确率从 86.6% 提升到 88.2%。在 GSM8K 数据集上,它可以让模型的准确率从 86.6% 提升到 88.2%。CriticGPT 的核心思路是在代码中故意设置 bug 并进行详细标注,然后用得到的数据训练出

Anthropic 首席执行官:未来三年内,AI 大模型训练成本将上升至百亿甚至千亿美元

据 Tom's Hardware 今日报道,AI 初创公司 Anthropic 的首席执行官 Dario Amodei 近期接受播客节目采访时表示,目前像 GPT-4o 这样的模型训练成本约为 1 亿美元,而目前正在开发的 AI 大模型训练成本可能高达 10 亿美元(AI在线备注:当前约 72.94 亿元人民币)。当然,10 亿美元还不是“终点”。Dario Amodei 作出预测,未来三年内,AI 大模型的训练成本将上升至 100 亿美元甚至 1000 亿美元(当前约 7294.28 亿元人民币)。Dario A

启明创投发布2024生成式AI十大展望

7月6日,由启明创投主办的2024世界人工智能大会(WAIC)“启明创投·创业与投资论坛——超级模型、超级应用、超级机遇”在上海世博中心红厅成功举办。 大语言模型、多模态模型、具身智能和生成式AI应用领域的著名专家与学者,顶尖投资人和领军创业者汇聚一堂,围绕生成式AI基础技术进展、商业应用前景和创业投资生态等主题展开分享与交流。 启明创投从2013年开始系统性布局人工智能领域,从AI 1.0到AI 2.0,经过十余年的深耕与前沿洞察,启明创投在AI领域投资了众多项目,多家上市或成长为独角兽企业。