大模型

美国教授用 2 岁女儿训 AI 模型登 Science，人类幼崽头戴相机训练全新 AI

【新智元导读】为训练 AI 模型，纽约州立大学的一名教授 Brenden Lake，竟让自己不到 2 岁女儿头戴相机收集数据！要知道，Meta 训 Llama 3 直接用了 15 万亿个 token，如果 Lake 真能让 AI 模型学习人类幼崽，从有限的输入中学习，那 LLM 的全球数据荒岂不是解决了？为了训练 AI 模型，一位纽约州立大学的教授，竟然把类似 GoPro 的相机绑在了自己女儿头上！虽然听起来不可思议，但这位教授的行为，其实是有据可循的。要训练出 LLM 背后的复杂神经网络，需要海量数据。目前我们训

5/13/2024 2:51:41 PM

清源

在 ICLR 2024，看见中国大模型的力量

作者 | 赖文昕编辑 | 陈彩娴近日（5.7-5.11），第十二届国际学习表征会议（ICLR）在奥地利维也纳的展览会议中心召开。 ICLR 2024 的论文终审工作自 1 月份启动以来，共收到了7262篇提交论文，相较于上一年度的 4966 篇，增幅达到了 46.1%，接近翻了一番。在严格的评审过程中，大会最终接受了 2260 篇论文，整体接收率维持在 31%，与去年的31.8%基本持平，其中 Spotlights 和 Oral 两种类型的论文展示分别有 367 篇（占5%）和 86 篇（占1.2%）论文获选。

5/13/2024 12:05:00 PM

赖文昕

iPhone AI 大升级：消息称苹果即将与 OpenAI 达成协议，iOS 18 用上 ChatGPT

感谢彭博社记者马克・古尔曼（Mark Gurman）今日发文表示，苹果即将与 OpenAI 达成协议，为今年的新 iOS 系统提供一些生成式 AI 功能（如聊天机器人）。此外，苹果与谷歌就整合 Gemini 的谈判正在进行中，但尚未达成任何协议。知情人士称，双方一直在敲定苹果下一代 iPhone 操作系统 iOS 18 中使用 ChatGPT 功能的协议条款。由于情况保密，该人士要求匿名。苹果还与谷歌就授权后者的 Gemini 聊天机器人进行了谈判。这些讨论尚未达成协议，但仍在进行中。OpenAI 宣布将于太平洋时

5/11/2024 12:29:20 PM

汪淼

【论文解读】System 2 Attention提高大语言模型客观性和事实性

一、简要介绍本文简要介绍了论文“System 2 Attention (is something you might need too) ”的相关工作。基于transformer的大语言模型（LLM）中的软注意很容易将上下文中的不相关信息合并到其潜在的表征中，这将对下一token的生成产生不利影响。为了帮助纠正这些问题，论文引入了System 2 Attention（S2A），它利用LLM的能力，用自然语言进行推理，并遵循指示，以决定要处理什么。S2A重新生成输入上下文以使输入上下文只包含相关部分，然后再处理重新

5/11/2024 11:03:00 AM

合合信息

在富岳超算上训练大模型，日本联合研究团队发布 Fugaku-LLM

由多方企业和机构组成的日本联合研究团队昨日发布了 Fugaku-LLM 大模型。该模型的最大特色就是其是在 Arm 架构超算“富岳”上训练的。Fugaku-LLM 模型的开发于 2023 年 5 月启动，初期参与方包括富岳超算所有者富士通、东京工业大学、日本东北大学和日本理化学研究所（理研）。而在 2023 年 8 月，另外三家合作方 —— 名古屋大学、CyberAgent（也是游戏企业 Cygames 的母公司）和 HPC-AI 领域创企 Kotoba Technologies 也加入了该模型研发计划。▲ 富岳超

5/11/2024 9:39:37 AM

溯波（实习）

91.1% 准确率，性能远超 GPT-4 系列模型，谷歌推出多模态医学大模型 Med-Gemini

编辑 | 萝卜皮各种复杂的医疗应用给人工智能带来了巨大挑战：需要先进的推理、获取最新的医学知识以及对复杂的多模态数据的理解。Gemini 模型在多模态和长上下文推理方面具有强大的通用能力，为 AI 在医学领域应用提供了可能性。基于 Gemini 的核心优势，谷歌的研究人员推出了 Med-Gemini，这是一个功能强大的多模态模型系列，专门用于医学，能够无缝使用网络搜索，并且可以使用自定义编码器有效地针对新颖的模态进行定制。研究人员用 14 项医疗基准评估 Med-Gemini，在其中 10 项上建立了新的最先进（S

5/7/2024 6:43:00 PM

ScienceAI

Chrome 浏览器桌面版地址栏整合自家聊天机器人：@Gemini 即可召唤

谷歌 Chrome 浏览器今日早些时候在 X（推特）宣布，其桌面版地址栏现已整合 Gemini 聊天机器人，用户可以通过简单、便捷的方式将 Gemini 召唤出来：在地址栏中输入“@”，然后选择“与 Gemini 聊天”，输入自定的提示词即可获取 Gemini 的回复。不久之前，该功能仍在 Canary 版本中进行测试。经IT之家此次实测，当 Chrome 更新至 124.0.6367.119（正式版本）之后，即可体验。Gemini 是谷歌 Deepmind 最新、最强大的 AI 模型。它原生支持多模态，具备跨模态

5/1/2024 10:39:05 PM

清源

别再说国产大模型技术突破要靠 Llama 3 开源了

Meta 表示，Llama 3 已经在多种行业基准测试上展现了最先进的性能，提供了包括改进的推理能力在内的新功能，是目前市场上最好的开源大模型。根据Meta的测试结果，Llama 3 8B模型在语言（MMLU）、知识（GPQA）、编程（HumanEval）等多项性能基准上均超过了Gemma 7B和Mistral 7B Instruct，70B 模型则超越了名声在外的闭源模型 Claude 3的中间版本 Sonnet，和谷歌的 Gemini Pro 1.5 相比三胜两负。 Meta还透露，Llama 3的 400B 模型仍在训练中。

4/29/2024 7:54:00 PM

张进

当「养老」遇上 AI 大模型

作者：赖文昕编辑：陈彩娴鲜少有人关注到这样一个现象：在大模型的发展初期，「研发」与「产品」往往来自同一个群体——程序员。由于大模型技术的系统复杂，新一代大模型产品经理的数量稀少，程序员往往既是技术、又是产品。因此，程序员对 AI 大模型「究竟能解决什么问题」、「如何解决某个问题」的思考，也就在一定程度上刻画了第一批大模型落地应用的模样。

4/26/2024 4:49:00 PM

赖文昕

苹果发布 OpenELM，基于开源训练和推理框架的高效语言模型

在 WWDC24 之前，苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”，名为 OpenELM。当然，这是一项开源语言模型，其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下：大型语言模型的可重复性和透明性对于推进开放研究、确保结果的可信度以及调查数据和模型偏差以及潜在风险至关重要。为此，我们发布了 OpenELM，一个最先进的开源语言模型。OpenELM 使用分层缩放策略，可以有效地分配 Transformer 模型每一层的参数

4/24/2024 10:30:54 PM

问舟

移动版谷歌 Gemini 将迎诸多新特性：分析 PDF 文件内容等

感谢消息源 AssembleDebug 近日挖掘安卓版 Gemini 应用程序，发现隐藏了诸多新功能 / 新特性，包括上传 PDF 等文件，引入 Live Prompts、Select text 功能等。上传并分析 PDF 格式文件安卓版 Gemini 现阶段仅支持上传图片，而在最新版中相关代码已经出现了上传 PDF 等文件描述，可以分析文档中的内容，只是该功能目前尚未生效。Select text安卓版 Gemini 此前提供的回答只能全文复制，用户需要复制粘贴到其它地方再进行优化。而在最新选项中新增了“Selec

4/24/2024 2:20:15 PM

故渊

从 0 到 1，揭秘中国首个 AI 音乐 SOTA 模型

音乐早已成为人类表达情感的最佳载体。但音乐创作是一件门槛很高的事情，因为音乐创作不是某一个人的独角戏，而一个团队高度协作的过程。从作词、作曲到编曲、混音，再到歌曲录制，每个环节都需要专业音乐人付出努力，并伴随着高昂的成本投入。

4/22/2024 10:57:00 AM

张进

高通与 Meta 宣布合作，优化 Llama 3 大语言模型在智能手机等终端运行

Meta 公司昨日宣布推出下一代大语言模型 Llama 3，共有 80 亿和 700 亿参数两种版本，号称是最强大的开源大语言模型。与此同时，高通宣布支持 Meta Llama 3 在骁龙终端上运行。据介绍，双方将优化 Meta Llama 3 大语言模型（LLM）直接在智能手机、PC、VR / AR 头显和汽车等终端上的执行。开发者将能够访问高通 AI Hub 中的资源和工具，以实现在骁龙平台上优化运行 Llama 3，从而缩短产品上市时间并充分发挥终端侧 AI 的优势，包括出色的响应能力、增强的隐私性和可靠性，

4/20/2024 7:22:44 PM

浩渺

浪潮信息彭震：AI+是目标也是机会，要推动AI成为百行千业的生产力

去年以来，ChatGPT引爆了新一轮的AI浪潮，随后国内大模型进入“百模大战”的热闹中。如今，一年多过去，国内外的大模型开启了不同的叙事方式，OpenAI已在酝酿GPT5，继续探求通往AGI的路径，而国内，大模型公司开始考虑商业化，落地应用成为国内大模型的主旋律。但在这个过程中，当大模型走进应用，如何更好地落地，已然成为一众AI领域厂商关注的焦点所在。

4/19/2024 6:40:00 PM

晓楠

Meta AI 全球市场扩张，并上线网页版 meta.ai

Meta 公司近日宣布 Llama 3 大语言模型之外，扩展 Meta AI 服务到美国之外的 13 个国家和地区，还宣布上线专门的聊天网站：meta.ai。Meta 公司在新闻稿中表示开始在全球市场扩展 Meta AI，在澳大利亚、加拿大、南非和新加坡等国家和地区推出英语版本。IT之家附上 Meta AI 扩展的国家和地区如下澳大利亚加拿大加纳牙买加马拉维新西兰尼日利亚巴基斯坦新加坡南非乌干达赞比亚津巴布韦Meta AI 整合了 Llama 3 大语言模型，速度更快、智能性更高、功能更强，是执行各种任务的理想选择

4/19/2024 9:15:51 AM

故渊

Meta 发布 Llama 3，号称是最强大的开源大语言模型

感谢Meta 公司今天发布新闻稿，宣布推出下一代大语言模型 Llama 3，共有 80 亿和 700 亿参数两种版本，号称是最强大的开源大语言模型。Meta 声称，Llama 3 的性能优于 Claude Sonnet、Mistral Medium 和 GPT-3.5，IT之家附上 Llama 3 的主要特点如下：向所有人开放：Meta 开源 Llama 3 的 80 亿参数版本，让所有人都能接触最前沿的人工智能技术。全球各地的开发人员、研究人员和好奇心强的人都可以进行游戏、构建和实验。更聪明、更安全：Llama

4/19/2024 9:05:35 AM

故渊

开源大模型Llama 3王者归来！最大底牌4000亿参数，性能直逼GPT-4

ChatGPT 拉开了大模型竞赛的序幕，Meta 似乎要后来居上了。本周四，AI 领域迎来重大消息，Meta 正式发布了人们等待已久的开源大模型 Llama 3。扎克伯格在 Facebook 上发帖：Big AI news today.与此同时，扎克伯格宣布：基于最新的 Llama 3 模型，Meta 的 AI 助手现在已经覆盖 Instagram、WhatsApp、Faceboo

4/19/2024 2:44:00 AM

机器之心

13 项测试仅通过 4 项，Meta 的 Llama 2 LLM 被指安全性低：幻觉率 48%

AI 安全公司 DeepKeep 近日发布评估报告，在 13 个风险评估类别中，Meta 公司的 Llama 2 大语言模型仅通过 4 项测试。报告称 70 亿参数的 Llama 2 7B 模型幻觉（回答内容存在虚假，或者有误导性内容）最为严重，幻觉率高达 48%。DeepKeep 表示：“结果表明，模型有明显的幻觉倾向，提供正确答案或编造回答的可能性对半开，而幻觉率最高，那么向用户传递的错误信息越多”。除了幻觉问题之外，Llama 2 大语言模型还存在注入和操纵等问题。根据测试结果，80% 的场景下通过“提示注入

4/18/2024 11:35:39 AM

故渊

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 OpenAI发布34页智能体实践指南：从网络搜索到代码编写 OpenAI 新规：组织想要用未来 AI 模型需先“验明正身”

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果人形机器人深度学习 AI视频模态 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型