大模型

AI在用 | AI卷起「穷鬼健身」，15天涨粉上万

机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。投稿邮箱：[email protected]日本国民女神天海佑希有句名言：男人会背叛你，但肌肉不会。网友纷纷评论：女王发言、人间清醒……视频链接：，健身圈也卷到不行。什么直角肩、马甲线、双开门…… 为了练出好身材，年轻人们拼了

8/19/2024 5:41:00 PM

机器之能

Nature子刊，上智院、复旦、中国气象局研发次季节AI大模型「伏羲」，突破「可预报性沙漠」

编辑 | ScienceAI作者 | 伏羲团队国务院印发的《气象高质量发展纲要（2022—2035 年）》明确提出要「提前一个月预报重大天气过程」，而这离不开 15 天以上的次季节气候预测技术。次季节气候预测关注的是未来 15~60 天的气候异常，可以为农业、水利、能源等领域的生产安排提供重要支撑。相比时效在两周以内的中短期天气预报，次季节气候预测的不确定性更大。它不仅需要考虑初值问题，还要考虑边界强迫的影响，预测来源更为复杂，预测技巧也较少。因此，次季节气候预测一直被称为「可预报性沙漠」，由于其复杂性，甚至连 A

8/19/2024 2:37:00 PM

ScienceAI

小而强，英伟达剪枝、蒸馏出 Llama-3.1-Minitron 4B AI 模型

英伟达公司联合 Meta 公司发布了最新的 Llama-3.1-Minitron 4B AI 模型，主要通过结构化权重剪枝、知识提炼等尖端技术，成功蒸馏（Distill）出 40 亿参数的“小而强”模型。图源：英伟达Llama-3.1-Minitron 4B 模型在 Llama-3.1-Minitron 8B 基础上蒸馏而来，英伟达在深度和宽度方向上使用了结构化剪枝技术。AI在线注：剪枝是一种删除网络中不那么重要的层或神经元的技术，保留其性能的情况下，目的是减小模型的大小和复杂度。英伟达通过从模型中删除 16 层来

8/17/2024 7:21:02 AM

故渊

Nature 曝惊人内幕：论文被天价卖出喂 AI，作者 0 收入

Nature 的一篇文章透露：你发过的 paper，很可能已经被拿去训练模型了！有的出版商靠卖数据，已经狂赚 2300 万美元。然而辛辛苦苦码论文的作者们，却拿不到一分钱，这合理吗？全球数据告急，怎么办？论文来凑！最近，Nature 的一篇文章向我们揭露了这样一个事实：连科研论文，都被薅去训 AI 了……据悉，很多学术出版商，已经向科技公司授权访问自家的论文，用来训练 AI 模型。一篇论文从酝酿 idea 到成稿，包含了多少作者日日夜夜的心血，如今很可能在不知情的情况下，就成为训 AI 的数据。这合理吗？更可气的是

8/15/2024 12:53:16 PM

汪淼

古尔曼：苹果在 AI 领域至少落后谷歌两到三年

昨天谷歌提前召开新品发布会，抢在苹果 iPhone 16 系列发布前展示了 Pixel 9 系列搭载的全新 AI 功能，引发业内广泛关注。彭博社记者马克・古尔曼称，苹果在 AI 技术方面至少落后谷歌两三年。谷歌在本次发布会上全面展示了 Gemini AI 的强大功能，将其深度整合到了 Android 和 Pixel 手机中。相比之下，苹果虽然在 WWDC 上公布了 Apple Intelligence，但实际应用尚不成熟，消息称部分功能甚至无法在 iPhone 16 发布时及时推出。此外，谷歌还强调 Gemini

8/15/2024 11:05:38 AM

远洋

AI在用 | 穿越了！3款AI工具让梵高、莫扎特们「活」在当下

机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。最近，有博主将一堆世界名人的自画像制成了动画，吸引了不少网友围观。例如，文森特・梵高略带忧郁地抚摸着红色的络腮胡子：一副贵族气质的莫扎特摆弄起礼服：写出《傲慢与偏见》的简・奥斯汀坐在椅子上露出微笑：贝多芬忘我地拉着小提琴：还有达芬

8/14/2024 5:04:00 PM

机器之能

谷歌版 Her 大翻车：试了 3 次且换手机才成功… 网友：我手动只需 10 秒

翻车，大翻车。就在今天凌晨，谷歌版 Her——Gemini Live 正式发布。毕竟明显是对标 OpenAI 家的 GPT-4o，可以说是吸足了科技圈的眼球。在官网发布的 demo 中，拍照问答功能的效果是这样的：它大致实现的功能，是用手机拍摄演唱会的海报，并让 Gemini 查看用户的日历，看看行程是否适合参加。以及还可以基于此进行一系列后续的操作，包括定时间查票价等等。然而…… 当来到发布会现场演示环节的时候，画风却 180° 大变样。请看 VCR：第一次：失败了。第二次：失败了。第三次：换手机，成功了。嗯…

8/14/2024 12:26:03 PM

清源

谷歌发布 Gemini Live：支持 AI 语音聊天，可模拟面试场景、推荐演讲技巧

谷歌在今天召开的 Pixel 9 系列手机发布会上，发布了 Gemini Live 服务，将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。推动自然、流畅的对话交流谷歌表示 Gemini Live 提供了一种移动对话体验，让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式（限量 Alpha 测试），采用了增强型语音引擎，可以展开更连贯、更有情感表达力、更逼真的多轮对话。谷歌表示用

8/14/2024 3:02:04 AM

故渊

最强 AI 程序员 Genie 砸饭碗：84 秒跑通代码，像人一样思考，团队仅 5 人

继 Devin 之后，又一个 AI 软件工程师被刷屏了 —— 它叫 Genie，号称目前地表最强，已经可以像人一样思考和行动了！那么这个“地表最强”，到底强到什么程度？先来看下评测分数。在权威榜单 SWE-Bench 中，Genie 以解决了 30.07% 问题的成绩夺得榜首。（SWE-Bench 是一个用来评估大模型解决现实中软件问题的基准。）而这个成绩可谓是遥遥领先第二名 19.27%，解锁了提升 SOTA 的最大增幅 —— 57%！至于 Genie 的实际效果，用团队的话来说就是：它可以做到像人类工程师一样解

8/13/2024 2:00:40 PM

汪淼

谷歌I/O开发者大会中国站：大模型技术进入全生态

本周三，谷歌在北京召开了中国开发者大会。除 5 月加州山景城的 I/O 大会之外，今年的 I/O Connect 环球之旅从德国柏林开始、到印度班加罗尔，也已来到中国北京。在这次活动中，来自多个不同领域的专家为国内开发者深入分享了谷歌在 AI、Web、移动端、云技术等领域的最新技术进展、开发工具和全球服务平台等内容。「中国是全球最大的开发者市场之一，我们的开发者一直是全球舞台上不可或缺的先锋力量，」谷歌大中华区总裁陈俊廷在开幕演讲中表示。「过去一年，来自中国的 25 个开发团队共有 31 款游戏和应用，在全球不同的

8/9/2024 5:37:00 PM

李泽南

小米旗舰设备国际版将接入谷歌 Gemini 大模型，OPPO 此前已接入

感谢小米创办人雷军 8 月 7 日宣布，小米旗舰设备国际版将接入谷歌 AI 大模型 Google Gemini。小米目前已在国行机型中推出了自家的 AI 功能，7 月 30 日，小米小爱同学「大模型小爱」宣布全量升级，支持自然问答、图片编辑、车外唤醒防御等，覆盖核心品类设备。8 月 5 日，小米 14、Redmi K70 等机型推澎湃 OS 全 AI 功能，包括小爱输入助手、AI 写真、AI 搜图、实时字幕、端侧小爱同学文生图、端侧相册 AI 编辑等。AI在线查询获悉，2024 Google 开发者大会于 8 月

8/9/2024 1:16:23 PM

汪淼

手机跑大模型提速 4-5 倍：微软亚研院开源新技术 T-MAC，有 CPU 就行

有 CPU 就能跑大模型，性能甚至超过 NPU / GPU！没错，为了优化模型端侧部署，微软亚洲研究院提出了一种新技术 —— T-MAC。这项技术主打性价比，不仅能让端侧模型跑得更快，而且资源消耗量更少。咋做到的？？在 CPU 上高效部署低比特大语言模型一般来说，要想在手机、PC、树莓派等端侧设备上使用大语言模型，我们需要解决存储和计算问题。常见的方法是模型量化，即将模型的参数量化到较低的比特数，比如 4 比特、3 比特甚至更低，这样模型所需的存储空间和计算资源就会减少。不过这也意味着，在执行推理时，需要进行混合精

8/9/2024 12:58:46 PM

汪淼

消息称马斯克 X 平台同意不使用部分欧盟用户数据来训练 AI

感谢路透社今天（8 月 9 日）报道，马斯克旗下的 X 平台同意不使用部分欧盟用户数据，来训练其 AI 聊天机器人。爱尔兰一家法院周四表示，社交媒体平台 X 同意在欧盟用户选择撤销同意之前，暂时不使用从他们那里收集的个人数据来训练其 AI 系统。爱尔兰数据保护委员会本周寻求一项命令，要求暂停或限制 X 公司，不得处理用户数据来开发、训练或改进其人工智能系统。AI在线曾于 7 月报道，X 用户发现他们已“自动选择”将其帖子以及与 xAI 旗下 Grok 聊天机器人的互动用于“训练和微调”xAI 系统，此举是在未事先获

8/9/2024 10:42:44 AM

故渊

AI 搜索向左，搜索 OG 向右

作为 AI 世界的领头羊，OpenAI 发布的 SearchGPT 再次给 AI 搜索加了一把火。这把火原本由 Perplexity 引燃，在美国烧及 Google 和微软，在中国引发了百度、360 的追随，又带动一批创业者跟上，已然成为当下最时髦的热词。如果大模型之争能够被称为百模大战的话，那么 AI 搜索之争，就可以步其后尘，称之为“百搜大战”了。

8/8/2024 6:56:00 PM

晓楠

马斯克 X 平台因抓取用户数据训练 AI 在爱尔兰被起诉

感谢爱尔兰数据保护委员会（DPC）向高等法院提起诉讼，指控马斯克旗下的 X 平台擅用用户数据，用于训练 Grok AI 模型等增强型搜索工具。DPC 已委托 Remy Farrell SC 律师事务所提交诉讼，指控 Twitter International Unlimited Company 公司没有遵守 GDPR 规定的义务，使用用户数据训练 Grok。DPC 表示 X 平台虽然已提供了退出等缓解措施，但该公司仍收集大量欧盟用户数据，在诉讼中，DPC 寻求法院下令禁止或限制 X 使用用户个人数据来开发、训练或改

8/8/2024 10:43:59 AM

故渊

清华“太极-Ⅱ”光芯片面世：成果登 Nature，首创全前向智能光计算训练架构

据清华大学官方消息，清华大学电子工程系方璐教授课题组、自动化系戴琼海院士课题组另辟蹊径，首创了全前向智能光计算训练架构，研制了“太极-II”光训练芯片，实现了光计算系统大规模神经网络的高效精准训练。该研究成果以“光神经网络全前向训练”为题，于北京时间 8 月 7 日晚在线发表于《自然》期刊。AI在线查询获悉，清华大学电子系为论文第一单位，方璐教授、戴琼海教授为论文的通讯作者，清华大学电子系博士生薛智威、博士后周天贶为共同一作，电子系博士生徐智昊、之江实验室虞绍良博士参与了该项工作。该课题受到国家科技部、国家自然科学

8/8/2024 9:05:32 AM

汪淼

Meta 推出“自学评估器”：无需人工注释改善评估，性能超 GPT-4 等常用 AI 大语言模型评审

Meta 公司为了缓解自然语言处理（NLP）技术依赖人类注释评估 AI 模型的问题，最新推出了“自学评估器”（Self-Taught Evaluator），利用合成数据训练 AI。NPU 技术挑战NPU 技术的发展，推动大型语言模型（LLMs）高精度地执行复杂的语言相关任务，实现更自然的人机交互。不过当前 NPU 技术面临的一个重要挑战，就是评估模型严重依赖人工注释。人工生成的数据对于训练和验证模型至关重要，但收集这些数据既费钱又费时。而且随着模型的改进，以前收集的注释可能需要更新，从而降低了它们在评估新模型时的效

8/7/2024 3:56:11 PM

故渊

Meta 构建分布式 RoCEv2 网络：探索串联数万片 GPU，训练千亿参数级 AI 模型

Meta 公司于 8 月 5 日发布博文，表示为了满足大规模分布式 AI 训练对网络的需求，构建了基于 RoCEv2 协议的大规模 AI 网络。RoCEv2 的全称是 RDMA Over Converged Ethernet version 2，是一种节点间通信传输方式，用于大部分人工智能容量。Meta 公司已成功扩展了 RoCE 网络，从原型发展到部署了众多集群，每个集群可容纳数千个 GPU。这些 RoCE 集群支持广泛的生产型分布式 GPU 训练工作，包括排名、内容推荐、内容理解、自然语言处理和 GenAI 模

8/7/2024 7:35:32 AM

故渊

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 AI视频用哪个？6个知名的AI视频工具使用测评报告

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型