应用

谷歌发布 Gemini Live：支持 AI 语音聊天，可模拟面试场景、推荐演讲技巧

谷歌在今天召开的 Pixel 9 系列手机发布会上，发布了 Gemini Live 服务，将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。推动自然、流畅的对话交流谷歌表示 Gemini Live 提供了一种移动对话体验，让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式（限量 Alpha 测试），采用了增强型语音引擎，可以展开更连贯、更有情感表达力、更逼真的多轮对话。谷歌表示用

8/14/2024 3:02:04 AM

故渊

神器大盘点！B站700万人气的AI整活视频都是如何完成的？

大家好，这里是和你们一起探索 AI 的花生~ 巴黎奥运会已经结束了，这段时间除了观看激动人心的竞赛，我的另一大乐趣就是在 B 站看各种奥运会的吐槽/整活视频。而在这个过程中，我也发现不少视频都用上了 AI 技术，给人带来了新的观看体验。那么今天就和大家聊聊其中比较新奇有趣的效果以及相关实现方法，说不定哪天你也用得上~ 相关推荐：一、视频角色替换首先是一个调侃在奥运会开幕式上出场的 “蓝精灵” 的视频。由于 “蓝精灵” 的装扮造型和 86 版《西游记》里的青狮怪非常相似，于是一个 B 站 up 主借用了电影《美人

8/14/2024 12:59:32 AM

夏花生

最强 AI 程序员 Genie 砸饭碗：84 秒跑通代码，像人一样思考，团队仅 5 人

继 Devin 之后，又一个 AI 软件工程师被刷屏了 —— 它叫 Genie，号称目前地表最强，已经可以像人一样思考和行动了！那么这个“地表最强”，到底强到什么程度？先来看下评测分数。在权威榜单 SWE-Bench 中，Genie 以解决了 30.07% 问题的成绩夺得榜首。（SWE-Bench 是一个用来评估大模型解决现实中软件问题的基准。）而这个成绩可谓是遥遥领先第二名 19.27%，解锁了提升 SOTA 的最大增幅 —— 57%！至于 Genie 的实际效果，用团队的话来说就是：它可以做到像人类工程师一样解

8/13/2024 2:00:40 PM

汪淼

2024AGI商业趋势大会最新嘉宾议程公布，相约深圳见证AI闪光时刻

2024年，AI的身影已经无处不在。在巨头的大模型竞技场之外，更广泛的创业者、开发者和个人玩家越来越关注用AI来解决具体的商业诉求，改善自己的工作流。作为业界期待的“下一个互联网”，乃至“超越移动互联网的平台式机会”，创业者们正在积极探索智能与营销、设计、硬件、金融、教育、医疗等具体行业和精准场景的结合。从文本到图像、音乐和视频；由知识问答到导购客服、代码辅助、情感陪伴，乃至导诊分诊、法律咨询、科研开发，用AI “重做一遍应用”的预言似乎正在变成现实。超级应用会在何处诞生？大模型凶猛，小而美的产品会有机会吗？那些完

8/12/2024 10:48:00 AM

新闻助手

如何设计能让用户自发传播的 AI 应用？完整流程来了！

一、市场的现状与尝试 1. 当前现状目前在各领域中的人工智能（AI）现状，由于企业级（B 端）和消费者级（C 端）AI 应用在功能和目标用户群体方面存在显著差异，导致其工具属性显得尤为突出。无论在何种场景下，用户在使用 AI 技术时，主要目的是提高效率或解决特定问题。然而，大多数普通用户难以直接接触到 AI 技术，在使用过程中仍面临一定的门槛。而这些普通用户通常是通过其他应用程序间接地接触到 AI 技术。在面对市场上众多 AI 工具的情况下，我们需要结合自身业务的特性和当前状况，思考如何使钉钉上的更多非专业的普

8/12/2024 1:21:44 AM

团队钉钉设计

效率翻倍！6 款不容错过的免费 AI 神器（九）

大家好，这里和你们一起探索 AI 的花生。今天继续我们的 AI 效率神器推荐第 9 期，一起来看看吧~ 上期回顾：一、FreePik AI 图像处理网站直达： FreePik 是国外知名的设计素材和图库网站，自 AI 生成式技术兴起后，FreePik 也紧跟潮流上线了 AI 专属版块 Pikaso，目前有图像生成、风格化、高清放大、背景扣除、外绘扩展等多项功能。我测试了它的抠图和外绘功能，处理速度很快，效果也非常不错，拓展后的图像可以与原图完美衔接。其 AI 功能每天都有 2-3 次的免费使用额度看，适合偶尔

8/11/2024 1:37:02 AM

夏花生

OpenAI 发布 GPT-4o 模型卡：概述 AI 安全和风险缓解措施

OpenAI 公司于 8 月 8 日发布报告，概述了 GPT-4o 模型的系统卡（System Card），介绍了包括外部红队（模拟敌人攻击）、准备框架（Preparedness Framework）在内的诸多细节。OpenAI 表示 GPT-4o 模型的核心就是准备框架（Preparedness Framework），这是一种评估和降低人工智能系统相关风险的系统方法。AI在线从报道中获悉，该框架主要用于识别网络安全、生物威胁、说服和模型自主性等领域的潜在危险。除了针对 GPT-4 和 GPT-4V 进行的安全评估

8/10/2024 11:54:54 AM

故渊

AI在用 | 我做的AI美甲，卖到了巴黎奥运会（附提示词）

机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例万万没想到，巴黎奥运会，火了美甲片。赛场内，不少奥运选手都晒出了 blingbling 的美甲。中国选手黄雅琼被求婚时顺带展示出来的：美国选手 Sha'Carri Richardson 在塞纳河畔亮出来的，略显夸张：还有摄像大哥「抓

8/9/2024 6:34:00 PM

机器之能

谷歌I/O开发者大会中国站：大模型技术进入全生态

本周三，谷歌在北京召开了中国开发者大会。除 5 月加州山景城的 I/O 大会之外，今年的 I/O Connect 环球之旅从德国柏林开始、到印度班加罗尔，也已来到中国北京。在这次活动中，来自多个不同领域的专家为国内开发者深入分享了谷歌在 AI、Web、移动端、云技术等领域的最新技术进展、开发工具和全球服务平台等内容。「中国是全球最大的开发者市场之一，我们的开发者一直是全球舞台上不可或缺的先锋力量，」谷歌大中华区总裁陈俊廷在开幕演讲中表示。「过去一年，来自中国的 25 个开发团队共有 31 款游戏和应用，在全球不同的

8/9/2024 5:37:00 PM

李泽南

奥特曼「草莓」模型跳票，OpenAI凌晨大新闻，把网友整懵了

GPT-5 大模型？不要太着急。昨晚，很多人彻夜未眠，都在等待 OpenAI 的「大新闻」。因为在本周三，OpenAI 创始人、CEO 山姆・奥特曼突然在 X 上发了一张照片。奥特曼虽然偶尔会发一些心灵鸡汤，但大多数的推文都是在宣传公司的产品，人们看法很快达成了一致——此中必有深意。有人展开解读：四个红草莓，其中还有一个未成熟的青色草莓，这不妥妥地是在说下一代 AI 大模型 GPT-5 要来了吗？奥特曼在回应网友时也在暗示，惊喜马上就来。这激起了人们的好奇心，预测 GPT-5 发布的时间从草莓成熟所需要的 4 到

8/9/2024 2:13:00 PM

机器之心

小米旗舰设备国际版将接入谷歌 Gemini 大模型，OPPO 此前已接入

感谢小米创办人雷军 8 月 7 日宣布，小米旗舰设备国际版将接入谷歌 AI 大模型 Google Gemini。小米目前已在国行机型中推出了自家的 AI 功能，7 月 30 日，小米小爱同学「大模型小爱」宣布全量升级，支持自然问答、图片编辑、车外唤醒防御等，覆盖核心品类设备。8 月 5 日，小米 14、Redmi K70 等机型推澎湃 OS 全 AI 功能，包括小爱输入助手、AI 写真、AI 搜图、实时字幕、端侧小爱同学文生图、端侧相册 AI 编辑等。AI在线查询获悉，2024 Google 开发者大会于 8 月

8/9/2024 1:16:23 PM

汪淼

手机跑大模型提速 4-5 倍：微软亚研院开源新技术 T-MAC，有 CPU 就行

有 CPU 就能跑大模型，性能甚至超过 NPU / GPU！没错，为了优化模型端侧部署，微软亚洲研究院提出了一种新技术 —— T-MAC。这项技术主打性价比，不仅能让端侧模型跑得更快，而且资源消耗量更少。咋做到的？？在 CPU 上高效部署低比特大语言模型一般来说，要想在手机、PC、树莓派等端侧设备上使用大语言模型，我们需要解决存储和计算问题。常见的方法是模型量化，即将模型的参数量化到较低的比特数，比如 4 比特、3 比特甚至更低，这样模型所需的存储空间和计算资源就会减少。不过这也意味着，在执行推理时，需要进行混合精

8/9/2024 12:58:46 PM

汪淼

OpenAI 任命卡内基梅隆大学教授 Zico Kolter 为新董事，加强 AI 安全管理

OpenAI 公司昨日（8 月 8 日）发布博文，宣布任命济科・科尔特（Zico Kolter）为 OpenAI 董事会成员。Zico Kolter 简介AI在线从报道中获悉，科尔特此前担任卡内基梅隆大学（Carnegie Mellon University）机器学习系的教授和主任，工作主要集中在人工智能的安全性、对齐和机器学习分类器的鲁棒性（robustness）方面。科尔特是卡内基梅隆大学计算机科学教授和机器学习系主任，他在该校担任要职已有 12 年之久。科尔特于 2010 年在斯坦福大学获得计算机科学博士学位

8/9/2024 11:28:50 AM

故渊

消息称马斯克 X 平台同意不使用部分欧盟用户数据来训练 AI

感谢路透社今天（8 月 9 日）报道，马斯克旗下的 X 平台同意不使用部分欧盟用户数据，来训练其 AI 聊天机器人。爱尔兰一家法院周四表示，社交媒体平台 X 同意在欧盟用户选择撤销同意之前，暂时不使用从他们那里收集的个人数据来训练其 AI 系统。爱尔兰数据保护委员会本周寻求一项命令，要求暂停或限制 X 公司，不得处理用户数据来开发、训练或改进其人工智能系统。AI在线曾于 7 月报道，X 用户发现他们已“自动选择”将其帖子以及与 xAI 旗下 Grok 聊天机器人的互动用于“训练和微调”xAI 系统，此举是在未事先获

8/9/2024 10:42:44 AM

故渊

OpenAI 6000 万美元领投网络摄像头公司 Opal；秘塔科技获超 1 亿元人民币融资，蚂蚁集团领投丨AI情报局

今日融资快报主打AI搜索，秘塔科技完成超 1 亿元人民币的新一轮融资，蚂蚁集团领投秘塔科技完成了超 1 亿元人民币的新一轮融资，由蚂蚁集团领投、光速光合跟投，本轮投后估值达 1.5 亿美元。秘塔之前的老股东有明势资本、猎豹移动和丰元资本等。据了解，百度、腾讯等大型科技公司也曾在这轮融资期间与秘塔接触，最终蚂蚁与秘塔达成交易。

8/9/2024 10:08:00 AM

我在思考中

OpenAI 宣布 DALL-E 3 模型向 ChatGPT 免费用户开放，但每天只能生成两张图片

北京时间今天凌晨，OpenAI 宣布 ChatGPT 免费用户可以每天使用其 DALL-E 3 模型生成图片。AI在线注：DALL-E 3 于去年 9 月推出，起初只面向 ChatGPT Plus 付费订阅用户提供。用户可以直接在 ChatGPT 的输入框中键入生成图片相关指令，但经过实测，这项功能每天只能免费生成两张图片，否则 ChatGPT 会提示“您已达到图片创建上限，升级至 ChatGPT Plus 或于明天 XX:XX 后重试”。▲ AI在线实测生成的图片，下同今年 4 月，OpenAI 宣布 DALL-

8/9/2024 7:08:27 AM

清源

ComfyUI 插件教程：帮你完全掌握 ComfyUI Impact 节点（二）

前言：学习 ComfyUI 是一场持久战，而 ComfyUI Impact 是一个庞大的模块节点库，内置许多非常实用且强大的功能节点，例如检测器、细节强化器、预览桥、通配符、Hook、图片发送器、图片接收器等等。通过这些节点的组合运用，我们可以实现的工作有很多，例如自动人脸检测和优化修复、区域增强、局部重绘、控制人群、发型设计、更换模特服饰等。在 ComfyUI 的进阶之路上，ComfyUI Impact 是每个人不可绕过的一条大河，所以本篇文章将带领大家理解并学会使用这些节点。祝大家学习顺利，早日成为 Com

8/9/2024 12:09:31 AM

AI实战

AI 搜索向左，搜索 OG 向右

作为 AI 世界的领头羊，OpenAI 发布的 SearchGPT 再次给 AI 搜索加了一把火。这把火原本由 Perplexity 引燃，在美国烧及 Google 和微软，在中国引发了百度、360 的追随，又带动一批创业者跟上，已然成为当下最时髦的热词。如果大模型之争能够被称为百模大战的话，那么 AI 搜索之争，就可以步其后尘，称之为“百搜大战”了。

8/8/2024 6:56:00 PM

晓楠

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 AI视频用哪个？6个知名的AI视频工具使用测评报告 OpenAI发布34页智能体实践指南：从网络搜索到代码编写 OpenAI发布GPT-4.1指令提示工程指南别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体 Midjourney图像编辑器迎来重大更新：全新UI、图层功能与智能工具上线

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达人形机器人 Transformer 百度 AI视频苹果深度学习模态 xAI 字节跳动驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成视觉科技亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练