用户
继 ChatGPT 后,Anthropic 旗下 Claude AI 推出桌面平台客户端
继 ChatGPT 后,目前又有一款海外流行的人工智能 Claude AI 获得了桌面版客户端,目前相关客户端处于测试状态,支持 Windows / macOS / iOS 平台。 开发商 Anthropic 在 X 平台官宣了这一消息,同时透露用户可以使用热键快速唤起客户端界面,不过 Claude AI 客户端定位 AI 搜索引擎,与 OpenAI 的 ChatGPT 客户端聊天有所差异。 参考应用详情页,这一 AI 客户端主打语音搜索,不过用户也可以令其写作文章邮件、解决数学问题、判断语法错误、分析文档内容等。
OpenAI 正面对抗谷歌、Perplexity,ChatGPT 搜索功能今日上线
感谢北京时间今日凌晨,OpenAI 宣布在其大模型产品 ChatGPT 中新增了搜索功能,正式进军由 Alphabet 旗下 Google 长期主导的搜索领域,同时也与微软的必应和新兴搜索型 AI 聊天机器人服务 Perplexity 形成竞争。 OpenAI 表示,ChatGPT 搜索功能会根据用户的需求自动决定是否检索网络,能够快速提供最新信息,并附上相关的网页链接。 官方博客表示,ChatGPT 搜索功能利用第三方搜索供应商的技术,并整合合作伙伴直接提供的内容,来满足用户的信息需求。
OpenAI ChatGPT 高级语音模式已登陆 Windows 和 Mac 平台,对话更自然
OpenAI 今日宣布,ChatGPT 的高级语音模式(Advanced Voice Mode,简称 AVM)现已登陆 Windows 和 Mac 平台。 AVM 基于 OpenAI 最先进的 GPT-4o 模型运行,允许用户像与真人对话一样与 ChatGPT 进行交流,包括打断、停顿等自然语言行为。 OpenAI 表示,AVM 提供了更自然、实时的对话体验,能够实时感知和回应用户的情绪。
可令 AI 助理同时进行快 / 慢速思考,谷歌 DeepMind 公布具备两种思维模式的 Talker-Reasoner 框架
谷歌 DeepMind 上周公布了一个号称“具备两种思维模式”的 Talker-Reasoner 框架,旨在让 AI 助理能够同时进行快速和慢速思考,目前相关论文已发布于 ArXiv 上(点此访问)。 据介绍,这款框架采用“双系统”设计,能够在与用户进行对话的同时并行多步骤推理任务(一边快速回答用户问题,一边高速思考),其中系统 1 Talker LLM 主要负责快速、直觉和合成的语言回应,用于与用户交谈。 而系统 2 Reasoner LLM 则负责解决复杂问题,涉及从外界获取信息以增强知识,例如调用工具或从外部数据库检索信息,从而提升系统 1 回应内容的准确度及逻辑性。
OpenAI 推出 Windows 版 ChatGPT 客户端:支持热键调用、暂仅限付费用户测试
感谢继苹果 macOS 版后,OpenAI 目前已为微软 Windows 用户推出 ChatGPT 应用桌面客户端,目前这款应用正进行测试,订阅了 ChatGPT Plus / Enterprise / Team / Edu 版本的付费用户可以在微软应用商店中下载使用应用。这款应用本质上是网页版 ChatGPT 套上了外壳,用户可以在窗口中询问 AI 各种功能、上传各种照片文档、访问 OpenAI o1 模型,同时支持通过“Alt 空格”热键快速调出应用,不过AI在线注意到目前“高级语音模式”功能暂时缺席。▲ 图源 OpenAIOpenAI 表示,这款应用将在测试完成后向所有用户开放,预计今年晚些时候完成测试。
Siri 将更聪明:苹果加速整合 ChatGPT,正推进生成文本 / 图像技能
科技媒体 MacRumors 昨日(10 月 17 日)发布博文,报道称苹果正在全力以赴为 iOS 18、iPadOS 18 和 macOS 15 添加全新的 Apple Intelligence 特性,最新发现的后端代码显示苹果公司正努力在 Siri 中整合 ChatGPT。根据最新发现的 Siri 后端代码,提到了调用 ChatGPT 生成文本和图像两个选项,意味着苹果公司即将部署这两项生成功能。ChatGPT 具备卓越的生成文本和图像能力,超越苹果现有的写作工具和文生图 Image Playground 功能,因此可以为用户提供更高级的内容创建能力。
OpenAI 推出全新写作、编码工具 ChatGPT Canvas,将免费开放
感谢OpenAI 今日宣布推出全新写作、编码工具 Canvas,这是一个与 ChatGPT 合作编写和编码项目的新界面,超越了简单的聊天。AI在线从官方介绍获悉,ChatGPT Canvas 可以更好地了解任务的上下文,用户可以突出显示特定部分,以准确表明希望 ChatGPT 关注的内容。用户也可以直接编辑文本或代码,要求 ChatGPT 调整写入长度、调试代码并快速执行其他操作,并且提供后退按钮来恢复作品的先前版本。写作功能包括:建议编辑:ChatGPT 提供建议和反馈。调整文章长度:将文档长度编辑为更短或更长。
安卓版谷歌 Gemini Live 上线,助力 AI 开启全民语音聊天时代
谷歌公司昨日(10 月 1 日)在 X 平台发布推文,宣布通过 Gemini 应用,现面向所有安卓用户开放 Gemini Live 功能。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式,采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。需要注意的是,目前仅
Snapchat 聊天机器人 My AI 将整合谷歌 Gemini 模型
谷歌 Google Cloud 公司本周二宣布和 Snap 公司合作,在 Snapchat 的 AI 聊天机器人 My AI 中整合 Gemini,为用户带来更强的 AI 聊天体验。AI在线援引新闻稿内容,Snapchat 将使用谷歌 Gemini 聊天机器人的强大多模态功能,理解文本、音频、图像、视频和代码在内的多种输入类型,并理解回答用户的提问。谷歌表示本次合作,为 Snapchat 用户带来了更多创新功能。Snap 首席执行官埃文・斯皮格尔(Evan Spiegel)评论表示:与 Google Cloud 的
OpenAI ChatGPT AI 聊天机器人新增“/picture”和“/search”指令
OpenAI 扩充 ChatGPT 系统快捷指令,新增“/picture”和“/search”,进一步改善用户的交互体验。AI在线附上操作方法如下:在与 ChatGPT 对话时,只需输入一个“/”(不含双引号),一个便捷的弹出窗口就会显示这些快捷选项。“/picture”该指令会调用 OpenAI 的文生图模型 DALL-E,即使用户没有具体的提示或想法,只需选择 / picture,也能为你生成有趣的图像。“/search”该指令会进入一个新的搜索模式,你输入的任何内容都会被视为搜索查询。即便用户没有输入任何内容
安卓版谷歌 Gemini Live 免费上线,开启在线 AI 语音畅聊
科技媒体 9to5Google 昨日(9 月 12 日)发布博文,报道谷歌在 1 个月前面向 Advanced 订阅用户推出后,正逐步面向所有安卓用户免费开放 Gemini Live。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎
文生图 AI Midjourney 雄心:7.0 版未来 1-2 月登场、开发新图像编辑器、探索 3D 系统、踏足硬件领域
科技媒体 The Decoder 昨日(9 月 12 日)发布博文,报道称在最近的“Office Hours”活动中,Midjourney 创始人兼首席执行官 David Holz 在 Discord 分享了当前项目的最新进展,并回答了社区的提问。Midjourney 7.0 版本Holz 更新了 Midjourney 7.0 版本时间表,表示将会在未来 1-2 月内发布。让更多人体验 MidjourneyHolz 表示公司并不急于推出新的 AI 模型,而是提高现有技术的易用性,让工具深入融入到专业人士的日常工作中
安卓和 iOS 版谷歌 Gemini AI 应用新增 Gems 及管理器
科技媒体 testingcatalog 昨日(9 月 12 日)发布博文,报道称 iOS 和安卓版 Gemini 应用新增支持 Gem 和 Gem 管理器。用户现可在主屏幕上查看常规聊天及与 Gems 相关的聊天,此外用户可进入 Gem 管理器,界面采用标签式布局,首屏展示所有 Gems,分为用户自定义 Gems 和谷歌预制的 Gems 两部分。用户如果要编辑或创建新 Gems,用户会被引导打开网页版,该网页版会在同一应用内的网页视图中打开。Gemini 简介AI在线附上官方介绍如下:Gemini 应用是一款实验性
谷歌打磨 Gemini AI 技能:扩充支持文件类型、提高文档洞察力
谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持更多类型的文件,通过分析、摘录、洞察文档内容,为用户提供更优质的 AI 服务。谷歌表示拥有 Gemini Business、Enterprise、Education 或 Education Premium 许可证的 Google Workspace 用户,现在可从 Google Drive 或本地设备上传各种文件到 Gemini(gemini.google.com):电子表格:Gemini AI 现在可以处理 CSV、XLSX 和 ODS 等格式的
安卓 / macOS 版 ChatGPT AI 应用现支持“@”,可无缝切换不同 GPT 模型
科技媒体 testingcatalog 昨日(8 月 28 日)发布博文,报道称安卓版和 macOS 版 ChatGPT 现支持 Mentions 功能,用户在聊天对话中使用“@”字符来调用不同的定制 GPT 模型。在安卓版 ChatGPT 应用中,用户输入“@”符号之后,会弹出一个窗口,让用户选择不同的 GPT,在保持聊天上下文的时候方便用户无缝切换。苹果 macOS 平台最新版 ChatGPT 也已上线该功能,但目前 iOS 平台 ChatGPT 仍未上线。AI在线注:Mentions 是 ChatGPT 的一
Ideogram 倒逼 Midjourney“拔剑”,开放网页版后再向免费用户开放 AI 文生图提示词描述工具
科技媒体 testingcatalog 昨日(8 月 23 日)发布博文,或许是 Midjourney 感受到来自 Ideogram 最新模型的压力,在昨日开放网页版,并附赠 25 张文生图试用额度之外,还向免费用户推出了“Tools with the Lab”工具。AI在线注:该功能此前已经向购买 Pro 专业版订阅的用户开放,现在向免费用户也开放体验,用户点击后会进入“Describe”页面。用户可以上传任意照片,然后该工具就会提供 4 种不同的描述,之后用户可以将其作为提示词,通过 Midjourney 创建
文生图 AI 工具 Midjourney 开放网页版,新用户附赠 25 张免费试用额度
感谢Midjourney 官方账号在 X 平台发布推文,宣布向所有用户开放网页界面,并重新推出免费试用图像生成功能。Midjourney 此前因其文生图 AI 工具被滥用而暂停免费使用,现在重新向用户开放。科技媒体 The Decoder 认为 Midjourney 此举可能是针对最新上线的 Ideogram 2.0 工具。AI在线附上官方宣传视频如下: 用户无需使用 Discord 即可注册网页版并在网页版中生成图片,Midjourney 还准备了一些常见的提示词帮助以及图片示例,用户可以根据浏览其他用户生成的图
谷歌发布 Gemini Live:支持 AI 语音聊天,可模拟面试场景、推荐演讲技巧
谷歌在今天召开的 Pixel 9 系列手机发布会上,发布了 Gemini Live 服务,将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。 推动自然、流畅的对话交流谷歌表示 Gemini Live 提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。谷歌表示用