AIGC宇宙 AIGC宇宙

文章列表

人机交互大迈步,OpenAI GPT-4o 演示视频引热议:AI 之间也能聊天

OpenAI 昨日凌晨发布 GPT-4o 模型,可以视为 GPT-4 的升级版本,可以实时推理处理音频、视觉和文本内容,而且能更加无缝地和 ChatGPT 交互。OpenAI 总裁兼联合创始人格雷格・布罗克曼(Greg Brockman)随后发布了上手演示,让两台运行 GPT-4o 的设备进行语音或视频交互。布罗克曼在演示开始之前,表达了自己的期望:让两台 AI 聊天机器人互相交流。布罗克曼向其中 A 聊天机器人讲述了他的期望,并让 B 聊天机器人可以调用摄像头观察周围世界。B 聊天机器人会调用前置摄像头,并清晰地
5/15/2024 6:04:08 AM
故渊

谷歌 Calendar、Tasks 和 Keep 等服务将集成 Gemini

谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布在 Google Calendar、Tasks 和 Keep 应用中整合 Gemini 模型,为用户带来更丰富的 AI 功能。谷歌在开发者大会上表示,Gemini 聊天机器人支持网页或者移动 App 中上传图片操作,IT之家附上谷歌官方例子如下,拍一张学校活动列表的照片,然后让 Gemini 把它们添加到你的个人 Google Calendar 中。谷歌提供的另一个例子是让 Gemini 将食谱中的项目添加到谷歌 Keep 购物清单中。Gemini 负责
5/15/2024 4:06:11 AM
故渊

谷歌 Workspace 办公套件整合 Gemini:可总结邮件内容、梳理会议要点等

谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布 Google Workspace 将进一步整合 Gemini,在侧面板中将推出基于 Gemini 1.5 Pro 的诸多技能。谷歌表示 Workspace 整合 Gemini 的作用,是为用户节省从多个应用程序中挖掘文件、电子邮件和其他数据的时间和精力。谷歌 Workspace 副总裁阿帕纳・帕普(Aparna Pappu)在会上说:“Gemini 时代的 Workspace 将开启完成工作的新方式”。IT之家注:谷歌 Workspace 的 Gmai
5/15/2024 3:45:19 AM
故渊

谷歌 Gemini 解锁旅行规划技能,几秒内帮你妥当安排行程

谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布为 Gemini 引入旅行规划功能,结合个人信息和公共出行信息,帮用户规划预订航班、酒店等等。谷歌表示 Gemini 可以基于用户的提示,挖掘航班时间和酒店预订等具体细节,在几秒钟内制定出合适的度假行程。谷歌副总裁兼 Gemini 总经理 Sissie Hsiao 表示,用户手动规划一次旅行可能需要数小时、数天甚至数周的时间,而 Gemini 几乎可以瞬间完成。Hsiao 表示 Gemini 的规划是动态的,用户可以根据后期提示和其它要求进一步调整规划。
5/15/2024 3:28:56 AM
故渊

你的助手你决定,谷歌推出 Gems 功能:由用户定制 Gemini 角色

谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布为 Gemini 推出名为“Gems”的个性化选项,可以让用户定制 Gemini 助手角色。Gems 功能可以让用户迭代的聊天机器人,在保留指定特征的情况下帮助你完成某些任务。Gems 感觉类似于 OpenAI 的 GPT Store,可以让你制作定制的 ChatGPT 聊天机器人。该功能也有点像在 Character.AI 中创建自己的机器人,Character.AI 可以让你与虚拟的流行人物和名人甚至假冒的心理医生交谈。谷歌表示,用户通过 Gems
5/15/2024 3:12:28 AM
故渊

谷歌 Gemini 家族添 Flash 新成员:平衡规模和能力、支持多模态,单次可分析 3 万行代码

谷歌公司今天扩充 Gemini 家族成员,推出了全新的 Gemini 1.5 Flash 模型,重点优化了该模型的速度和效率。谷歌 DeepMind 首席执行官德米斯・哈萨比斯(Demis Hassabis)在一篇博客文章中写道:Gemini 1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。哈萨比斯补充说,谷歌之所以创建 Gemini 1.5 Flash,是因为开发人员需要一个比谷歌今年 2 月发布的 Gemini 1.5 Pro 更轻便、更便宜的模型。IT之家注:Gemini
5/15/2024 1:47:17 AM
故渊

OpenAI 曾秘密测试 GPT-4o,力压群雄登顶聊天机器人竞技场排行榜

OpenAI 员工 William Fedus 周一在社交平台 X 证实,近期在 LMSYS 聊天机器人竞技场 (Chatbot Arena) 上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型 GPT-4o。Fedus 还透露,GPT-4o 在测试中登顶了竞技场排行榜,取得了有史以来的最高分。“GPT-4o 是我们最先进的尖端模型,”Fedus 在推特上写道,“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”聊天机器
5/14/2024 6:24:44 PM
远洋

AI 聊天机器人大战升温:谷歌 Gemini 预告片展示惊艳语音视频交互能力

人工智能聊天机器人领域烽烟再起,谷歌和 OpenAI 之间激烈的竞争态势愈演愈烈。就在谷歌一年一度的 I / O 开发者大会召开前夕,这家科技巨头发布了一段视频,展示了疑似经过升级的 Gemini 聊天机器人。视频中,Gemini 可以同时实时处理来自视频和语音的输入。这段视频貌似是在 I / O 大会搭建现场拍摄的,视频展示了 Gemini 在一台 Pixel 手机上流畅地处理实时视频和语音提问,并准确地提供信息。当被问到正在进行的布置工作时,Gemini 正确识别出这是为一个重要活动做的准备。 整个对话过程自然
5/14/2024 6:06:23 PM
远洋

OpenAI 解释为何率先推出 Mac 版 ChatGPT 应用:用户更多

OpenAI 今日凌晨举办线上活动,发布了 ChatGPT 的一系列更新,其中包括升级版大型语言模型 GPT-4o,该模型具备增强的实时语音功能和更快的运行速度。图源:OpenAI众所周知,OpenAI 与微软关系密切,后者向其投资了超过 100 亿美元(IT之家备注:当前约 724 亿元人民币),并已经在自家的 Copilot 服务中使用 OpenAI 的技术。然而在本次活动上,OpenAI 率先发布了 macOS 版 ChatGPT 应用,Windows 版本今年晚些时候才会推出。对此,OpenAI 技术总监
5/14/2024 5:40:15 PM
远洋

GPT-4o 模型登陆微软 Azure OpenAI 服务,性能更强价格更低

OpenAI 于今日凌晨发布了其最新的旗舰人工智能模型 GPT-4o。相比先前版本,GPT-4o 实现了诸多升级:速度提升一倍,价格降低 50%(百万 token 的处理成本降至 7 美元),并且支持每分钟处理高达千万 token 的数据量。该模型拥有 128K 的上下文记忆能力,知识截止时间为 2023 年 10 月。微软宣布,已通过 Azure OpenAI 服务提供 GPT-4o 的预览版本。与以往的模型不同,GPT-4o 能够无缝处理文本、图像和音频信息,为用户带来更加丰富、沉浸的交互体验。不过IT之家注意
5/14/2024 4:49:00 PM
远洋

免费GPT-4o来袭,音频视觉文本实现「大一统」

作者 | 赖文昕今天凌晨,即北京时间5月14日1点整,OpenAI 召开了首场春季发布会,CTO Mira Murati 在台上和团队用短短不到30分钟的时间,揭开了最新旗舰模型 GPT-4o 的神秘面纱,以及基于 GPT-4o 的 ChatGPT,均为免费使用。 此前,有传言称 OpenAI 将推出 AI 搜索引擎,旨在与谷歌明天举办的 I/O 开发者大会一较高下,一度引发了公众的热烈讨论。 不过 Sam Altman 随后在 X(原推特)上表示,要展示的并非 GPT-5 或搜索引擎,而是一些令人期待的创新成果,他本人对此充满期待,认为其像魔法一样神奇。
5/14/2024 3:49:00 PM
赖文昕

OpenAI颠覆世界:GPT-4o完全免费,实时语音视频交互震撼全场,直接进入科幻时代

ChatGPT 问世才 17 个月,OpenAI 就拿出了科幻电影里的超级 AI,而且完全免费,人人可用。太震撼了!当各家科技公司还在追赶大模型多模态能力,把总结文本、P 图等功能放进手机里的时候,遥遥领先的 OpenAI 直接开了大招,发布的产品连自家 CEO 奥特曼都惊叹:就像电影里一样。5 月 14 日凌晨,OpenAI 在首次「春季新品发布会」上搬出了新一代旗舰生成模型 GPT-4o、桌面 App,并展示了一系列新能力。这一次,技术颠覆了产品形态,OpenAI 用行动给全世界的科技公司上了一课。今天的主持人
5/14/2024 7:32:00 AM
机器之心

OpenAI 推出 Mac 版 ChatGPT 应用,今年晚些时候推出 Windows 版

OpenAI  终于推出了 ChatGPT 桌面版应用程序,该公司在官方公告中表示:“从今天开始,我们将首先向 Plus 用户推出 macOS 应用,并在未来几周内向更广泛的用户开放。我们还计划在今年晚些时候推出 Windows 版本。”OpenAI 还称,ChatGPT 还将拥有经过优化的用户界面。OpenAI 的演示显示,用户可以将处于最小化窗口的 ChatGPT 桌面应用与其他程序并排打开。用户可以通过输入或语音的方式向 ChatGPT 提问屏幕上显示的内容,ChatGPT 则能根据其“所见” 进行回答。Op
5/14/2024 1:48:54 AM
远洋

实现纹理素材自由!8 组纹理材质类 Midjourney 关键词

大家好,这里是和你们一起探索 AI 的花生~ 纹理材质是设计中非常重要的一类素材,可以提升画面质感、丰富视觉层次。之前为大家推荐过一些免费的纹理素材下载网站,如今有了 AI 绘画工具,我们可以按自己的需要用文字定制任何需要的纹理,非常灵活方便。今天就为大家总结 8 类常用的纹理材质类 Midjourney 提示词,包括纸张、金属、岩石、木头、流体等,一起来看看吧~ 相关推荐:一、纸张 ① seamless plain white watercolor paper texture, rough paper --til
5/14/2024 1:48:27 AM
夏花生

OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o:语音对话更流畅,免费提供

感谢OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o,该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。最让人惊喜的是,GPT-4o 将免费提供给所有用户使用。综合 TechCrunch 等外媒报道,OpenAI 首席技术官穆里・穆拉蒂 (Muri Murati) 表示,GPT-4o 将提供与 GPT-4 同等水平的智能,但在文本、图像以及语音处理方面均取得了进一步提升。“GPT-4o 可以综合利用语音、文本和视觉信息进行推理,”穆拉蒂在 OpenAI 公司总部举行的主题演讲中表示。G
5/14/2024 1:25:13 AM
远洋

AI绘画保姆级教程!如何用 ComfyUI 快速生成黏土风?

这个五一小长假,一款 Remini 的人工智能修图软件火了,一夜之间,大家都变成了粘土人。你喜欢粘土风格吗?这篇文章带你了解了解~一、前言 最近你是不是也被各个平台爆火的丑萌丑萌的粘土人照片视频刷屏了?这个五一小长假,一款 Remini 的人工智能修图软件火了,一夜之间,大家都变成了粘土人。很多人的第一反应是:太丑了!添加滤镜后的照片不仅丑萌丑萌,甚至还有点“呆傻”。还有网友评价:每一张都丑得很意外。真的很丑萌吗?我们一起瞧瞧!虽然丑出天际、丑到无语,甚至五官乱飞,但很多人一上手根本停不下来。有网友说,一玩玩到了凌
5/14/2024 12:14:02 AM
设计师学Ai(有课)

李开复:中国需要自己的 ChatGPT,当下国内 AI 工具“都还不够好”

彭博社今日刊登了对李开复的专访,李开复认为中国需要自己的 ChatGPT,以加快人们对人工智能的兴趣、采用和投资。李开复谈到了“ChatGPT 时刻”—— 对于美国人来说,“ChatGPT 时刻”发生在 17 个月之前(IT之家注:2022 年 12 月,聊天机器人 ChatGPT 开始大火)。但他认为,中国用户还没有迎来“ChatGPT 时刻”,直到现在,国内的聊天机器人或工具“都还不够好”。李开复披露了自家 AI 公司零一万物的近况:已经接近盈利。在对国内外的数据集进行模型训练之后,李开复正在将自家的模型和应用
5/13/2024 3:31:24 PM
清源

美国教授用 2 岁女儿训 AI 模型登 Science,人类幼崽头戴相机训练全新 AI

【新智元导读】为训练 AI 模型,纽约州立大学的一名教授 Brenden Lake,竟让自己不到 2 岁女儿头戴相机收集数据!要知道,Meta 训 Llama 3 直接用了 15 万亿个 token,如果 Lake 真能让 AI 模型学习人类幼崽,从有限的输入中学习,那 LLM 的全球数据荒岂不是解决了?为了训练 AI 模型,一位纽约州立大学的教授,竟然把类似 GoPro 的相机绑在了自己女儿头上!虽然听起来不可思议,但这位教授的行为,其实是有据可循的。要训练出 LLM 背后的复杂神经网络,需要海量数据。目前我们训
5/13/2024 2:51:41 PM
清源