模型
OpenAI 曾秘密测试 GPT-4o,力压群雄登顶聊天机器人竞技场排行榜
OpenAI 员工 William Fedus 周一在社交平台 X 证实,近期在 LMSYS 聊天机器人竞技场 (Chatbot Arena) 上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型 GPT-4o。Fedus 还透露,GPT-4o 在测试中登顶了竞技场排行榜,取得了有史以来的最高分。“GPT-4o 是我们最先进的尖端模型,”Fedus 在推特上写道,“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”聊天机器
GPT-4o 模型登陆微软 Azure OpenAI 服务,性能更强价格更低
OpenAI 于今日凌晨发布了其最新的旗舰人工智能模型 GPT-4o。相比先前版本,GPT-4o 实现了诸多升级:速度提升一倍,价格降低 50%(百万 token 的处理成本降至 7 美元),并且支持每分钟处理高达千万 token 的数据量。该模型拥有 128K 的上下文记忆能力,知识截止时间为 2023 年 10 月。微软宣布,已通过 Azure OpenAI 服务提供 GPT-4o 的预览版本。与以往的模型不同,GPT-4o 能够无缝处理文本、图像和音频信息,为用户带来更加丰富、沉浸的交互体验。不过IT之家注意
OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o:语音对话更流畅,免费提供
感谢OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o,该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。最让人惊喜的是,GPT-4o 将免费提供给所有用户使用。综合 TechCrunch 等外媒报道,OpenAI 首席技术官穆里・穆拉蒂 (Muri Murati) 表示,GPT-4o 将提供与 GPT-4 同等水平的智能,但在文本、图像以及语音处理方面均取得了进一步提升。“GPT-4o 可以综合利用语音、文本和视觉信息进行推理,”穆拉蒂在 OpenAI 公司总部举行的主题演讲中表示。G
李开复:中国需要自己的 ChatGPT,当下国内 AI 工具“都还不够好”
彭博社今日刊登了对李开复的专访,李开复认为中国需要自己的 ChatGPT,以加快人们对人工智能的兴趣、采用和投资。李开复谈到了“ChatGPT 时刻”—— 对于美国人来说,“ChatGPT 时刻”发生在 17 个月之前(IT之家注:2022 年 12 月,聊天机器人 ChatGPT 开始大火)。但他认为,中国用户还没有迎来“ChatGPT 时刻”,直到现在,国内的聊天机器人或工具“都还不够好”。李开复披露了自家 AI 公司零一万物的近况:已经接近盈利。在对国内外的数据集进行模型训练之后,李开复正在将自家的模型和应用
美国教授用 2 岁女儿训 AI 模型登 Science,人类幼崽头戴相机训练全新 AI
【新智元导读】为训练 AI 模型,纽约州立大学的一名教授 Brenden Lake,竟让自己不到 2 岁女儿头戴相机收集数据!要知道,Meta 训 Llama 3 直接用了 15 万亿个 token,如果 Lake 真能让 AI 模型学习人类幼崽,从有限的输入中学习,那 LLM 的全球数据荒岂不是解决了?为了训练 AI 模型,一位纽约州立大学的教授,竟然把类似 GoPro 的相机绑在了自己女儿头上!虽然听起来不可思议,但这位教授的行为,其实是有据可循的。要训练出 LLM 背后的复杂神经网络,需要海量数据。目前我们训
消息称 OpenAI 将推出多模态人工智能数字助理:可语音对话、识别物体
据 The Information 报道,OpenAI 最近向部分客户展示了一款新型多模态人工智能模型,该模型能够进行语音对话和物体识别。有消息人士透露,这或许就是 OpenAI 计划在即将到来的 5 月 13 日正式发布的内容之一。图源 Pexels报道称,相比于 OpenAI 现有的独立图像识别和文本转语音模型,该新型模型能够更快、更准确地处理图像和音频信息。例如,它可以帮助客服人员“更好地理解来电者的语气语调,判断他们是否在使用讽刺语气”。理论上,该模型还能辅助学生学习数学知识,或翻译现实世界中的标志文字。不
在富岳超算上训练大模型,日本联合研究团队发布 Fugaku-LLM
由多方企业和机构组成的日本联合研究团队昨日发布了 Fugaku-LLM 大模型。该模型的最大特色就是其是在 Arm 架构超算“富岳”上训练的。Fugaku-LLM 模型的开发于 2023 年 5 月启动,初期参与方包括富岳超算所有者富士通、东京工业大学、日本东北大学和日本理化学研究所(理研)。而在 2023 年 8 月,另外三家合作方 —— 名古屋大学、CyberAgent(也是游戏企业 Cygames 的母公司)和 HPC-AI 领域创企 Kotoba Technologies 也加入了该模型研发计划。▲ 富岳超
程序员问答平台 Stack Overflow 宣布与 OpenAI 建立 API 合作伙伴关系
感谢程序员问答平台 Stack Overflow 与 OpenAI 今天宣布建立新的 API 合作伙伴关系。OpenAI 和 Stack Overflow 将通过 OverflowAPI 为 OpenAI 用户提供所需的准确、经过审核的数据基础,以便 AI 工具快速找到问题解决方案,令技术人员能够专注于高优先级的任务;OpenAI 还将在 ChatGPT 中直接显示来自 Stack Overflow 的经过验证的技术知识和代码。作为合作的一部分:OpenAI 将使用 Stack Overflow 的 Overflo
Chrome 浏览器桌面版地址栏整合自家聊天机器人:@Gemini 即可召唤
谷歌 Chrome 浏览器今日早些时候在 X(推特)宣布,其桌面版地址栏现已整合 Gemini 聊天机器人,用户可以通过简单、便捷的方式将 Gemini 召唤出来:在地址栏中输入“@”,然后选择“与 Gemini 聊天”,输入自定的提示词即可获取 Gemini 的回复。不久之前,该功能仍在 Canary 版本中进行测试。经IT之家此次实测,当 Chrome 更新至 124.0.6367.119(正式版本)之后,即可体验。Gemini 是谷歌 Deepmind 最新、最强大的 AI 模型。它原生支持多模态,具备跨模态
苹果发布 OpenELM,基于开源训练和推理框架的高效语言模型
在 WWDC24 之前,苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”,名为 OpenELM。当然,这是一项开源语言模型,其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下:大型语言模型的可重复性和透明性对于推进开放研究、确保结果的可信度以及调查数据和模型偏差以及潜在风险至关重要。为此,我们发布了 OpenELM,一个最先进的开源语言模型。OpenELM 使用分层缩放策略,可以有效地分配 Transformer 模型每一层的参数
13 项测试仅通过 4 项,Meta 的 Llama 2 LLM 被指安全性低:幻觉率 48%
AI 安全公司 DeepKeep 近日发布评估报告,在 13 个风险评估类别中,Meta 公司的 Llama 2 大语言模型仅通过 4 项测试。报告称 70 亿参数的 Llama 2 7B 模型幻觉(回答内容存在虚假,或者有误导性内容)最为严重,幻觉率高达 48%。DeepKeep 表示:“结果表明,模型有明显的幻觉倾向,提供正确答案或编造回答的可能性对半开,而幻觉率最高,那么向用户传递的错误信息越多”。除了幻觉问题之外,Llama 2 大语言模型还存在注入和操纵等问题。根据测试结果,80% 的场景下通过“提示注入
Chrome 浏览器桌面版地址栏即将整合聊天机器人 Gemini
感谢桌面 Chrome 浏览器地址栏即将添加 Gemini 快捷方式,用户在 Gemini 网页上登录账户后,用户只需输入 @gemini 即可快速与谷歌的人工智能聊天机器人 Gemini 开始聊天。该功能目前正在 Chrome 浏览器 Canary 测试版中进行测试,地址栏下拉菜单底部会出现提醒,“输入 @gemini 与 Gemini 聊天”。目前该功能仅适用于 Chrome 浏览器 Canary 125 版本,需要启用两个标志(Flags)才能开启,IT之家汇总如下:chrome://flags/#omnib
从AIGC到AGI,为什么我们需要更多的“技术信仰派”?
整理 | 伊风采访 | 张晓楠嘉宾 | 巴川、朱雷、肖然作为AIGC应用落地元年,2024开年就抛给我们一些不太好回答的问题:在以探索AGI为长期目标时,我们该坚守技术信仰吗?除了复制国外GPT-4、Sora这样的成功案例,我们该如何寻求更大发展和突破?即便算力问题得以解决,算法的难题如何跨越?国内企业为什么大都部署多个大模型?为什么并非所有企业都该拥抱AIGC?前不久51CTO全新直播栏目《AIGC实战派》有幸邀请到竞技世界首席数据科学家巴川,元语智能联合创始人兼COO、SuperCLUE社区发起人朱雷以及Tho
融合 ChatGPT+DALL・E 3,贾佳亚团队新作开源畅玩:识图推理生图一站解决
在开源社区中把 GPT-4 Dall・E 3 能⼒整合起来的模型该有多强?香港中文大学终身教授贾佳亚团队提出多模态模型 Mini-Gemini:更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力,还能结合图像推理和生成,堪称王炸。Mini-Gemini 还提供了 2B 小杯到 34B 的超大杯,最强模型在多个指标上相比谷歌的 Gemini Pro 甚至 GPT-4V 都不遑多让。目前,Mini-Gemini 从代码、模型到数据已全部开源,登上了 PaperWithCode 热榜。Mini-Gemini
OpenAI 在东京开设亚洲首个办事处,将发布日语优化型 GPT-4 模型
感谢OpenAI 今日通过官方博客页面宣布,公司在亚洲的首个办事处落户日本东京,将业务扩展到亚洲。OpenAI 表示将致力于与当地政府、企业和研究机构合作,开发安全的人工智能工具,满足当地的独特需求。OpenAI 还将发布针对日语进行优化的 GPT-4 定制模型。与 GPT-4 Turbo 相比,它在日文文本方面的性能有所提高,运行速度最多可提高三倍。与此同时,该模型提高了翻译和总结日语文本的性能和成本效益。在当地最常用的英语学习 App“Speak”即采用了 OpenAI 提供的技术,在用户练习出错时讲解的速度提
Arm CEO 示警:美国未来 20%-25% 的电量将被 AI 数据中心消耗
感谢当地时间周二,Arm 公司 CEO 雷内・哈斯(Rene Haas)发出了严厉的警告,他表示人工智能收集的信息越多,他们就越聪明,但他们收集的信息越多,需要的力量就越大。包括 OpenAI 的 ChatGPT 在内的 AI 模型需要大量电力,这可能导致到 2030 年,AI 数据中心将消耗美国 20% 至 25% 的电力需求,相比今天的 4% 大幅增加。他特别强调,类似 ChatGPT 这样的大语言模型耗电非常严重,这些模型需要“永不满足”的电力才能有效运行。据IT之家此前报道,ChatGPT 每天需要处理超过
对标 GPT-4,消息称 Meta 最快下周发布两款 Llama 3 模型
感谢科技媒体 theinformation 近日发布博文,表示 Meta 公司将于下周预告两款 Llama 3 AI 模型,为今年夏季推出“完整形态” Llama 3 铺垫。Meta 公司本周二在伦敦举办的一场活动中,确认会在下个月之前发布 Llama 3 相关模型。IT之家翻译 Meta 公司全球事务总裁尼克・克莱格(Nick Clegg)采访内容如下:我希望下个月或者更短时间内,能够推出下一代 Llama 3。我们计划今年推出一系列具有不同功能、不同通用性的模型。Meta 首席产品官 Chris Cox 补充说
融合视觉能力,OpenAI 向开发人员提供 GPT-4 Turbo with Vision
感谢OpenAI 宣布,具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍提供。据IT之家了解,该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库,最大的革新之处在于其新增的视觉理解能力。在过去,开发者需要调用不同的模型来处理文本和图像信息,而 GPT-4 Turbo with Vision 则将两者合二为一,极大简化了开发流程,并带来了广泛的应