大模型
你的助手你决定,谷歌推出 Gems 功能:由用户定制 Gemini 角色
谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布为 Gemini 推出名为“Gems”的个性化选项,可以让用户定制 Gemini 助手角色。Gems 功能可以让用户迭代的聊天机器人,在保留指定特征的情况下帮助你完成某些任务。Gems 感觉类似于 OpenAI 的 GPT Store,可以让你制作定制的 ChatGPT 聊天机器人。该功能也有点像在 Character.AI 中创建自己的机器人,Character.AI 可以让你与虚拟的流行人物和名人甚至假冒的心理医生交谈。谷歌表示,用户通过 Gems
谷歌 Gemini 家族添 Flash 新成员:平衡规模和能力、支持多模态,单次可分析 3 万行代码
谷歌公司今天扩充 Gemini 家族成员,推出了全新的 Gemini 1.5 Flash 模型,重点优化了该模型的速度和效率。谷歌 DeepMind 首席执行官德米斯・哈萨比斯(Demis Hassabis)在一篇博客文章中写道:Gemini 1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。哈萨比斯补充说,谷歌之所以创建 Gemini 1.5 Flash,是因为开发人员需要一个比谷歌今年 2 月发布的 Gemini 1.5 Pro 更轻便、更便宜的模型。IT之家注:Gemini
AI 聊天机器人大战升温:谷歌 Gemini 预告片展示惊艳语音视频交互能力
人工智能聊天机器人领域烽烟再起,谷歌和 OpenAI 之间激烈的竞争态势愈演愈烈。就在谷歌一年一度的 I / O 开发者大会召开前夕,这家科技巨头发布了一段视频,展示了疑似经过升级的 Gemini 聊天机器人。视频中,Gemini 可以同时实时处理来自视频和语音的输入。这段视频貌似是在 I / O 大会搭建现场拍摄的,视频展示了 Gemini 在一台 Pixel 手机上流畅地处理实时视频和语音提问,并准确地提供信息。当被问到正在进行的布置工作时,Gemini 正确识别出这是为一个重要活动做的准备。 整个对话过程自然
美国教授用 2 岁女儿训 AI 模型登 Science,人类幼崽头戴相机训练全新 AI
【新智元导读】为训练 AI 模型,纽约州立大学的一名教授 Brenden Lake,竟让自己不到 2 岁女儿头戴相机收集数据!要知道,Meta 训 Llama 3 直接用了 15 万亿个 token,如果 Lake 真能让 AI 模型学习人类幼崽,从有限的输入中学习,那 LLM 的全球数据荒岂不是解决了?为了训练 AI 模型,一位纽约州立大学的教授,竟然把类似 GoPro 的相机绑在了自己女儿头上!虽然听起来不可思议,但这位教授的行为,其实是有据可循的。要训练出 LLM 背后的复杂神经网络,需要海量数据。目前我们训
在 ICLR 2024,看见中国大模型的力量
作者 | 赖文昕编辑 | 陈彩娴近日(5.7-5.11),第十二届国际学习表征会议(ICLR)在奥地利维也纳的展览会议中心召开。 ICLR 2024 的论文终审工作自 1 月份启动以来,共收到了7262篇提交论文,相较于上一年度的 4966 篇,增幅达到了 46.1%,接近翻了一番。 在严格的评审过程中,大会最终接受了 2260 篇论文,整体接收率维持在 31%,与去年的31.8%基本持平,其中 Spotlights 和 Oral 两种类型的论文展示分别有 367 篇(占5%)和 86 篇(占1.2%)论文获选。
iPhone AI 大升级:消息称苹果即将与 OpenAI 达成协议,iOS 18 用上 ChatGPT
感谢彭博社记者马克・古尔曼(Mark Gurman)今日发文表示,苹果即将与 OpenAI 达成协议,为今年的新 iOS 系统提供一些生成式 AI 功能(如聊天机器人)。此外,苹果与谷歌就整合 Gemini 的谈判正在进行中,但尚未达成任何协议。知情人士称,双方一直在敲定苹果下一代 iPhone 操作系统 iOS 18 中使用 ChatGPT 功能的协议条款。由于情况保密,该人士要求匿名。苹果还与谷歌就授权后者的 Gemini 聊天机器人进行了谈判。这些讨论尚未达成协议,但仍在进行中。OpenAI 宣布将于太平洋时
【论文解读】System 2 Attention提高大语言模型客观性和事实性
一、简要介绍 本文简要介绍了论文“System 2 Attention (is something you might need too) ”的相关工作。基于transformer的大语言模型(LLM)中的软注意很容易将上下文中的不相关信息合并到其潜在的表征中,这将对下一token的生成产生不利影响。为了帮助纠正这些问题,论文引入了System 2 Attention(S2A),它利用LLM的能力,用自然语言进行推理,并遵循指示,以决定要处理什么。S2A重新生成输入上下文以使输入上下文只包含相关部分,然后再处理重新
在富岳超算上训练大模型,日本联合研究团队发布 Fugaku-LLM
由多方企业和机构组成的日本联合研究团队昨日发布了 Fugaku-LLM 大模型。该模型的最大特色就是其是在 Arm 架构超算“富岳”上训练的。Fugaku-LLM 模型的开发于 2023 年 5 月启动,初期参与方包括富岳超算所有者富士通、东京工业大学、日本东北大学和日本理化学研究所(理研)。而在 2023 年 8 月,另外三家合作方 —— 名古屋大学、CyberAgent(也是游戏企业 Cygames 的母公司)和 HPC-AI 领域创企 Kotoba Technologies 也加入了该模型研发计划。▲ 富岳超
91.1% 准确率,性能远超 GPT-4 系列模型,谷歌推出多模态医学大模型 Med-Gemini
编辑 | 萝卜皮各种复杂的医疗应用给人工智能带来了巨大挑战:需要先进的推理、获取最新的医学知识以及对复杂的多模态数据的理解。Gemini 模型在多模态和长上下文推理方面具有强大的通用能力,为 AI 在医学领域应用提供了可能性。基于 Gemini 的核心优势,谷歌的研究人员推出了 Med-Gemini,这是一个功能强大的多模态模型系列,专门用于医学,能够无缝使用网络搜索,并且可以使用自定义编码器有效地针对新颖的模态进行定制。研究人员用 14 项医疗基准评估 Med-Gemini,在其中 10 项上建立了新的最先进(S
Chrome 浏览器桌面版地址栏整合自家聊天机器人:@Gemini 即可召唤
谷歌 Chrome 浏览器今日早些时候在 X(推特)宣布,其桌面版地址栏现已整合 Gemini 聊天机器人,用户可以通过简单、便捷的方式将 Gemini 召唤出来:在地址栏中输入“@”,然后选择“与 Gemini 聊天”,输入自定的提示词即可获取 Gemini 的回复。不久之前,该功能仍在 Canary 版本中进行测试。经IT之家此次实测,当 Chrome 更新至 124.0.6367.119(正式版本)之后,即可体验。Gemini 是谷歌 Deepmind 最新、最强大的 AI 模型。它原生支持多模态,具备跨模态
别再说国产大模型技术突破要靠 Llama 3 开源了
Meta 表示,Llama 3 已经在多种行业基准测试上展现了最先进的性能,提供了包括改进的推理能力在内的新功能,是目前市场上最好的开源大模型。 根据Meta的测试结果,Llama 3 8B模型在语言(MMLU)、知识(GPQA)、编程(HumanEval)等多项性能基准上均超过了Gemma 7B和Mistral 7B Instruct,70B 模型则超越了名声在外的闭源模型 Claude 3的中间版本 Sonnet,和谷歌的 Gemini Pro 1.5 相比三胜两负。 Meta还透露,Llama 3的 400B 模型仍在训练中。
当「养老」遇上 AI 大模型
作者:赖文昕编辑:陈彩娴鲜少有人关注到这样一个现象:在大模型的发展初期,「研发」与「产品」往往来自同一个群体——程序员。 由于大模型技术的系统复杂,新一代大模型产品经理的数量稀少,程序员往往既是技术、又是产品。 因此,程序员对 AI 大模型「究竟能解决什么问题」、「如何解决某个问题」的思考,也就在一定程度上刻画了第一批大模型落地应用的模样。
苹果发布 OpenELM,基于开源训练和推理框架的高效语言模型
在 WWDC24 之前,苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”,名为 OpenELM。当然,这是一项开源语言模型,其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下:大型语言模型的可重复性和透明性对于推进开放研究、确保结果的可信度以及调查数据和模型偏差以及潜在风险至关重要。为此,我们发布了 OpenELM,一个最先进的开源语言模型。OpenELM 使用分层缩放策略,可以有效地分配 Transformer 模型每一层的参数
移动版谷歌 Gemini 将迎诸多新特性:分析 PDF 文件内容等
感谢消息源 AssembleDebug 近日挖掘安卓版 Gemini 应用程序,发现隐藏了诸多新功能 / 新特性,包括上传 PDF 等文件,引入 Live Prompts、Select text 功能等。上传并分析 PDF 格式文件安卓版 Gemini 现阶段仅支持上传图片,而在最新版中相关代码已经出现了上传 PDF 等文件描述,可以分析文档中的内容,只是该功能目前尚未生效。Select text安卓版 Gemini 此前提供的回答只能全文复制,用户需要复制粘贴到其它地方再进行优化。而在最新选项中新增了“Selec
从 0 到 1,揭秘中国首个 AI 音乐 SOTA 模型
音乐早已成为人类表达情感的最佳载体。 但音乐创作是一件门槛很高的事情,因为音乐创作不是某一个人的独角戏,而一个团队高度协作的过程。 从作词、作曲到编曲、混音,再到歌曲录制,每个环节都需要专业音乐人付出努力,并伴随着高昂的成本投入。
高通与 Meta 宣布合作,优化 Llama 3 大语言模型在智能手机等终端运行
Meta 公司昨日宣布推出下一代大语言模型 Llama 3,共有 80 亿和 700 亿参数两种版本,号称是最强大的开源大语言模型。与此同时,高通宣布支持 Meta Llama 3 在骁龙终端上运行。据介绍,双方将优化 Meta Llama 3 大语言模型(LLM)直接在智能手机、PC、VR / AR 头显和汽车等终端上的执行。开发者将能够访问高通 AI Hub 中的资源和工具,以实现在骁龙平台上优化运行 Llama 3,从而缩短产品上市时间并充分发挥终端侧 AI 的优势,包括出色的响应能力、增强的隐私性和可靠性,
浪潮信息彭震:AI+是目标也是机会,要推动AI成为百行千业的生产力
去年以来,ChatGPT引爆了新一轮的AI浪潮,随后国内大模型进入“百模大战”的热闹中。 如今,一年多过去,国内外的大模型开启了不同的叙事方式,OpenAI已在酝酿GPT5,继续探求通往AGI的路径,而国内,大模型公司开始考虑商业化,落地应用成为国内大模型的主旋律。 但在这个过程中,当大模型走进应用,如何更好地落地,已然成为一众AI领域厂商关注的焦点所在。
Meta AI 全球市场扩张,并上线网页版 meta.ai
Meta 公司近日宣布 Llama 3 大语言模型之外,扩展 Meta AI 服务到美国之外的 13 个国家和地区,还宣布上线专门的聊天网站:meta.ai。Meta 公司在新闻稿中表示开始在全球市场扩展 Meta AI,在澳大利亚、加拿大、南非和新加坡等国家和地区推出英语版本。IT之家附上 Meta AI 扩展的国家和地区如下澳大利亚加拿大加纳牙买加马拉维新西兰尼日利亚巴基斯坦新加坡南非乌干达赞比亚津巴布韦Meta AI 整合了 Llama 3 大语言模型,速度更快、智能性更高、功能更强,是执行各种任务的理想选择