文章列表
研究发现:AI 越聪明就越有可能“胡编乱造”
一项新研究发现,随着大型语言模型(LLM)变得越来越强大,它们似乎也越来越容易编造事实,而不是避免或拒绝回答它们无法回答的问题。这表明,这些更聪明的 AI 聊天机器人实际上变得不太可靠。图源 PexelsAI在线注意到,该研究发表在《自然》杂志上,研究人员研究了一些业界领先的商业 LLM:OpenAI 的 GPT 和 Meta 的 LLaMA,以及由研究小组 BigScience 创建的开源模型 BLOOM。研究发现,虽然这些 LLM 的回答在许多情况下变得更加准确,但总体上可靠性更差,给出错误答案的比例比旧模型更
9/29/2024 1:20:36 PM
远洋
最受欢迎开源大模型,为什么是通义?
开源与闭源之争早已非新奇的话题,但毋庸置疑的是,开源极大地促进了大模型技术发展和生态繁荣。 大模型被认为是最烧钱的技术,训练一个大模型往往需要大量的数据、计算资源,导致训练成本巨大,众所周知GPT-3的训练费用据说超过 4600万美元,在大模型开源之前,大模型一直是那些有大量资金加持的大厂和明星创业公司才有资格碰的事情。 随着如 llama、Mistral、Falcon 这些开源先锋搅动了整个大模型竞争浪潮,那些没有AI积累的企业、大量中小公司团队,今天个人开发者,都能基于开源底座模型,用很低的成本训练、部署自己的专属模型,llama 这样的开源先锋也因此拥有一众拥趸。
9/29/2024 11:15:00 AM
张进
用一篇文章,帮你掌握 Midjourney 的人物风格迁移功能!
大家好,这里是 BananaStudio,上一篇介绍了如何用提示词描述画面中的多个人物,其中提到了 cref,今天详细带大家搞清楚 MJ 人物风格化迁移功能 Character Reference,也就是—cref 命令。如何仿照目标图来生成一样的图?
现在 MJ 中有三种方式可以达成:
① 垫图(最常用的手法)将构图、主题和一些风格大致应用到你生图中。操作说明:参考图片需要上传到 Discord,复制图片的 URL 添加到提示词中。在随后的生图中将会参照你写的提示词和参考垫图中的信息,通过添加“--iw”(图片权
9/29/2024 8:24:22 AM
BananaStudio
中国电信 AI 研究院完成首个全国产化万卡万参大模型训练,TeleChat2-115B 对外开源
“中国电信人工智能研究院”官方公众号今天宣布,中国电信人工智能研究院(AI在线注:下文称 TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型,并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型 —— 星辰语义大模型 TeleChat2-115B。官方表示,这项科研成果标志着国产大模型训练真正实现全国产化替代,正式进入全国产自主创新、安全可控的新阶段。TeleChat2-115B 基于中国电信自研的天翼云“息壤一体化智算服务平台”和人工智能公司“星海 AI 平台”训练完成
9/28/2024 6:38:22 PM
清源
OpenAI:计划五年内将 ChatGPT 每月订阅费用提高到最高 44 美元
感谢据 Engadget 当地时间 27 日报道,OpenAI 告诉投资者,该公司计划在今年年底前收取 ChatGPT 每月 22 美元(IT 之家备注:当前约 154 元人民币)的费用,并计划在未来五年内积极提高月费,最高将提升至 44 美元(当前约 308 元人民币)。图源 Pexels报道提到,OpenAI 正在从非营利公司向盈利公司的转变迈步,这种商业模式可取消对投资者汇报的任何上限,因此公司将有更大的空间以潜在的更高价格与新投资者谈判。文件显示,OpenAI 今年 8 月的营收为 3 亿美元(当前约 21
9/28/2024 4:18:47 PM
清源
苹果反水:OpenAI的1500亿「史上最大」融资轮,难了
有金主已经决定收手。在 OpenAI,高层变动正在成为一种传统。在不到两年的时间里,OpenAI 从一个 AI 圈内领先的实验室,发展成为一家全球知名的企业。在首席执行官山姆・奥特曼(Sam Altman)被罢免并迅速复职不到一年后,今年 9 月,三位高层领导突然宣布辞职。一个摆在台面上的问题是:这次宫斗的时间点,就在 OpenAI 即将完成可能是硅谷史上最大一轮融资的同一周。本周,OpenAI 首席技术官 Mira Murati、首席研究官 Bob McGrew 和 Post Training 研究副总裁 Bar
9/28/2024 2:26:00 PM
机器之心
《Python机器学习》作者科普长文:从头构建类GPT文本分类器,代码开源
学起来吧!近日,机器学习研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又分享了一篇长文,主题为《从头开始构建一个 GPT 风格的 LLM 分类器》。文章展示了如何将预训练的大型语言模型(LLM)转化为强大的文本分类器。AI在线对文章内容进行了不改变原意的编译、整理:为什么要关注分类呢?首先,针对分类任务,对预训练模型进行微调是一个简单有效的 LLM 知识入门方式。其次,文本分类有许多商业应用场景,比如:垃圾邮件检测、情感分析、客户反馈分类、主题分类等等。阅读完本文,你将找到以下
9/28/2024 2:24:00 PM
机器之心
Voyage-3 系列嵌入式 AI 模型登场:1/2.2 成本、1/3 嵌入维度下性能超 OpenAI v3 Large 模型 7.55%
科技媒体 marktechpost 昨日(9 月 27 日)发布博文,报道称 Voyage AI 公司推出了 Voyage-3 和 Voyage-3-Lite 两个嵌入式(Embedding)模型。这两个模型在技术、法律、金融、多语言应用和长文本理解等方面,均表现出超出同类模型的优势,在保持较小模型规模和较低的资源消耗情况下,为开发者提供更高效、更易于集成的解决方案。AI在线援引 Voyage AI 官方数据,在技术文档、代码、法律、金融、网页内容、多语言数据集、长文档和对话数据等方面,Voyage-3 以 1/2
9/28/2024 1:55:54 PM
故渊
实测字节豆包·视频生成模型:Sora画的饼被实现了......
但更多的网友则是期待字节的视频生成模型,因为早在去年11月,字节的项目Make Pixels Dance就展示字节具备了解决长AI视频中角色一致性难以保持的问题。 所以我也看到很多外网网友的另一个问题“Where is ByteDacne?”。 而就在9.24火山引擎AI创新巡展深圳站上,火山引擎一口气发布了个视频生成模型PixelDance和Seaweed模型。
9/27/2024 5:55:00 PM
林杰鑫
新「AI科学家」?MIT整合多智能体,实现材料科学研究自动化
编辑 | 萝卜皮人工智能(AI)的一个关键挑战是:如何创建能够通过「探索新领域」、「识别复杂模式」和「揭示海量科学数据中隐藏的联系」来自主推进科学理解的系统。在最近的工作中,麻省理工学院(Massachusetts Institute of Technology)原子与分子力学实验室(LAMM)的研究人员提出了 SciAgents,一种可以整合利用三个核心概念的方法:(1)使用大规模本体知识图谱来组织和互连不同的科学概念;(2)一套大型语言模型(LLM)和数据检索工具;(3)具有现场学习能力的多智能体(agent)
9/27/2024 5:41:00 PM
ScienceAI
OpenAI o1 在医学领域的初步研究,我们离 AI 医生更近了吗?
编辑 | 紫罗大语言模型 (LLM) 在各个领域和任务中都表现出了卓越的能力,突破了我们在学习和认知方面的知识界限。最新模型 OpenAI 的 o1 脱颖而出,成为第一个使用思维链 (CoT) 技术和强化学习的 LLM。虽然 o1 在一般任务中表现良好,但它在医学等专业领域的表现仍然未知。目前医学 LLM 的基准通常集中在一定范围内,例如知识、推理或安全,这使得在复杂的医学任务中对这些模型进行全面评估变得复杂。来自加州大学圣克鲁斯分校、爱丁堡大学和美国国立卫生研究院的研究人员评估了 OpenAI 的 o1 模型在医
9/27/2024 5:36:00 PM
ScienceAI
OpenAI人事地震24小时,奥特曼盟友Greg休假中发声,网友:你留下吗?
还记得休假到 2024 年底的 OpenAI 总裁 Greg Brockman 吗?在 OpenAI 的又一次人事巨震后,经过一天的沉默,Greg 终于发声了,小作文相比山姆・奥特曼的篇幅长了不少。我对 Barret、Bob 和 Mira 为 OpenAI 所做的贡献深表感激。我们合作多年,我们都是帮助 OpenAI 走到今天的团队成员。他们每个人都为团队做出了贡献。关于他们每个人,我都有一段小故事:Mira 和我最初是在 GPT-3 API 项目上密切合作,这是 OpenAI 创建的第一个产品,也可能是我做过的最
9/27/2024 2:13:00 PM
机器之心
PC 版 ChatGPT 客户端曝“记忆”功能漏洞,黑客可利用恶意文件令 AI 转发对话记录
OpenAI 在今年 2 月宣布为 ChatGPT 推出记忆(Memory)的功能,今年 9 月初这项功能正式向所有用户开放,该功能的主要用途是“设定预设”,从而帮助 AI 向用户更符合需求的答案。不过研究人员 Johann Rehberger 目前披露报告,称这项功能在 PC 版 ChatGPT 客户端上存在漏洞,黑客可借漏洞获取用户对话记录。AI在线获悉,Johann Rehberger 将这项漏洞称为 SpAIware,他表示黑客可通过钓鱼形式让受害者在 PC 版 ChatGPT 客户端中上传特定文件 / 特
9/27/2024 12:37:13 PM
漾仔
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
今天凌晨,大新闻不断。一边是 OpenAI 的高层又又又动荡了,另一边被誉为「真・Open AI」的 Meta 对 Llama 模型来了一波大更新:不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此,Meta 还正式发布了 Llama Stack Distribution,其可将多个 API 提供商打包在一起以便模型方便地调用各种工具或外部模型。此外,他们还发布了最新的安全保障措施。真・Open AI
9/26/2024 2:33:00 PM
机器之心
CTO前脚刚走,OpenAI后训练负责人、首席研究官也走了,网传公司要给奥特曼7%股权
刚刚,就在 OpenAI CTO Mira Murati 官宣辞职后不久,CEO Sam Altman 又投下一枚重磅消息 —— 以另一篇公开信的方式。奥特曼首先写道,「过去六年半,Mira 对 OpenAI 的进步和成长起到了至关重要的作用;她是我们从一个不为人知的研究实验室发展成为一个重要公司的巨大推动力。今天早上,Mira 告诉我她要离开时,我感到非常难过,但我支持她的决定。在过去的一年里,她一直在培养一支强大的领导团队,他们将继续推动我们的进步。」接着,他进一步透露更多高层的离职消息。「我还想告诉大家,B
9/26/2024 10:20:00 AM
机器之心
突发!OpenAI CTO Mira Murati离职,高层动荡继续
OpenAI 又迎来「地震级」高层人员变动。就在几个小时前,OpenAI CTO Mira Murati 在 X 上发帖表示,在 OpenAI 工作了六年多后,她将离开公司进行自己的探索。以下是 Mira Murati 的离职公开信全文(第一人称):「我有件事想和大家分享。经过深思熟虑,我做出了离开 OpenAl 的艰难决定。我已经在 OpenAl 团队工作了六年半,这是我的荣幸。在接下来的几天里,我会向很多人表示感谢,但首先我想感谢 CEO Sam Altman 和总裁 Greg Brockman 对我领导技术组
9/26/2024 10:11:00 AM
机器之心
Snapchat 聊天机器人 My AI 将整合谷歌 Gemini 模型
谷歌 Google Cloud 公司本周二宣布和 Snap 公司合作,在 Snapchat 的 AI 聊天机器人 My AI 中整合 Gemini,为用户带来更强的 AI 聊天体验。AI在线援引新闻稿内容,Snapchat 将使用谷歌 Gemini 聊天机器人的强大多模态功能,理解文本、音频、图像、视频和代码在内的多种输入类型,并理解回答用户的提问。谷歌表示本次合作,为 Snapchat 用户带来了更多创新功能。Snap 首席执行官埃文・斯皮格尔(Evan Spiegel)评论表示:与 Google Cloud 的
9/26/2024 9:42:43 AM
故渊
端侧最强开源 AI 模型 Llama 3.2 登场:可在手机运行,从 1B 纯文本到 90B 多模态,挑战 OpenAI 4o mini
Meta 公司昨日(9 月 25 日)发布博文,正式推出了 Llama 3.2 AI 模型,其特点是开放和可定制,开发者可以根据其需求定制实现边缘人工智能和视觉革命。Llama 3.2 提供了多模态视觉和轻量级模型,代表了 Meta 在大型语言模型(LLMs)方面的最新进展,在各种使用案例中提供了更强大的功能和更广泛的适用性。其中包括适合边缘和移动设备的中小型视觉 LLMs (11B 和 90B),以及轻量级纯文本模型(1B 和 3B),此外提供预训练和指令微调(instruction-tuned)版本。AI在线附
9/26/2024 7:01:35 AM
故渊