基础

Just keep scaling!思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式

关注 AI 领域的人对 Jason Wei 这个名字一定不陌生。 他是 OpenAI 的一位资深研究科学家,也常在 OpenAI 的发布活动中露脸。 更重要的是,他是思维链概念开山之作《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》的第一作者。

联手OpenAI,吴恩达推出一门o1推理新课程,还免费

在刚刚过去的 2024 年,OpenAI 推出了 o 系列模型。 相比于以往大型语言模型,o 系列模型使用更多的计算进行更深入的「思考」,能够回答更复杂、更细致的问题。 通过在推理时执行思维链推理,o 系列模型在新兴用例中表现出色,包括多步骤规划、图像推理和长期编码。

离职OpenAI后,翁荔博客首次上新,引众网友围观学习(中文全文)

大约一个月前,OpenAI 安全系统团队负责人翁荔(Lilian Weng)在 X 上宣布了从已经工作了近 7 年的 OpenAI 离职的消息。 当时,她就曾表示,之后可能有更多时间来写博客。 刚刚,翁荔更新了一篇博客,迅速引起了大家的围观学习。

谷歌又捣鼓出好东西!有了这款AI学习神器,考试起码多考50分

AI好好用报道编辑:杨文谷歌AI版「十万个为什么」,让学习不再是「苦差事」。 谷歌真的藏了不少好东西! 继火遍全网的 NotebookLM 后,谷歌又「献」出了另一款实用型工具 ——Learn About!

谷歌、MIT等开发多智能体医疗决策框架MDAgents,医学LLM新用法

编辑 | 白菜叶基础模型正在成为医学领域的宝贵工具。 然而,尽管它们前景广阔,但在复杂的医学任务中如何最好地利用大型语言模型 (LLM) 仍是一个悬而未决的问题。 麻省理工学院、谷歌研究院和首尔国立大学医院的研究人员提出了一种新颖的多智能体框架,称为医疗决策智能体 (MDAgents),它通过自动为 LLM 团队分配协作结构来帮助解决这一差距。

Seed校招博士自述:我为什么选择来字节做大模型

原文来自知乎博主张逸霄对“大家能分享一下当前博士就业的情况吗”的回答。 人在英国,刚过答辩。 今年拿了腾讯 AI Lab(青云计划)、字节跳动(Seed) ,国外有之前实习的 Sony Research 和 Yamaha 的 return offer,国外也有正在面试的 Adobe 和 Meta。

达摩院发布八观气象大模型:精度达1小时1公里,率先落地新能源场景

11月6日,阿里巴巴达摩院(湖畔实验室)在北京举行决策智能产品发布会,正式发布八观气象大模型,在全球气象模型基础上引入区域多源数据,时空精度最高可达1公里*1公里*1小时。 通过大幅提升对温度、辐照、风速等关键气象指标的预测性能,八观气象大模型率先落地新能源占比高的新型电力系统,助力国网山东电力调控中心成功预测了多次极端天气,新能源发电功率、电力负荷预测准确率分别提升至96%和98%以上。 传统上,气象学家们根据物理规律,将大气运动变化编写成一系列数学物理方程再进行数值计算,耗费大量算力资源,且受到物理模型的瓶颈制约,难以快速、高效地满足各行业不同准确率、分辨率的天气预需求。

OpenAI今天Open了一下:开源多智能体框架Swarm

毫无疑问,多智能体肯定是 OpenAI 未来重要的研究方向之一,前些天 OpenAI 著名研究科学家 Noam Brown 还在 X 上为 OpenAI 正在组建的一个新的多智能体研究团队招募机器学习工程师。就在几个小时前,这个或许还没有组建完成的新研究团队就已经开源发布了一项重量级研究成果:Swarm。这是一个实验性质的多智能体编排框架,主打特征是工效(ergonomic)与轻量(lightweight)。

Sebastian Raschka最新博客:从头开始,用Llama 2构建Llama 3.2

十天前的 Meta Connect 2024 大会上,开源领域迎来了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。两个版本都是纯文本模型,但也具备多语言文本生成和工具调用能力。Meta 表示,这些模型可让开发者构建个性化的、在设备本地上运行的通用应用 —— 这类应用将具备很强的隐私性,因为数据无需离开设备。近日,机器学习研究员 Sebastian Raschka 光速发布长篇教程《Converting Llama 2 to Llama 3.2 From Scratch》。博文链接:《

《Python机器学习》作者科普长文:从头构建类GPT文本分类器,代码开源

学起来吧!近日,机器学习研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又分享了一篇长文,主题为《从头开始构建一个 GPT 风格的 LLM 分类器》。文章展示了如何将预训练的大型语言模型(LLM)转化为强大的文本分类器。AI在线对文章内容进行了不改变原意的编译、整理:为什么要关注分类呢?首先,针对分类任务,对预训练模型进行微调是一个简单有效的 LLM 知识入门方式。其次,文本分类有许多商业应用场景,比如:垃圾邮件检测、情感分析、客户反馈分类、主题分类等等。阅读完本文,你将找到以下

AI出图更快、更美、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?

随着大模型的落地按下加速键,文生图无疑是最火热的应用方向之一。自从 Stable Diffusion 诞生以来,海内外的文生图大模型层出不穷,一时有「神仙打架」之感。短短几个月,「最强 AI 画师」的称号几次易主。每一次技术迭代,都不断刷新着AI图像生成质量和速度的上限。于是现在,我们输入几个文字就能得到任何想要的画面。无论是专业级别的商业海报,还是超写实画风的写真照片,AI 制图的逼真程度已经让我们叹为观止。甚至 AI 赢下了 2023 年度的索尼世界摄影奖。在大奖公布之前,这幅「照片」已经在伦敦萨默赛特宫进行展

AI助攻人类画家拿下艺术大赛第一名,背后有啥独家秘籍?

两年前,在美国科罗拉多州博览会艺术比赛上,一幅名为《太空歌剧院》的作品拿了第一名。此画气势恢弘、明暗有致,颇有法国象征主义画家古斯塔夫・莫罗的味道。只不过,它不是人画的,而是由一位没有任何绘画基础的参赛者,借助 AI 绘图工具完成的。我们再把时间拨回到 2018 年。彼时,一幅名为《埃德蒙・贝拉米画像》的 AI 画作在纽约佳士得拍卖行,拍出了 40 多万美元的高价。这是第一幅被拍卖的人工智能作品,由此也标志着 AI 艺术作品开始被市场认可。如今,AI 绘画早已司空见惯,国内外的 AI 玩家纷纷下场,都要把这一赛道卷

OpenAI Lilian Weng万字长文解读LLM幻觉:从理解到克服

Lilian Weng 出品,必是精品。人会有幻觉,大型语言模型也会有幻觉。近日,OpenAI 安全系统团队负责人 Lilian Weng 更新了博客,介绍了近年来在理解、检测和克服 LLM 幻觉方面的诸多研究成果。Lilian Weng,中文名翁丽莲,是 OpenAI 安全系统团队负责人。她 2018 年加入 OpenAI,参与了 GPT-4 项目的预训练、强化学习 & 对齐、模型安全等方面的工作。她的博客深入、细致,具有前瞻性,被很多 AI 研究者视为重要的参考资料(其他博客见文末扩展阅读)。大型语言模型的幻觉
  • 1