文章列表
如何搭建自己的ChatGpt?你学会了吗?
LobeChat与Oallam整合随着人工智能技术的不断发展,聊天机器人已经成为许多企业和个人用户的得力助手。 LobeChat作为一款开源、高性能的AI会话应用框架,提供了丰富的功能和灵活的扩展性。 而Oallam作为一个开源的大模型托管和服务平台,为开发者提供了便捷的模型下载和推理服务。
11/29/2024 8:53:46 AM
了不起
探秘 OpenAI Swarm:重塑 AI 代理协作新模式
作者 | 崔皓 审校 | 重楼本文主要介绍了 OpenAI 推出的实验性框架 Swarm,它是一个多代理编排框架,致力于探索管理复杂 AI 代理交互的方式。 文中阐述了 AI 代理的概念、组成及发展方向,强调 Swarm 的作用是协调多代理工作,通过任务分解、动态调度等机制,通过多个代码示例,体现其在复杂任务处理上的优势,还介绍了 Swarm 的核心概念如代理和任务移交,以及通过示例代码展示其关键概念和功能实现,最后深入原理,从 Routine 到 Agent 的转变及 Handoff 功能的运作方式。 引言:揭开 Swarm 的神秘面纱AI Agent 的出现为人类带来了前所未有的可能性,从简单的任务执行到复杂问题的智能解决,Agent 正在改变我们与技术交互的方式。
11/29/2024 8:26:37 AM
崔皓
当AI创造AI,就是库兹韦尔「奇点」临近时?人类正处于自我改进AI爆炸边缘
让AI自我改进这件事,究竟靠谱不靠谱? 伴随着深度学习技术的深入,特别是OpenAI正式发布生成式对话大模型ChatGPT之后,其强大的AI发展潜力让研究学者们也开始进一步猜想AI的现实潜力。 于是,在自我改进AI这件事上,研究学者们也是费了不少心思。
11/28/2024 7:14:20 PM
新智元
OpenAI API:LLM编程的事实标准
当下,大模型领域已然步入 “百模大战” 时期,形形色色的大模型如雨后春笋般不断涌现。 那么,若我们打算学习大模型的 API,是否真的需要逐一去钻研呢? 答案无疑是否定的。
11/28/2024 4:45:50 PM
greencoatman
官宣开源 阿里云与清华大学共建AI大模型推理项目Mooncake
2024年6月,国内优质大模型应用月之暗面Kimi与清华大学MADSys实验室(Machine Learning, AI, Big Data Systems Lab)联合发布了以 KVCache 为中心的大模型推理架构 Mooncake。 通过使用以 KVCache 为中心的 PD 分离和以存换算架构,大幅提升大模型应用Kimi智能助手推理吞吐的同时有效降低了推理成本,自发布以来受到业界广泛关注。 近日,清华大学和研究组织9#AISoft,联合以阿里云为代表的多家企业和研究机构,正式开源大模型资源池化项目 Mooncake。
11/28/2024 3:51:00 PM
新闻助手
马斯克旗下xAI蓄势待发,拟推独立App正面挑战ChatGPT
人工智能领域波澜再起,特斯拉及SpaceX创始人埃隆·马斯克旗下的AI初创公司xAI宣布即将推出一款与当前市场热门产品ChatGPT相抗衡的聊天机器人应用,预计最早将于今年12月面世。 这一动作不仅标志着xAI正式踏入消费级市场,也直接对老东家、曾由马斯克联合创立的OpenAI发出了挑战信号。 据国外媒体报道,xAI的这一新应用将是其首个面向消费者的产品,此前,xAI的技术主要应用于X平台(前身为Twitter)等内部项目中的Grok应用。
11/28/2024 2:46:00 PM
晓晓
上海AI实验室版o1已上线!数学竞赛题、Leetcode赛题全拿下,还会玩24点
国产o1新选手登场! 它能快速解决更复杂的数学解题、代码编程、数字游戏等任务。 这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!
11/28/2024 1:40:00 PM
量子位
月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake
本次开源将采用分阶段的方式,逐步开源高性能 KVCache 多级缓存 Mooncake Store 的实现,同时针对各类推理引擎和底层存储 / 传输资源进行兼容。
11/28/2024 1:06:19 PM
汪淼
标记化在LLM中有怎样的重要作用?
译者 | 李睿审校 | 重楼如今,GPT-3、GPT-4或谷歌的BERT等大型语言模型(LLM)已经成为人工智能理解和处理人类语言的重要组成部分。 但在这些模型展现出令人印象深刻的能力背后,却隐藏着一个很容易被忽视的过程:标记化。 本文将解释标记化的定义,标记化如此重要的原因,以及在实际应用中是否能够规避这一步骤。
11/28/2024 8:15:44 AM
李睿
被曝入局浏览器市场后,OpenAI 将前谷歌 Chrome 工程师纳入麾下
综合鞭牛士、Search Engine Journal等26日消息,前谷歌Chrome浏览器工程师达林·费舍尔(Darin Fisher)近期加入了OpenAI。
11/27/2024 10:09:28 PM
清源
LLM应用开发者新利好:再也不用写集成代码了!
编辑 | 言征进入今年以来,如何磕破头也要挤进大LLM应用的赛道成为了每一位开发者的心事。 但上车LLM应用的人都知道,基于大模型做开发,远没有外界所说的“调接口”那么简单,开发人的痛,没人懂。 比如,光定制代码就能把你搞到没脾气。
11/27/2024 2:30:46 PM
言征
1行代码改进大模型训练,Llama训练速度提升至1.47倍,全华人团队出品
只要改一行代码,就能让大模型训练效率提升至1.47倍。 拥有得州大学奥斯汀分校背景四名华人学者,提出了大模型训练优化器Cautious Optimizers。 在提速的同时,Cautious能够保证训练效果不出现损失,而且语言和视觉模型都适用。
11/27/2024 2:30:00 PM
量子位
遗憾不?原来百度2017年就研究过Scaling Law,连Anthropic CEO灵感都来自百度
在追求 AGI 的道路上,Scaling Law 是绕不开的一环。 如果 Scaling Law 撞到了天花板,扩大模型规模,增加算力不能大幅提升模型的能力,那么就需要探索新的架构创新、算法优化或跨领域的技术突破。 作为一个学术概念,Scaling Law 为人所熟知,通常归功于 OpenAI 在 2020 年发的这篇论文:论文标题:Scaling Laws for Neural Language Models论文链接:、数据量、计算资源增加而指数提升。
11/27/2024 1:40:00 PM
机器之心
Sora就这么泄露了三小时,网友调侃Altman急拔网线,艺术家们也在抗议被「白嫖」
一觉醒来,挺突然的,Sora API 就这么泄露了。 坏消息:三个小时后,OpenAI 就关闭了访问权限。 好消息:大家伙把该测的都测完了。
11/27/2024 10:40:00 AM
机器之心
提示工程:更好地释放LLM的能力
提示工程,正如其名,主要聚焦于探究如何创作提示词。 存在提示工程的一个关键缘由在于,大模型在不同人群的视角下所发挥的作用差异显著。 普通使用者往往仅将大模型视作聊天机器人,他们着重关注的是大模型能否迅速且精准地予以反馈。
11/27/2024 10:23:31 AM
greencoatman
10 秒 1080P:部分艺术家指控 OpenAI 压榨,怒而泄露 Sora 视频生成 AI 模型
科技媒体 TechCrunch 昨日(11 月 26 日)发布博文,报道称名为“Sora PR Puppets”的组织为抗议 OpenAI 的“欺骗行为”和“艺术洗白”,于本周二在 Hugging Face 平台泄露了对 OpenAI 视频生成模型 Sora 的访问权限。
11/27/2024 8:28:53 AM
故渊
如何借助Cortex运行本地LLM
译者 | 布加迪审校 | 重楼AI行业正在经历一场转变,转向更小巧更高效的大语言模型(LLM),从而使用户能够在本地机器上运行模型,无需功能强大的服务器。 本教程将指导你借助Cortex运行本地LLM,着重介绍其独特的功能和易用性,使任何拥有标准硬件的人都可以享用AI。 注意:Cortex目前正在积极开发中,这可能会导致bug或某些功能无法正常运行。
11/27/2024 8:14:43 AM
布加迪