文章列表

分类

标签

如何搭建自己的ChatGpt？你学会了吗？

LobeChat与Oallam整合随着人工智能技术的不断发展，聊天机器人已经成为许多企业和个人用户的得力助手。 LobeChat作为一款开源、高性能的AI会话应用框架，提供了丰富的功能和灵活的扩展性。而Oallam作为一个开源的大模型托管和服务平台，为开发者提供了便捷的模型下载和推理服务。

11/29/2024 8:53:46 AM

了不起

作者 | 崔皓审校 | 重楼本文主要介绍了 OpenAI 推出的实验性框架 Swarm，它是一个多代理编排框架，致力于探索管理复杂 AI 代理交互的方式。文中阐述了 AI 代理的概念、组成及发展方向，强调 Swarm 的作用是协调多代理工作，通过任务分解、动态调度等机制，通过多个代码示例，体现其在复杂任务处理上的优势，还介绍了 Swarm 的核心概念如代理和任务移交，以及通过示例代码展示其关键概念和功能实现，最后深入原理，从 Routine 到 Agent 的转变及 Handoff 功能的运作方式。引言：揭开 Swarm 的神秘面纱AI Agent 的出现为人类带来了前所未有的可能性，从简单的任务执行到复杂问题的智能解决，Agent 正在改变我们与技术交互的方式。

11/29/2024 8:26:37 AM

崔皓

Kimi开源底层推理框架，1小时GitHub揽星1.2k

什么？ Kimi底层推理架构刚刚宣布：开！源！

11/29/2024 7:00:00 AM

当AI创造AI，就是库兹韦尔「奇点」临近时？人类正处于自我改进AI爆炸边缘

让AI自我改进这件事，究竟靠谱不靠谱？伴随着深度学习技术的深入，特别是OpenAI正式发布生成式对话大模型ChatGPT之后，其强大的AI发展潜力让研究学者们也开始进一步猜想AI的现实潜力。于是，在自我改进AI这件事上，研究学者们也是费了不少心思。

11/28/2024 7:14:20 PM

新智元

OpenAI API：LLM编程的事实标准

当下，大模型领域已然步入 “百模大战” 时期，形形色色的大模型如雨后春笋般不断涌现。那么，若我们打算学习大模型的 API，是否真的需要逐一去钻研呢？答案无疑是否定的。

11/28/2024 4:45:50 PM

greencoatman

官宣开源阿里云与清华大学共建AI大模型推理项目Mooncake

2024年6月，国内优质大模型应用月之暗面Kimi与清华大学MADSys实验室（Machine Learning, AI, Big Data Systems Lab）联合发布了以 KVCache 为中心的大模型推理架构 Mooncake。通过使用以 KVCache 为中心的 PD 分离和以存换算架构，大幅提升大模型应用Kimi智能助手推理吞吐的同时有效降低了推理成本，自发布以来受到业界广泛关注。近日，清华大学和研究组织9#AISoft，联合以阿里云为代表的多家企业和研究机构，正式开源大模型资源池化项目 Mooncake。

11/28/2024 3:51:00 PM

新闻助手

马斯克旗下xAI蓄势待发，拟推独立App正面挑战ChatGPT

人工智能领域波澜再起，特斯拉及SpaceX创始人埃隆·马斯克旗下的AI初创公司xAI宣布即将推出一款与当前市场热门产品ChatGPT相抗衡的聊天机器人应用，预计最早将于今年12月面世。这一动作不仅标志着xAI正式踏入消费级市场，也直接对老东家、曾由马斯克联合创立的OpenAI发出了挑战信号。据国外媒体报道，xAI的这一新应用将是其首个面向消费者的产品，此前，xAI的技术主要应用于X平台(前身为Twitter)等内部项目中的Grok应用。

11/28/2024 2:46:00 PM

晓晓

上海AI实验室版o1已上线！数学竞赛题、Leetcode赛题全拿下，还会玩24点

国产o1新选手登场！它能快速解决更复杂的数学解题、代码编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker，刚刚正式开放试用！

11/28/2024 1:40:00 PM

量子位

月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake

本次开源将采用分阶段的方式，逐步开源高性能 KVCache 多级缓存 Mooncake Store 的实现，同时针对各类推理引擎和底层存储 / 传输资源进行兼容。

11/28/2024 1:06:19 PM

汪淼

标记化在LLM中有怎样的重要作用？

译者 | 李睿审校 | 重楼如今，GPT-3、GPT-4或谷歌的BERT等大型语言模型（LLM）已经成为人工智能理解和处理人类语言的重要组成部分。但在这些模型展现出令人印象深刻的能力背后，却隐藏着一个很容易被忽视的过程：标记化。本文将解释标记化的定义，标记化如此重要的原因，以及在实际应用中是否能够规避这一步骤。

11/28/2024 8:15:44 AM

李睿

被曝入局浏览器市场后，OpenAI 将前谷歌 Chrome 工程师纳入麾下

综合鞭牛士、Search Engine Journal等26日消息，前谷歌Chrome浏览器工程师达林·费舍尔（Darin Fisher）近期加入了OpenAI。

11/27/2024 10:09:28 PM

清源

LLM应用开发者新利好：再也不用写集成代码了！

编辑 | 言征进入今年以来，如何磕破头也要挤进大LLM应用的赛道成为了每一位开发者的心事。但上车LLM应用的人都知道，基于大模型做开发，远没有外界所说的“调接口”那么简单，开发人的痛，没人懂。比如，光定制代码就能把你搞到没脾气。

11/27/2024 2:30:46 PM

言征

1行代码改进大模型训练，Llama训练速度提升至1.47倍，全华人团队出品

只要改一行代码，就能让大模型训练效率提升至1.47倍。拥有得州大学奥斯汀分校背景四名华人学者，提出了大模型训练优化器Cautious Optimizers。在提速的同时，Cautious能够保证训练效果不出现损失，而且语言和视觉模型都适用。

11/27/2024 2:30:00 PM

量子位

遗憾不？原来百度2017年就研究过Scaling Law，连Anthropic CEO灵感都来自百度

在追求 AGI 的道路上，Scaling Law 是绕不开的一环。如果 Scaling Law 撞到了天花板，扩大模型规模，增加算力不能大幅提升模型的能力，那么就需要探索新的架构创新、算法优化或跨领域的技术突破。作为一个学术概念，Scaling Law 为人所熟知，通常归功于 OpenAI 在 2020 年发的这篇论文：论文标题：Scaling Laws for Neural Language Models论文链接：、数据量、计算资源增加而指数提升。

11/27/2024 1:40:00 PM

机器之心

Sora就这么泄露了三小时，网友调侃Altman急拔网线，艺术家们也在抗议被「白嫖」

一觉醒来，挺突然的，Sora API 就这么泄露了。坏消息：三个小时后，OpenAI 就关闭了访问权限。好消息：大家伙把该测的都测完了。

11/27/2024 10:40:00 AM

机器之心

提示工程：更好地释放LLM的能力

提示工程，正如其名，主要聚焦于探究如何创作提示词。存在提示工程的一个关键缘由在于，大模型在不同人群的视角下所发挥的作用差异显著。普通使用者往往仅将大模型视作聊天机器人，他们着重关注的是大模型能否迅速且精准地予以反馈。

11/27/2024 10:23:31 AM

greencoatman

10 秒 1080P：部分艺术家指控 OpenAI 压榨，怒而泄露 Sora 视频生成 AI 模型

科技媒体 TechCrunch 昨日（11 月 26 日）发布博文，报道称名为“Sora PR Puppets”的组织为抗议 OpenAI 的“欺骗行为”和“艺术洗白”，于本周二在 Hugging Face 平台泄露了对 OpenAI 视频生成模型 Sora 的访问权限。

11/27/2024 8:28:53 AM

故渊

如何借助Cortex运行本地LLM

译者 | 布加迪审校 | 重楼AI行业正在经历一场转变，转向更小巧更高效的大语言模型（LLM），从而使用户能够在本地机器上运行模型，无需功能强大的服务器。本教程将指导你借助Cortex运行本地LLM，着重介绍其独特的功能和易用性，使任何拥有标准硬件的人都可以享用AI。注意：Cortex目前正在积极开发中，这可能会导致bug或某些功能无法正常运行。

11/27/2024 8:14:43 AM

布加迪

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统 OpenAI发布34页智能体实践指南：从网络搜索到代码编写 OpenAI发布GPT-4.1指令提示工程指南别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体 Midjourney图像编辑器迎来重大更新：全新UI、图层功能与智能工具上线

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测人形机器人伟达 Transformer 百度深度学习 AI视频苹果模态 xAI 字节跳动驾驶文本搜索大语言模型具身智能 Claude Copilot 神器推荐 LLaMA 算力安全应用视频生成视觉科技亚马逊大型语言模型干货合集特斯拉 2024 AGI 训练