文章列表

清华新VLA框架加速破解具身智能止步实验室“魔咒”,LLM开销节省4-6倍 | NeurIPS'24

计算、存储消耗高,机器人使用多模态模型的障碍被解决了! 来自清华大学的研究者们设计了DeeR-VLA框架,一种适用于VLA的“动态推理”框架,能将LLM部分的相关计算、内存开销平均降低4-6倍。 (VLA:视觉-语言-动作模型,代表一类用于处理多模态输入的模型)简单来说,DeeR-VLA就像人的决策系统:简单任务快速思考,复杂任务仔细思考。

ChatGPT 两岁,OpenAI 10 亿用户计划曝光

ChatGPT 已经 2 岁了!OpenAI 下一个目标瞄准十亿用户,预计明年放出 AI 智能体产品。就在生日这天,马斯克还送上了大礼:阻止 OpenAI 全面盈利的一份诉状书。

apk 文件显示,谷歌 Gemini 未来将支持代码文件夹 AI 分析功能

如果这一功能上线,用户将能够直接向 Gemini 上传代码文件夹。虽然 Gemini 已具备阅读单个代码文件并提供反馈的能力,但实际开发项目往往由多个代码文件组成。

国家管网“管网”大模型正式上线应用,基于华为算力底座和技术栈

据华为官方消息,11 月 29 日,国家管网集团“管网”大模型正式上线应用。“管网”大模型基于华为算力底座和技术栈,打造“管网制度流程 + 数据 + IT + 大模型”体系,构建具有管网特色的大模型方案。

OpenAI 遭加拿大五大媒体起诉,称其非法抓取新闻训练 ChatGPT 等 AI 模型

他们表示:“OpenAI 没有选择合法途径获取信息,而是选择公然盗用新闻媒体公司的宝贵知识产权,并在未经同意或考虑的情况下将其用于自己的目的,包括商业用途。”

意大利数据保护局“亲自警告”当地传媒集团 GEDI:不要与 OpenAI 共享数据

北京时间今晚,据路透社报道,意大利数据保护局(GPDP)向当地出版商 GEDI警告,不应将其个人数据档案共享给 ChatGPT 的母公司 OpenAI,因此举或将违反欧盟相关隐私保护法规。

关于 Meta Llama 3,你知道多少?

2024年,对于人工智能领域来说可谓意义非凡。 继 OpenAI 推出备受赞誉的 GPT-4o mini后,Meta 的 Llama 3.1 模型亦在 . 7月23日 惊艳亮相,再一次掀起了新一轮人工智能热潮。

重磅开源!Kimi把自家底层推理架构都开源了,开源贡献阵容相当豪华:清华、阿里、华为、AISoft、面壁智能

就在昨天,Kimi宣布要把自家底层的大模型推理架构Mooncake开源出来! 有媒体称该架构正是承载了月之暗面Kimi线上80%以上流量的正在用的底层架构。 小编立马求证了一番,的确Github上有提到:Mooncake 正在服务Kimi平台。

如何搭建自己的ChatGpt?你学会了吗?

LobeChat与Oallam整合随着人工智能技术的不断发展,聊天机器人已经成为许多企业和个人用户的得力助手。 LobeChat作为一款开源、高性能的AI会话应用框架,提供了丰富的功能和灵活的扩展性。 而Oallam作为一个开源的大模型托管和服务平台,为开发者提供了便捷的模型下载和推理服务。

探秘 OpenAI Swarm:重塑 AI 代理协作新模式

作者 | 崔皓 审校 | 重楼本文主要介绍了 OpenAI 推出的实验性框架 Swarm,它是一个多代理编排框架,致力于探索管理复杂 AI 代理交互的方式。 文中阐述了 AI 代理的概念、组成及发展方向,强调 Swarm 的作用是协调多代理工作,通过任务分解、动态调度等机制,通过多个代码示例,体现其在复杂任务处理上的优势,还介绍了 Swarm 的核心概念如代理和任务移交,以及通过示例代码展示其关键概念和功能实现,最后深入原理,从 Routine 到 Agent 的转变及 Handoff 功能的运作方式。 引言:揭开 Swarm 的神秘面纱AI Agent 的出现为人类带来了前所未有的可能性,从简单的任务执行到复杂问题的智能解决,Agent 正在改变我们与技术交互的方式。

Kimi开源底层推理框架,1小时GitHub揽星1.2k

什么? Kimi底层推理架构刚刚宣布:开! 源!

当AI创造AI,就是库兹韦尔「奇点」临近时?人类正处于自我改进AI爆炸边缘

让AI自我改进这件事,究竟靠谱不靠谱? 伴随着深度学习技术的深入,特别是OpenAI正式发布生成式对话大模型ChatGPT之后,其强大的AI发展潜力让研究学者们也开始进一步猜想AI的现实潜力。 于是,在自我改进AI这件事上,研究学者们也是费了不少心思。

OpenAI API:LLM编程的事实标准

当下,大模型领域已然步入 “百模大战” 时期,形形色色的大模型如雨后春笋般不断涌现。 那么,若我们打算学习大模型的 API,是否真的需要逐一去钻研呢? 答案无疑是否定的。

官宣开源 阿里云与清华大学共建AI大模型推理项目Mooncake

2024年6月,国内优质大模型应用月之暗面Kimi与清华大学MADSys实验室(Machine Learning, AI, Big Data Systems Lab)联合发布了以 KVCache 为中心的大模型推理架构 Mooncake。 通过使用以 KVCache 为中心的 PD 分离和以存换算架构,大幅提升大模型应用Kimi智能助手推理吞吐的同时有效降低了推理成本,自发布以来受到业界广泛关注。 近日,清华大学和研究组织9#AISoft,联合以阿里云为代表的多家企业和研究机构,正式开源大模型资源池化项目 Mooncake。

马斯克旗下xAI蓄势待发,拟推独立App正面挑战ChatGPT

人工智能领域波澜再起,特斯拉及SpaceX创始人埃隆·马斯克旗下的AI初创公司xAI宣布即将推出一款与当前市场热门产品ChatGPT相抗衡的聊天机器人应用,预计最早将于今年12月面世。 这一动作不仅标志着xAI正式踏入消费级市场,也直接对老东家、曾由马斯克联合创立的OpenAI发出了挑战信号。 据国外媒体报道,xAI的这一新应用将是其首个面向消费者的产品,此前,xAI的技术主要应用于X平台(前身为Twitter)等内部项目中的Grok应用。

上海AI实验室版o1已上线!数学竞赛题、Leetcode赛题全拿下,还会玩24点

国产o1新选手登场! 它能快速解决更复杂的数学解题、代码编程、数字游戏等任务。 这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!

月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake

本次开源将采用分阶段的方式,逐步开源高性能 KVCache 多级缓存 Mooncake Store 的实现,同时针对各类推理引擎和底层存储 / 传输资源进行兼容。

标记化在LLM中有怎样的重要作用?

译者 | 李睿审校 | 重楼如今,GPT-3、GPT-4或谷歌的BERT等大型语言模型(LLM)已经成为人工智能理解和处理人类语言的重要组成部分。 但在这些模型展现出令人印象深刻的能力背后,却隐藏着一个很容易被忽视的过程:标记化。 本文将解释标记化的定义,标记化如此重要的原因,以及在实际应用中是否能够规避这一步骤。