AIGC宇宙 AIGC宇宙

开源

DeepSeek推理引擎开源新路径,助力vLLM生态再升级

最近,DeepSeek 宣布了一项重要决定:将其自研的推理引擎进行开源,但并不会直接向公众开放完整的代码库。 相反,他们选择与现有的开源项目 vLLM 合作,致力于分享核心的优化成果。 这一举动旨在解决开源社区中普遍存在的代码库分歧、基础设施依赖及维护资源有限等难题。
4/16/2025 2:01:15 PM
AI在线

奥特曼:ChatGPT不是AGI!OpenAI最强开源模型直击DeepSeek

近了,近了! 全网多个流出的代码截图显示,满血版o3、o4-mini,以及o4-mini high,有极大概率在下周发布。 不仅如此,在OpenRouter平台上,一款神秘模型Optimus Alpha(ELO得分1387)直接霸榜,据称就是o4-mini。
4/14/2025 9:17:00 AM
新智元

OpenAI史上最硬核技术播客!系统揭秘GPT4.5诞生,已进入数据受限时代!小哥亲述大模型修bug血泪史;还有一个重磅开源消息

整理 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)刚刚,奥特曼亲自预热的那期播客,完整版视频终于上线啦! ! !
4/11/2025 1:41:19 PM
伊风

大模型“自动修 bug”能力将提升,豆包团队开源首个多语言代码修复基准 Multi-SWE-bench

4 月 10 日消息,豆包大模型团队今日通过官方公众号宣布,首个多语言类 SWE 数据集 Multi-SWE-bench 现已正式开源,可用于评估和提升大模型“自动修 Bug”能力。 在 SWE-bench 基础上,Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言,是真正面向“全栈工程”的评测基准。 其数据均来自 GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。
4/10/2025 2:30:12 PM
清源

一文读懂开源 Llama 4 模型

Hello folks,我是 Luga,今天我们来聊一下人工智能领域的最新大模型技术进展 - 构建高效、灵活、以及开源的的大模型 - Llama 4 。 在人工智能领域,随着技术的不断进步,越来越多的强大语言模型应运而生。 Llama 4 作为 Meta 推出的最新一代大规模语言模型,凭借其卓越的性能和创新的架构设计,成为了当前 AI 领域的焦点之一。
4/7/2025 8:40:00 AM
Luga Lee

大模型RL不止数学代码!7B奖励模型搞定医学法律经济全学科, 不用思维链也能做题

一个7B奖励模型搞定全学科,大模型强化学习不止数学和代码。 o1/r1的强化学习很强,但主要探索了数学和代码领域,因为这两个领域的数据结构化程度高,奖励函数/奖励模型比较好设计。 那么,想提升大模型在其他学科领域的能力该怎么办?
4/3/2025 9:23:08 AM
量子位

DeepSeek-V3击败R1开源登顶!杭州黑马撼动硅谷AI霸主,抹去1万亿市值神话

DeepSeek依然很能打,春节余波还在扩散! 据AI产品分析平台aitools.xyz统计,DeepSeek每月新增网站访问量超过了ChatGPT。 作为异军突起的现象级产品,DeepSeek的增长速度除了创造AI产品的增长奇迹,更是重新定义了全球的AI竞赛格局。
4/2/2025 9:21:00 AM
新智元

OpenAI要Open了!奥特曼开源首个推理模型,ChatGPT一小时暴增百万用户

OpenAI终于要Open AI了! 一大早,奥特曼郑重官宣,「未来几个月,将开源一款强大的推理模型」。 这是自GPT-2以来,OpenAI首个开源的模型。
4/1/2025 9:46:08 AM
新智元

开源版Suno来了!AI音乐生成模型YuE可生成专业级的歌声和伴奏

近日,由香港科技大学与音乐领域的 DeepSeek 合作开发的开源音乐生成模型 YuE 正式发布,震惊了不少乐迷和音乐创作者。 这一模型不仅能够生成多种风格的音乐,还可以模拟人声,给听众带来全新的音乐体验。 YuE 的特点在于其双 LLaMA 语言模型架构,这使其能够无缝适配各种大语言模型,并且能够处理长达5分钟的完整歌曲。
3/28/2025 3:06:00 PM
AI在线

RAG(五)BGE-M3,最流行的开源text embedding模型

项目地址: embedding? Text Embedding 是一种将文本数据映射到高维向量空间的技术,这些向量能够捕捉文本的语义信息。 通过将文本嵌入到向量空间中,我们可以利用向量之间的距离或相似性来衡量文本之间的语义相关性。
3/21/2025 7:00:00 AM
Glodma

HuggingFace、a16z向白宫谏言,激辩OpenAI:开源才是美国最大的AI竞争优势,垄断不是!

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)近日OpenAI提交有关禁止使用中国模型的提案引起了大家的注意。 不过这也只是提议,包括美国在内的很多企业和大佬对此表示并不赞同——在华盛顿的政策环境中,越来越多地呼吁对人工智能进行最低限度的监管,而Hugging Face则向特朗普政府提出了截然不同的观点:开源和协作的人工智能开发可能是美国最强大的竞争优势。 目前,Hugging Face已经在自家平台上拥有超过 150 万个公共模型,它已向白宫人工智能行动计划提交了建议,认为开源模型的最新突破表明,它们可以以极低的成本达到甚至超越封闭商业系统的能力。
3/20/2025 1:07:11 PM
言征

AI 狂飙倒计时!李开复预言:2025年,开源大模型将掀起商业巨浪!

AI的战鼓已经擂响,冲锋号即将吹响!科技圈大佬李开复近日发出重磅预言:2025年,绝非平平无奇,而是AI应用迎来井喷式爆发的元年,更是大模型商业化战场上的“生死大考”!机遇与挑战并存,一场关乎AI未来格局的变革风暴,正在酝酿之中。 李开复的这番豪言壮语,并非空穴来风,而是基于他对行业趋势的深刻洞察。 他以DeepSeek的横空出世为例,激动地表示,这不仅仅是中国AI力量的一次惊艳亮相,更在全球范围内奏响了开源的最强音!DeepSeek的出现,仿佛一盏指路明灯,让人们清晰地看到,开源,必将成为大模型领域的终极答案!图源备注:图片由AI生成,图片授权服务商Midjourney未来的AI世界,将不再是技术参数的冰冷比拼,而是谁能更好地拥抱开源,将开源模型转化为驱动商业增长的引擎。
3/18/2025 3:35:00 PM
AI在线

DeepSeek 开源 EPLB,世界上从来没有什么腾空出世!

deepseek开源DualPipe的同一天,还开源了EPLB。 今天来简单聊聊EPLB,包懂。 EPLB是干嘛的?
3/13/2025 10:31:20 AM
架构师之路

Manus逼OpenAI开源智能体框架,网友:已从行业领导者变为跟随者

OpenAI又开源了,这次是一套智能体开发框架。 联网搜索、文件搜索、计算机使用(Computer Use),统统打包,GitHub 8小时上千星。 图片奥特曼认为其中的API是有史以来(并没有限定在OpenAI范围内)设计最完善、最实用的之一。
3/12/2025 11:34:35 AM

DeepSeek 开源的 DualPipe,居然是梁文峰写的,你感性?

继DeepGEMM之后,deepseek开源了第四弹DualPipe。 今天来简单聊聊DualPipe,包懂。 DualPipe是干嘛的?
3/12/2025 10:36:32 AM
架构师之路

Ollama的配置修改与接口调用

一、修改环境变量1.1  配置远程访问在我们本地部署好ollama之后,仅支持本机访问,我们可以通过修改环境变量让其他人可以远程访问。 在wins电脑上增加环境变量:复制1.2  配置本地模型路径1.2.1 本地模型默认路径wins本地模型默认路径:C:\Users\%username%\.ollama\models。 这里 %username% 是当前登录的用户名。
3/10/2025 9:00:00 AM
Python伊甸园

Ollama的介绍与测试

一、Ollama介绍Ollama是一个开源工具,专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计。 它提供了一个简洁高效的界面,让用户能够轻松地创建、执行和管理这些复杂的模型。 此外,Ollama还配备了一个丰富的预构建模型库,使得这些模型能够无缝集成到各种应用程序之中,大大提升了开发效率和用户体验。
3/10/2025 8:30:00 AM
Python伊甸园

视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源

今天给大家重磅推荐一个突破性的视觉强化微调开源项目 —— Visual-RFT (Visual Reinforcement Fine-Tuning)。 论文地址:  : Visual-RFT 将 DeepSeek-R1 背后的基于规则奖励的强化学习方法和 OpenAI 的强化微调(Reinforcement Fine-Tuning,RFT)范式成功从纯文本大语言模型拓展到了视觉语言大模型(LVLM)。 通过针对视觉的细分类、目标检测等任务设计对应的规则奖励,Visual-RFT 打破了 DeepSeek-R1 方法局限于文本、数学推理、代码等少数领域的认知,为视觉语言模型的训练开辟了全新路径!
3/4/2025 5:27:05 PM
机器之心