开源

大模型“自动修 bug”能力将提升,豆包团队开源首个多语言代码修复基准 Multi-SWE-bench

4 月 10 日消息,豆包大模型团队今日通过官方公众号宣布,首个多语言类 SWE 数据集 Multi-SWE-bench 现已正式开源,可用于评估和提升大模型“自动修 Bug”能力。 在 SWE-bench 基础上,Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言,是真正面向“全栈工程”的评测基准。 其数据均来自 GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。

一文读懂开源 Llama 4 模型

Hello folks,我是 Luga,今天我们来聊一下人工智能领域的最新大模型技术进展 - 构建高效、灵活、以及开源的的大模型 - Llama 4 。 在人工智能领域,随着技术的不断进步,越来越多的强大语言模型应运而生。 Llama 4 作为 Meta 推出的最新一代大规模语言模型,凭借其卓越的性能和创新的架构设计,成为了当前 AI 领域的焦点之一。

大模型RL不止数学代码!7B奖励模型搞定医学法律经济全学科, 不用思维链也能做题

一个7B奖励模型搞定全学科,大模型强化学习不止数学和代码。 o1/r1的强化学习很强,但主要探索了数学和代码领域,因为这两个领域的数据结构化程度高,奖励函数/奖励模型比较好设计。 那么,想提升大模型在其他学科领域的能力该怎么办?

DeepSeek-V3击败R1开源登顶!杭州黑马撼动硅谷AI霸主,抹去1万亿市值神话

DeepSeek依然很能打,春节余波还在扩散! 据AI产品分析平台aitools.xyz统计,DeepSeek每月新增网站访问量超过了ChatGPT。 作为异军突起的现象级产品,DeepSeek的增长速度除了创造AI产品的增长奇迹,更是重新定义了全球的AI竞赛格局。

开源版Suno来了!AI音乐生成模型YuE可生成专业级的歌声和伴奏

近日,由香港科技大学与音乐领域的 DeepSeek 合作开发的开源音乐生成模型 YuE 正式发布,震惊了不少乐迷和音乐创作者。 这一模型不仅能够生成多种风格的音乐,还可以模拟人声,给听众带来全新的音乐体验。 YuE 的特点在于其双 LLaMA 语言模型架构,这使其能够无缝适配各种大语言模型,并且能够处理长达5分钟的完整歌曲。

RAG(五)BGE-M3,最流行的开源text embedding模型

项目地址: embedding? Text Embedding 是一种将文本数据映射到高维向量空间的技术,这些向量能够捕捉文本的语义信息。 通过将文本嵌入到向量空间中,我们可以利用向量之间的距离或相似性来衡量文本之间的语义相关性。

HuggingFace、a16z向白宫谏言,激辩OpenAI:开源才是美国最大的AI竞争优势,垄断不是!

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)近日OpenAI提交有关禁止使用中国模型的提案引起了大家的注意。 不过这也只是提议,包括美国在内的很多企业和大佬对此表示并不赞同——在华盛顿的政策环境中,越来越多地呼吁对人工智能进行最低限度的监管,而Hugging Face则向特朗普政府提出了截然不同的观点:开源和协作的人工智能开发可能是美国最强大的竞争优势。 目前,Hugging Face已经在自家平台上拥有超过 150 万个公共模型,它已向白宫人工智能行动计划提交了建议,认为开源模型的最新突破表明,它们可以以极低的成本达到甚至超越封闭商业系统的能力。

AI 狂飙倒计时!李开复预言:2025年,开源大模型将掀起商业巨浪!

AI的战鼓已经擂响,冲锋号即将吹响!科技圈大佬李开复近日发出重磅预言:2025年,绝非平平无奇,而是AI应用迎来井喷式爆发的元年,更是大模型商业化战场上的“生死大考”!机遇与挑战并存,一场关乎AI未来格局的变革风暴,正在酝酿之中。 李开复的这番豪言壮语,并非空穴来风,而是基于他对行业趋势的深刻洞察。 他以DeepSeek的横空出世为例,激动地表示,这不仅仅是中国AI力量的一次惊艳亮相,更在全球范围内奏响了开源的最强音!DeepSeek的出现,仿佛一盏指路明灯,让人们清晰地看到,开源,必将成为大模型领域的终极答案!图源备注:图片由AI生成,图片授权服务商Midjourney未来的AI世界,将不再是技术参数的冰冷比拼,而是谁能更好地拥抱开源,将开源模型转化为驱动商业增长的引擎。

DeepSeek 开源 EPLB,世界上从来没有什么腾空出世!

deepseek开源DualPipe的同一天,还开源了EPLB。 今天来简单聊聊EPLB,包懂。 EPLB是干嘛的?

Manus逼OpenAI开源智能体框架,网友:已从行业领导者变为跟随者

OpenAI又开源了,这次是一套智能体开发框架。 联网搜索、文件搜索、计算机使用(Computer Use),统统打包,GitHub 8小时上千星。 图片奥特曼认为其中的API是有史以来(并没有限定在OpenAI范围内)设计最完善、最实用的之一。

DeepSeek 开源的 DualPipe,居然是梁文峰写的,你感性?

继DeepGEMM之后,deepseek开源了第四弹DualPipe。 今天来简单聊聊DualPipe,包懂。 DualPipe是干嘛的?

Ollama的配置修改与接口调用

一、修改环境变量1.1  配置远程访问在我们本地部署好ollama之后,仅支持本机访问,我们可以通过修改环境变量让其他人可以远程访问。 在wins电脑上增加环境变量:复制1.2  配置本地模型路径1.2.1 本地模型默认路径wins本地模型默认路径:C:\Users\%username%\.ollama\models。 这里 %username% 是当前登录的用户名。

Ollama的介绍与测试

一、Ollama介绍Ollama是一个开源工具,专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计。 它提供了一个简洁高效的界面,让用户能够轻松地创建、执行和管理这些复杂的模型。 此外,Ollama还配备了一个丰富的预构建模型库,使得这些模型能够无缝集成到各种应用程序之中,大大提升了开发效率和用户体验。

视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源

今天给大家重磅推荐一个突破性的视觉强化微调开源项目 —— Visual-RFT (Visual Reinforcement Fine-Tuning)。 论文地址:  : Visual-RFT 将 DeepSeek-R1 背后的基于规则奖励的强化学习方法和 OpenAI 的强化微调(Reinforcement Fine-Tuning,RFT)范式成功从纯文本大语言模型拓展到了视觉语言大模型(LVLM)。 通过针对视觉的细分类、目标检测等任务设计对应的规则奖励,Visual-RFT 打破了 DeepSeek-R1 方法局限于文本、数学推理、代码等少数领域的认知,为视觉语言模型的训练开辟了全新路径!

火山引擎宣布大模型应用开源:上线“大模型应用实验室”,释放 AI 创新潜力

火山引擎今日通过 X 平台宣布,其大模型应用正式开源,并推出全新“大模型应用实验室”平台。 这一举措标志着火山引擎在 AI 技术生态建设上的重大突破,旨在通过开放核心应用和技术资源,加速开发者社区的创新步伐。 此次开源的应用包括手机助手、Deep Research、DeepSeek 联网版、实时视频理解、互动双语视频生成器以及语音实时通话-青青等一系列前沿 AI 工具,引发了 X 用户的广泛热议。

大模型是一场新的搜索战争,OpenAI不会赢家通吃,一家最好被收购!硅谷知名投资人曝料特朗普希望马斯克更积极裁撤美政府预算

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)最近DeepSeek开源周带来了很多惊喜与热议。 但小编发现大家对于马斯克的Grok3的讨论却远远不够充分。 作为“大模型球赛”的最不可捉摸的强大力量,马斯克的xAI最新模型已经上线,便迅速登顶了iPhone的下载排行榜,引起的轰动同样不可小觑。

超越DeepSeek-R1!阿里万相大模型登上全球开源榜首

今日,阿里巴巴股价在盘初阶段出现拉升,一度上涨超过4%,报价达到133.1港元。 这一市场表现与近期阿里巴巴在人工智能领域取得的显著进展密切相关。 据开源社区Hugging Face最新发布的榜单显示,阿里巴巴推出的万相大模型在开源仅6天后,便成功超越了DeepSeek-R1,一举登上了模型热榜和模型空间榜两大重要榜单的榜首。

智谱华章完成超10亿元融资 计划开源新一代大模型

近日,北京智谱华章科技有限公司宣布其最新一轮战略融资金额超过10亿元人民币。 这轮融资的参与方包括杭州城投产业基金和上城资本等,显示了市场对智谱的强大信心与支持。 作为国内最早开源大模型的 AI 公司之一,智谱的目标是在2025年成为其开源发展的关键年份。