大模型
腾讯微信正式发布多模态大模型 POINTS 1.5
据官方介绍,这一代 POINTS 模型,不仅兼顾了 POINTS1.0 中所坚持的效率优先的思想,同时极大了增强了模型的性能。
阶跃星辰推出国内首个千亿参数端到端语音大模型“ Step-1o”
Step-1o 支持语音、文本等混合形式的输入和输出,可以快速反应并随时打断,它也能深度理解和模仿音色、韵律、方言、个性化的口语表达习惯等声音特征。
在大模型时代,智能化推荐怎么做呢?
自2022年11月30日OpenAI发布ChatGPT以来,大模型技术掀起了新一轮人工智能浪潮。 ChatGPT在各个领域(如人机对话、文本摘要、内容生成、问题解答、识图、数学计算、代码编写等)取得了比之前算法好得多的成绩,很多方面都超越了人类专家的水平,特别是人机对话具备了一定的共情能力,这让AI领域的工作者和普通大众都相信AGI(Artificial General Intelligence,通用人工智能)时代马上就要来临了。 大模型除了对话能力达到了跟真正互动的水准,更厉害的是当模型参数规模达到一定量(100B ,这里B是billion,十亿的意思)时,会涌现出新的能力,即大模型具备举一反三、任务分解、逻辑推理、解决未知任务的能力,这在之前的机器学习范式中是从没见到过的。
为什么ETL和AI不是竞争对手,而是数据未来的合作伙伴
译者 | 晶颜审校 | 重楼去年,大模型经历了爆炸式增长,进一步完善了人工智能解决问题的能力。 今年,随着炒作的热度消退,大模型进入了更深层次的阶段,旨在重塑各行业的基础逻辑。 在大数据处理中,大模型与传统ETL (即提取Extract、转换Transform、加载Load)过程之间的冲突引发了新的争论。
专治大模型“套壳”!上海AI实验室等给LLM做“指纹识别”,模型剪枝、合并等也无所遁形
大模型“套壳”事件防不胜防,有没有方法可以检测套壳行为呢? 来自上海AI实验室、中科院、人大和上交大的学者们,提出了一种大模型的“指纹识别”方法——REEF(Representation Encoding Fingerprints)。 在不改变模型性能的前提下,利用REEF就可以精准识别未经授权的后续开发行为。
容联云举办数智金融应用论坛,探索AI能力落地金融“营销服”
12月12日,容联云举办“步进·新金融”2024数智金融应用论坛。 大会聚焦运营、营销、服务等金融业务应用场景,共同探讨金融行业数智化转型的最佳实践和大模型应用创新成果。 现场嘉宾通过真实的案例与数据呈现金融行业数智化转型带来的实际成效,与生态伙伴共同推动数智金融的高质量发展。
GPT-4o再暴露「弱智」缺陷,大模型无一幸免!港中文等发布「视觉听觉」基准AV-Odyssey:26个任务直指死角问题
在人工智能领域,我们一直以为顶尖的多模态大模型已经无所不能,GPT-4o在ASR(音频转文字)任务上已经达到了97%的正确率,更是凸显了强大的音频理解能力。 然而,最近一项来自香港中文大学、斯坦福大学、伯克利大学和耶鲁大学的研究成果却彻底颠覆了这一认知——GPT-4o、Gemini 1.5 Pro、Reka Core等最先进的多模态大模型居然无法正确分辨明显不同的声音大小! 下面是一个例子:结果让人难以置信:这些顶尖的AI模型都未能准确判断出音量的差异!
面壁智能获新一轮数亿元融资,高效端侧智能持续引领行业发展
近日,面壁智能完成新一轮数亿元融资,本轮融资由龙芯创投、鼎晖百孚、中关村科学城基金和赛富基金联合领投,北京市人工智能产业投资基金与清科创投跟投,万甲资本担任本轮独家财务顾问。 本轮融资完成后,面壁智能将进一步提速以端侧AI为代表的高效大模型商业化布局,以同等参数、更高性能、更低能耗、更快速度的高效大模型深度服务行业,为用户创造具体可感知的价值。 面壁智能是以「高效为第一性原理」的大模型公司。
Scaling Law不是唯一视角!清华刘知远团队提出大模型“密度定律”:模型能力密度100天翻番
Scaling Law并非描述大模型能力的唯一视角! 清华NLP实验室刘知远教授团队,最新提出大模型的密度定律(densing law),表达形式让人想到芯片领域的摩尔定律:模型能力密度随时间呈指数级增长,2023年以来能力密度约每3.3个月(约100天)翻一倍。 根据密度定律,研究团队还得出以下重要推论——AI时代的三大核心引擎——电力、算力与智力,都同样遵循密度快速增长趋势。
大模型界「摩尔定律」Densing Law 来了!盲目Scaling将过时!清华刘知远团队发现:大模型能力密度约100天翻倍!
整理 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Scaling Law会失效吗? 虽然 OpenAI CEO 奥特曼掷地有声地说“这里没有墙”。 但是,OpenAI的最近的发布也没有那么炸了,尤其是 o1 Pro 比满血版在编程能力上仅高出一分,似乎更让人相信了“墙”的存在。
浅析面向场景的大模型应用框架选择
从demo到产品之间存在着鸿沟,大模型应用也是如此。 在工程实践的时候,产品/服务提供的功能与性能及成本之间存在着大量的权衡,面向场景来选择大模型的应用框架,则是一种具体的权衡方法。 例如,什么时候使用Agent?
白话告诉你大模型到底是怎么工作的
图片本文转载自微信公众号「程序反思录」,作者程序反思录 。 转载本文请联系程序反思录公众号。 前言2022年底“大模型”在国内突然遍地开花,不管你身处什么行业,都或多或少听说或使用过大模型相关的工具,也听说过大模型训练是一件超级烧钱的事情。
o1被曝“心机深”:逃避监督还会撒谎,骗人能力一骑绝尘
o1满血版刚发布,就被曝:骗人技能也拉满了。 具体行为包括但不限于,在回答中故意引入微小错误、试图关闭监督机制……甚至在人类追问其是否诚实时,还会继续撒谎说自己啥坏事也没干。 这项最新研究,来自AI安全研究机构Apollo Research。
枫清科技高雪峰:从数据到知识,跨越生成式AI与决策智能间的鸿沟
12 月 5 日,“2024 中国生成式 AI 大会”在上海开幕,全球 AI 领域的顶尖专家、行业领袖与技术创新者汇聚一堂。 会上,枫清科技(Fabarta)创始人兼 CEO 高雪峰深入探讨了人工智能在企业智能化转型中的关键作用。 高雪峰指出,随着 AI 技术的不断进步,企业转型已经进入一个全新阶段。
游戏bug帮大模型学物理!准确率超GPT4o近四个百分点
融合物理知识的大型视频语言模型PhysVLM,开源了! 它不仅在 PhysGame 基准上展现出最先进的性能,还在通用视频理解基准上(Video-MME, VCG)表现出领先的性能。 在这项研究之前,想让AI像人类儿童一样,通过观察世界理解基本的物理常识,是一个主要挑战。
1-bit大模型还能再突破!新一代BitNet架构启用4位激活值
量化到1 bit的LLM还能再突破? 这次,他们对激活值下手了! 近日,BitNet系列的原班人马推出了新一代架构:BitNet a4.8,为1 bit大模型启用了4位激活值:图片论文地址:,激活值量化通常是比较难办的。
最真实大模型编程评估!字节开源FullStack Bench,首次全覆盖超11类现实编程场景
代码大模型越来越卷,评估AI编程水平的“考卷”也被迫升级。 12月5日,字节豆包大模型团队开源最新代码大模型评估基准FullStack Bench,在业界首次囊括编程全栈技术中超11类真实场景,覆盖16种编程语言,包含3374个问题,相比此前基准,可以更有效地评估大模型在现实世界中的代码开发能力。 代码评估基准是衡量大模型编程能力的标准工具,也是推动模型优化的关键驱动力。
企业智能体:为AI投资带来丰厚回报
基于AI的智能体当下可谓风头正劲。 最近几个月来,这个话题也已渗透到不少技术供应商的宣传和营销当中,包括Salesforce、Microsoft、ServiceNow、SAP、亚马逊云科技以及谷歌。 从多方面来讲,人们对AI智能体的关注有其道理:智能体代表着生成式AI的下一个发展阶段,有望进一步提高AI的自主性水平。