大模型
大模型超强内存优化:成本削减高达75%,性能不减弱!成果出自日本一初创AI公司之手;网友:电力可能够用了!
出品 | 51CTO技术栈(微信号:blog51cto)一项逆天的大模型优化技术来了! 东京初创公司Sakana AI的研究人员开发了一种新技术,让大模型能够更有效地使用内存,不仅最多节省75%的内存占用,还甚至性能也有所提升! 这种名为“通用Transformer内存”的技术使用特殊的神经网络优化LLM,保留重要的信息并丢弃冗余的细节。
12/18/2024 1:24:55 PM
百度关于大模型在研发领域落地的深度思考
一、智能研发工具的发展首先来看一下智能研发工具的发展历程和方向。 智能化的发展背景与落地诉求早期的智能化工具,如 GitHub 的 Copilot 工具,大约在两年半前推出。 最初,Copilot 的主要功能是在开发者编写代码时提供自动补全建议。
12/18/2024 8:33:01 AM
张立理
AI大模型时代,人才的需求已经变了
什么是 AI 发展的第一驱动力? 最近,全球科技大厂都在用行动告诉我们:人才。 本月初,谷歌 NotebookLM 的核心团队共同宣布离职创业,他们新公司的网站已经进入了「建设中」的状态。
12/17/2024 9:08:00 PM
机器之心
华为诺亚解析:推荐系统的技术演进及大模型应用实践
一、推荐系统问题和背景首先来简要介绍一下个性化推荐系统。 实际上,我们每个人每天都在与众多推荐系统进行交互。 例如,购买衣物、阅读新闻或聆听音乐时,我们打开的每一个应用程序或网页,其展示的内容即为推荐系统所呈现。
12/17/2024 8:11:27 AM
刘卫文
全球首个全模态理解开源端模型:长语音自动总结,图文音啥都会!300%推理速度领先,来自无问芯穹
全球首个端侧全模态理解开源模型来了! 在菜单里帮忙选奶茶,不在话下:还能帮忙轻松提炼长语音,再也不用对着一串几十秒语音头皮发麻(doge)。 就在刚刚,无问芯穹宣布开源目前世界上首个端侧全模态理解的开源模型Megrez-3B-Omni,不仅体积轻巧,速度飞快,更是一个多才多艺的全能选手,能够轻松处理图片、音频、文本三种模态数据。
12/16/2024 4:10:15 PM
细节表现超Sora,网友:真正的国产之光!MiniMax视频模型再上新
3 个月前,MiniMax 发布了首款 AI 高清视频生成模型 Abab-video-1。 只用了 5 周时间,海螺 AI 的网页版访问量便增速超 800%,还登上了 AI 产品榜当月全球增速榜、国内增速榜双榜单 TOP 1。 一时间,不少国内网友直呼其为“国产之光”。
12/16/2024 2:04:00 PM
郑佳美
王小川当场自曝:为什么百川不做Sora;生命科学是下一个互联网;大模型创业有两大误区;AGI5年后就会到来;如何从投资人拿到融资
编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)王小川不止搞大模型,这次真的要在医疗行业搞出大动静来了! 12月14日上午,百川智能王小川在与极客公园创始人张鹏进行了一场圆桌对话。 对话中,王小川公开透露了进入下半年来,有些低调的百川究竟在做什么事情,更是抖出了很多有关百川智能成立前后的趣事,比如百川的“百”是怎么得来的,以及如何跑步入场赢得投资人信任、拿到融资的,并详细阐述了在中美博弈的环境下,自己在大模型和业务场景如何做考量的创始人逻辑,信息密度很大。
12/16/2024 9:21:24 AM
言征
专治大模型“套壳”!上海AI实验室等给LLM做“指纹识别”,剪枝合并也无所遁形
大模型“套壳”事件防不胜防,有没有方法可以检测套壳行为呢? 来自上海AI实验室、中科院、人大和上交大的学者们,提出了一种大模型的“指纹识别”方法——REEF(Representation Encoding Fingerprints)。 在不改变模型性能的前提下,利用REEF就可以精准识别未经授权的后续开发行为。
12/16/2024 7:05:00 AM
腾讯微信正式发布多模态大模型 POINTS 1.5
据官方介绍,这一代 POINTS 模型,不仅兼顾了 POINTS1.0 中所坚持的效率优先的思想,同时极大了增强了模型的性能。
12/14/2024 7:02:05 PM
问舟
阶跃星辰推出国内首个千亿参数端到端语音大模型“ Step-1o”
Step-1o 支持语音、文本等混合形式的输入和输出,可以快速反应并随时打断,它也能深度理解和模仿音色、韵律、方言、个性化的口语表达习惯等声音特征。
12/14/2024 5:44:41 PM
浩渺
在大模型时代,智能化推荐怎么做呢?
自2022年11月30日OpenAI发布ChatGPT以来,大模型技术掀起了新一轮人工智能浪潮。 ChatGPT在各个领域(如人机对话、文本摘要、内容生成、问题解答、识图、数学计算、代码编写等)取得了比之前算法好得多的成绩,很多方面都超越了人类专家的水平,特别是人机对话具备了一定的共情能力,这让AI领域的工作者和普通大众都相信AGI(Artificial General Intelligence,通用人工智能)时代马上就要来临了。 大模型除了对话能力达到了跟真正互动的水准,更厉害的是当模型参数规模达到一定量(100B ,这里B是billion,十亿的意思)时,会涌现出新的能力,即大模型具备举一反三、任务分解、逻辑推理、解决未知任务的能力,这在之前的机器学习范式中是从没见到过的。
12/13/2024 8:54:42 AM
刘强
为什么ETL和AI不是竞争对手,而是数据未来的合作伙伴
译者 | 晶颜审校 | 重楼去年,大模型经历了爆炸式增长,进一步完善了人工智能解决问题的能力。 今年,随着炒作的热度消退,大模型进入了更深层次的阶段,旨在重塑各行业的基础逻辑。 在大数据处理中,大模型与传统ETL (即提取Extract、转换Transform、加载Load)过程之间的冲突引发了新的争论。
12/13/2024 8:00:00 AM
晶颜
专治大模型“套壳”!上海AI实验室等给LLM做“指纹识别”,模型剪枝、合并等也无所遁形
大模型“套壳”事件防不胜防,有没有方法可以检测套壳行为呢? 来自上海AI实验室、中科院、人大和上交大的学者们,提出了一种大模型的“指纹识别”方法——REEF(Representation Encoding Fingerprints)。 在不改变模型性能的前提下,利用REEF就可以精准识别未经授权的后续开发行为。
12/13/2024 7:39:22 AM
容联云举办数智金融应用论坛,探索AI能力落地金融“营销服”
12月12日,容联云举办“步进·新金融”2024数智金融应用论坛。 大会聚焦运营、营销、服务等金融业务应用场景,共同探讨金融行业数智化转型的最佳实践和大模型应用创新成果。 现场嘉宾通过真实的案例与数据呈现金融行业数智化转型带来的实际成效,与生态伙伴共同推动数智金融的高质量发展。
12/12/2024 7:53:00 PM
新闻助手
GPT-4o再暴露「弱智」缺陷,大模型无一幸免!港中文等发布「视觉听觉」基准AV-Odyssey:26个任务直指死角问题
在人工智能领域,我们一直以为顶尖的多模态大模型已经无所不能,GPT-4o在ASR(音频转文字)任务上已经达到了97%的正确率,更是凸显了强大的音频理解能力。 然而,最近一项来自香港中文大学、斯坦福大学、伯克利大学和耶鲁大学的研究成果却彻底颠覆了这一认知——GPT-4o、Gemini 1.5 Pro、Reka Core等最先进的多模态大模型居然无法正确分辨明显不同的声音大小! 下面是一个例子:结果让人难以置信:这些顶尖的AI模型都未能准确判断出音量的差异!
12/11/2024 1:30:00 PM
新智元
面壁智能获新一轮数亿元融资,高效端侧智能持续引领行业发展
近日,面壁智能完成新一轮数亿元融资,本轮融资由龙芯创投、鼎晖百孚、中关村科学城基金和赛富基金联合领投,北京市人工智能产业投资基金与清科创投跟投,万甲资本担任本轮独家财务顾问。 本轮融资完成后,面壁智能将进一步提速以端侧AI为代表的高效大模型商业化布局,以同等参数、更高性能、更低能耗、更快速度的高效大模型深度服务行业,为用户创造具体可感知的价值。 面壁智能是以「高效为第一性原理」的大模型公司。
12/11/2024 9:17:00 AM
新闻助手
Scaling Law不是唯一视角!清华刘知远团队提出大模型“密度定律”:模型能力密度100天翻番
Scaling Law并非描述大模型能力的唯一视角! 清华NLP实验室刘知远教授团队,最新提出大模型的密度定律(densing law),表达形式让人想到芯片领域的摩尔定律:模型能力密度随时间呈指数级增长,2023年以来能力密度约每3.3个月(约100天)翻一倍。 根据密度定律,研究团队还得出以下重要推论——AI时代的三大核心引擎——电力、算力与智力,都同样遵循密度快速增长趋势。
12/10/2024 7:00:00 AM
大模型界「摩尔定律」Densing Law 来了!盲目Scaling将过时!清华刘知远团队发现:大模型能力密度约100天翻倍!
整理 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Scaling Law会失效吗? 虽然 OpenAI CEO 奥特曼掷地有声地说“这里没有墙”。 但是,OpenAI的最近的发布也没有那么炸了,尤其是 o1 Pro 比满血版在编程能力上仅高出一分,似乎更让人相信了“墙”的存在。
12/9/2024 5:20:29 PM
伊风
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
苹果
人形机器人
深度学习
AI视频
模态
xAI
驾驶
字节跳动
文本
搜索
大语言模型
Claude
Copilot
具身智能
神器推荐
LLaMA
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
训练
大型语言模型