大模型
商汤日日新 SenseNova V6 多模态融合大模型发布
“商汤日日新 SenseNova V6”多模态融合大模型于今日发布,具备最长 64K 思维链、数理分析、多模态深度推理、全局记忆等能力,支持 10 分钟的视频推理及深度推理。
大模型“自动修 bug”能力将提升,豆包团队开源首个多语言代码修复基准 Multi-SWE-bench
4 月 10 日消息,豆包大模型团队今日通过官方公众号宣布,首个多语言类 SWE 数据集 Multi-SWE-bench 现已正式开源,可用于评估和提升大模型“自动修 Bug”能力。 在 SWE-bench 基础上,Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言,是真正面向“全栈工程”的评测基准。 其数据均来自 GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。
阿里云刘伟光:AI正在推动各行各业的生产力变革
“阿里云大模型的战略就是服务企业市场创造社会价值,AI正在推动各行各业的生产力变革,通义大模型将深耕企业市场。 ”4月9日,阿里云在京召开AI势能大会,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光称,大模型的社会价值正在企业市场释放,阿里云将坚定投入,打造全栈领先的技术,持续开源开放,为AI应用提速。 近一年多来,通义大模型技术加速迭代,在to B和to C赛道都取得了一些进展,在消费端表现为用户体验的优化,在产业侧表现为生产力的极大提升。
"是我创造了第一个LLM"!Kaggle前首席科学家一句话引发AI学术圈考古行动
论如何在技术圈争论中一句话噎到对方:哥们,是我创造了第一个大语言模型。 发言者Jeremy Howard为澳大利亚昆士兰大学名誉教授、曾任Kaggle创始总裁和首席科学家,现answer.ai与fast.ai创始人,。 事情的起因是有人质疑他最近的项目llms.txt在帮助大模型爬取互联网信息上并没太大作用,从而引发了这段争论,迅速引起众人围观。
大模型+数据分析:下一代智能查询优化体系的先行探索
当你每天面对万亿级数据、日均百万次查询请求时,你会怎么做? 处理海量数据查询犹如在迷雾中寻路,方向稍有不慎就会迷失。 数据负载高到屏幕只显示超时,查询速度慢到让你有时间泡一杯咖啡再来检查结果。
谷歌 Gemini AI 升级文件分析功能,将支持 3GP、AVI、MP4 等 8 种视频格式
科技媒体 Android Authority 今天(4 月 8 日)发布博文,通过分析 APK 文件,发现谷歌 Gemini 即将升级文件分析功能,新增支持 3GP、AVI、FLV 等 8 种视频格式。
谷歌向 Pixel 9 /三星 Galaxy S25 推出 Gemini Live AI“实时拍摄”及识图导购助手功能
谷歌Gemini Live AI推出实时拍摄和识图导购功能,支持Pixel 9和Galaxy S25,可识别物体并比价购物。#谷歌AI##智能手机#
大模型部署工具 Ollama 使用指南:技巧与问题解决全攻略
一、Ollama 是什么? Ollama 是一个开源的本地大模型部署工具,旨在简化大型语言模型(LLM)的运行和管理。 通过简单命令,用户可以在消费级设备上快速启动和运行开源模型(如 Llama、DeepSeek 等),无需复杂配置。
谷歌研究:合成数据使大模型数学推理能力提升八倍
最近,来自谷歌、卡内基梅隆大学和 MultiOn 的联合研究团队发表了一项关于合成数据在大型模型训练中应用的新研究。 据专注于人工智能发展的研究机构 Epoch AI 报告显示,目前全球约有 300 万亿个公开可用的高质量文本训练标记。 然而,随着类似 ChatGPT 这样的大模型的迅猛发展,对训练数据的需求呈指数级增长,预计到 2026 年之前,这些数据将被耗尽。
中国自主量子计算机“本源悟空”全球首次运行十亿级 AI 微调大模型
据《科创板日报》从安徽省量子计算工程研究中心获悉,本源量子、合肥综合性国家科学中心人工智能研究院等机构联合攻关,在中国第三代自主超导量子计算机“本源悟空”真机上,全球首次运行十亿参数 AI 大模型微调任务。
LLM「想太多」有救了!高效推理让大模型思考过程更精简
LLM的推理能力显著增强,然而,这个「超级大脑」也有自己的烦恼。 有时候回答会绕好大一个圈子,推理过程冗长又复杂,虽能得出正确答案,但耗费了不少时间和计算资源。 比如问它「2加3等于多少」,它可能会从数字的概念、加法原理开始,洋洋洒洒说上一大通,这在实际应用中可太影响效率啦。