模型
Ilya错了,预训练没结束!LeCun等反击,「小模型时代」让奥特曼预言成真
最近,Ilya在NeurIPS 2024中宣布:预训练结束了! 在他看来,数据如同化石燃料般难以再生,因此训练模型需要的海量数据即将枯竭。 作为前OpenAI首席科学家,Ilya的这番话,有可能影响之后数十年的AI发展方向。
世界模型进入4D时代!单视角视频构建的自由视角4D世界来了
人工智能技术正以前所未有的速度改变着我们对世界的认知与构建方式。 近期,李飞飞教授团队通过单张图片生成三维物理世界的研究,再次向世界展示了空间智能技术的巨大潜力。 单图生成三维世界,不仅让人们能以交互方式探索静态图像,更标志着 AI 在重建与理解物理场景方面迈入全新阶段。
Bengio参与的首个《AI安全指数报告》出炉,最高分仅C、国内一家公司上榜
图片安全话题,在人工智能(AI)行业一向备受关注。 尤其是诸如 GPT-4 这样的大语言模型(LLM)出现后,有不少业内专家呼吁「立即暂停训练比 GPT-4 更强大的人工智能模型」,包括马斯克在内的数千人纷纷起身支持,联名签署了一封公开信。 这封公开信便来自生命未来研究所(Future of Life Institute),该机构由麻省理工学院教授、物理学家、人工智能科学家、《生命 3.0》作者 Max Tegmark 等人联合创立,是最早关注人工智能安全问题的机构之一,其使命为 “引导变革性技术造福生活,避免极端的大规模风险”。
26岁OpenAI举报人疑自杀!死前揭ChatGPT训练黑幕
就在刚刚,消息曝出:OpenAI吹哨人,在家中离世。 曾在OpenAI工作四年,指控公司侵犯版权的Suchir Balaji,上月底在旧金山公寓中被发现死亡,年仅26岁。 旧金山警方表示,11月26日下午1时许,他们接到了一通要求查看Balaji安危的电话,但在到达后却发现他已经死亡。
微软出招!新模型数学超GPT-4o编程胜Llama3.3,训练新范式引热议:midtraining
OpenAI谷歌天天刷流量,微软也坐不住了,推出最新小模型Phi-4。 参数量仅14B,MMLU性能就和Llama 3.3/ Qwen2.5等70B级别大模型坐一桌。 数学能力上,Phi-4在美国数学竞赛AMC 10/12上超过了GPT-4o等一众大模型,分数冲上90。
扩散模型=流匹配?谷歌DeepMind博客深度详解这种惊人的等价性
扩散模型和流匹配实际上是同一个概念的两种不同表达方式吗? 从表面上看,这两种方法似乎各有侧重:扩散模型专注于通过迭代的方式逐步去除噪声,将数据还原成清晰的样本。 而流匹配则侧重于构建可逆变换系统,目标是学习如何将简单的基础分布精确地映射到真实数据分布。
谷歌成功狙击 OpenAI:ChatGPT Vision 深夜紧急上线,OpenAI 还能守住江山吗
昨天谷歌放大招发布Gemini 2并提供免费服务后,OpenAI 今天(12天发布会Day6)紧随其后,推出了鸽了很久的 ChatGPT Vision 功能,为用户带来更丰富的多模态交互体验。 除了原有的高级语音模式外,现在你可以与 ChatGPT 进行视频通话、共享屏幕,也可以与圣诞老人实时互动! 11分钟发布会乏善可陈,感觉有点拉先说重点:ChatGPT Vision 有哪些新功能?
看3.2亿帧视频学会3D生成,智源开源See3D:只需单图即可生成3D场景
近日,著名AI学者、斯坦福大学教授李飞飞团队WorldLabs推出首个「空间智能」模型,仅输入单张图片,即可生成一个逼真的3D世界,这被认为是迈向空间智能的第一步。 几乎同时,国内智源研究院推出了首个利用大规模无标注的互联网视频学习的3D生成模型See3D—See Video, Get 3D。 △See3D支持从文本、单视图和稀疏视图到3D的生成,同时还可支持3D编辑与高斯渲染不同于传统依赖相机参数(pose-condition)的3D生成模型,See3D采用全新的视觉条件(visual-condition)技术,仅依赖视频中的视觉线索,生成相机方向可控且几何一致的多视角图像。
AI 视频生成王者 Sora 上线:OpenAI 的“魔法棒”,1080P@20 秒具象化你的想象力
OpenAI 公司昨日(12 月 9 日)发布博文,宣布正式推出 Sora 文生视频 AI 模型,邀请 ChatGPT Plus 和 ChatGPT Pro 用户,通过访问 sora.com 网站,生成最高分辨率 1080p、时长达 20 秒的视频,并支持宽屏、竖屏和方形比例。
大模型界「摩尔定律」Densing Law 来了!盲目Scaling将过时!清华刘知远团队发现:大模型能力密度约100天翻倍!
整理 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Scaling Law会失效吗? 虽然 OpenAI CEO 奥特曼掷地有声地说“这里没有墙”。 但是,OpenAI的最近的发布也没有那么炸了,尤其是 o1 Pro 比满血版在编程能力上仅高出一分,似乎更让人相信了“墙”的存在。
OpenAI的12天王炸计划:技术狂欢还是资本闹剧?
大家好,我是下李哥。 最近硅谷又炸锅了! OpenAI这波操作,简直是要把全网AI玩家都整得神经兮兮的。
奥特曼披露ChatGPT周活3亿+,痛悔OpenAI无知选择“非营利”
OpenAI最新交互数据,就这么水灵灵被奥特曼全抖出来了:每周超过3亿活跃用户每天用户们在上面发送10亿条消息130万美国开发者使用OpenAI开发,全球数量更庞大用户快速增长和频繁使用带来的计算量剧增,OpenAI自己都没预料到。 奥特曼亲口表示,如果当时知道这些,OpenAI一开始就不会选择非营利结构。 以上,是OpenAI CEO奥特曼在刚刚结束的2024年纽约时报DealBook峰会上接受采访时的最新发言。
刷屏了!Genie 2开启文生游戏时代,可交互的世界模型震撼登场!背后团队曝光;OpenAI年底冲业绩,12天直播能否截胡老对手
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)AI公司年底要冲业绩了! 一觉醒来,OpenAI宣布了未来12天的直播活动,而老对手谷歌直接发布了Genie 2,宣布在世界模型方面又迈出重要一步! 图片但,至少今天是谷歌更胜一筹——Genie 2是在太令人印象深刻了!
破案了!ChatGPT拒绝说出ta的名字,原因竟是……
这个名字,ChatGPT拒绝说出。 如果你试图写出它的名字,那么聊天就会立即结束。 背后是什么原因?
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
刚刚,恶意攻击字节训练集群的实习生田柯宇,获得了NeurIPS 2024的最佳论文奖。 更巧的是,这篇获奖论文,恰恰就是他在字节商业化技术部门实习期间与团队合作发表的。 甚至,这篇论文还是NeurIPS 2024第六高分的论文(7,8,8,8)。
清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%
我们都知道,在科研界,LLM在解决简单科学问题时表现得游刃有余,但在应对复杂问题时往往会出现幻觉。 于是,为了让模型更靠谱,研究人员尝试给模型装上科学工具,帮助它们解决高难度任务。 然而,一旦用上工具,模型就「上瘾」了!
NeurIPS 2024|杜克大学&谷歌提出SLED解码框架,无需外部数据与额外训练,有效缓解大语言模型幻觉,提高事实准确性
此项研究成果已被 NeurIPS 2024 录用。 该论文的第一作者是杜克大学电子计算机工程系的博士生张健一,其主要研究领域为生成式 AI 的概率建模与可信机器学习,导师为陈怡然教授。 大语言模型(LLM)在各种任务上展示了卓越的性能。
美欧亚三洲开发者联手,全球首个组团训练的大模型来了,全流程开源
11 月 22 日,Prime Intellect 宣布通过去中心化方式训练完成了一个 10B 模型。 30 号,他们开源了一切,包括基础模型、检查点、后训练模型、数据、PRIME 训练框架和技术报告。 据了解,这应该是有史以来首个以去中心化形式训练得到的 10B 大模型。