文章列表
实时高保真人脸编辑方法PersonaMagic,可根据肖像无缝生成新角色、风格或场景图像。
本文经AIGC Studio公众号授权转载,转载请联系出处。 今天给大家介绍的是一个高保真实时人脸编辑方法PersonaMagic,通过分阶段的文本条件调节和动态嵌入学习来优化人脸定制。 该技术利用时序动态的交叉注意力机制,能够在不同阶段有效捕捉人脸特征,从而在生成个性化图像时最大程度地保留身份信息。
AAAI 2025 | IML领域稀疏化视觉Transformer,代码已开源
SparseViT 的主要科研成员来自四川大学吕建成团队,合作方为澳门大学潘治文教授团队。 论文:《Can We Get Rid of Handcrafted Feature Extractors? SparseViT: Nonsemantics-Centered, Parameter-Efficient Image Manipulation Localization through Spare-Coding Transformer》论文链接::,图像处理变得非常方便。
跨年舞台歌手翻车惨烈,AI唱作俱佳,意外圈粉
AI好好用报道编辑:Sia刚刚过去的跨年舞台,依旧延续了群魔乱舞的台风。 假唱早已见怪不怪。 假唱。
OpenAI 阿尔特曼:使用次数远超预期,Pro 高级订阅正处于亏损状态
山姆・阿尔特曼表示,ChatGPT Pro 的订阅价格是他个人选择的,本以为会在这种定价下实现一定盈利。
阿尔特曼称 OpenAI 目标开始转向“超级智能”:有望大幅提升财富和繁荣
OpenAI首席执行官萨姆·阿尔特曼表示,他相信OpenAI“知道如何构建人工通用智能”(AGI),即按照传统定义的AGI,并且已经开始将目标转向“超级智能”。
奥特曼疯狂发推:AGI将至!2025年,第一批智能体成为公司劳动力;回顾OpenAI九年:我们的愿景不会改变,但策略将继续演变!
出品 | 51CTO技术栈(微信号:blog51cto)OpenAI CEO,营销高手,奥特曼又开始疯狂发推了。 首先,他又充当起了AI“谜语人”,给观众一些模棱两可的话。 “接近奇点;不清楚是哪一边”。
刚刚,奥特曼发长文「反思」:十年艰难创业路,如今已掌握AGI秘诀
就在刚刚,奥特曼发出了一篇长文博客,名为「反思」。 这篇博客发得很应景。 就在前不久,奥特曼刚刚接受了彭博社的专访,曝出了不少猛料,包括对OpenAI前董事会的态度、与马斯克的恩怨,以及对川普时代AI走向的看法。
奥特曼回应一切:宫斗、马斯克、ChatGPT两周年
2022 年 11 月 30 日,OpenAI 的网站访问量达到了一个从未有过的峰值。 当时,这家初创公司虽然在业内赫赫有名,但远没摸到大厂门槛,以至于其所有者甚至没有费心去追踪他们的网络流量。 不过今天看来,那是这个公司最后一个「平静」的日子。
仅需一万块钱!清华团队靠强化学习让 7B模型数学打败GPT-4o
OpenAI o1和o3模型的发布证明了强化学习能够让大模型拥有像人一样的快速迭代试错、深度思考的高阶推理能力,在基于模仿学习的Scaling Law逐渐受到质疑的今天,基于探索的强化学习有望带来新的Scaling Law。 近日,清华大学NLP实验室、上海AI Lab、清华大学电子系、OpenBMB社区等团队提出一种新的结合过程奖励的强化学习方法——PRIME(Process Reinforcement through IMplicit REwards)。 采用PRIME方法,研究人员不依赖任何蒸馏数据和模仿学习,仅用8张A100,花费一万块钱左右,不到10天时间,就能高效训练出一个数学能力超过 GPT-4o、Llama-3.1-70B的7B模型 Eurus-2-7B-PRIME。
刚刚,奥特曼更新博客:创业第十年,我的反思
山姆・奥特曼开始反思了。 2025 年到来还不到 1 周时间,在刚刚接受了彭博社专访之后不久,这位著名却又备受争议的 CEO 又发布了一篇题为「反思」的博客文章;其中回顾了 ChatGPT 的发展历程,并尤其强调了 OpenAI 创立以来他们面临的各种「冲突和误解」。 他表示,之前的解雇事件是善良的人进行治理的一个巨大失败(a big failure of governance by well-meaning people)。
「停止雇佣人类」广告牌爆火,OpenAI放惊人言论:每月2000刀,AI淘汰人类!
随着人工智能的日益强大,最令人担心的事情终于还是发生了。 旧金山一家科技公司已经开始明目张胆地宣布「停止雇佣人类」! 就在旧金山密西西比街的一侧,一些酒店从业者为了争取更高待遇与更多工作机会的罢工运动已经持续了数月。
全网都在扒的DeepSeek团队,是清北应届生撑起一片天
DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama 3的开源模型,震撼了整个AI圈。 紧接着,“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻,也使得人们把目光聚焦向DeepSeek的人才。 这下不只科技圈,全网都在好奇,连小红书上都有人发帖询问,这究竟是一只怎样的团队?
Just keep scaling!思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式
关注 AI 领域的人对 Jason Wei 这个名字一定不陌生。 他是 OpenAI 的一位资深研究科学家,也常在 OpenAI 的发布活动中露脸。 更重要的是,他是思维链概念开山之作《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》的第一作者。
你的专属“钢铁侠”助手OS Agents来了!浙大联手OPPO、零一万物等10个机构推出全新综述
电影《钢铁侠》中,托尼·斯塔克的助手贾维斯(J.A.R.V.I.S.)能帮他控制各种系统并自动完成任务,曾让无数观众羡慕不已。 现在,这样的超级智能助手,终于变成现实了! 随着多模态大语言模型的爆发式进化,OS Agents横空出世,它们能无缝操控电脑和手机,为你自动搞定繁琐任务。
动物版谷歌翻译来了?Nature:用AI解码野性的呼唤!
每一种动物都有其独特的历史。 来自加拿大Carleton University的鲸鱼生物学家Shane Gero,花了20年时间试图了解鲸鱼是如何交流的。 比如,同一个家族的鲸鱼会发出特定的声音,而不同区域的抹香鲸(Physeter macrocephalus)有自己的「方言」。
Science子刊 | GPT4、Llama等LLM可以调节粒子加速器?仅50%性能优化,未来可期
编辑 | 萝卜皮粒子加速器的自主调节是一个活跃且具有挑战性的研究领域,其目标是实现先进的加速器技术和尖端的高影响力应用,例如物理发现、癌症研究和材料科学。 但是,自主加速器调节仍然严重依赖经验丰富的熟练操作员的手动操作。 德国亥姆霍兹协会旗下 DESY(Deutsches Elektronen Synchrotron)的研究人员建议使用大型语言模型(LLM)来调整粒子加速器。
OpenAI发布新年目标,Agent智能体或将迎来百模大战
2025年1月1日,OpenAI CEO 奥特曼公布了公司的新年目标,涵盖AGI、智能体、4o升级、模型更好记忆、更长上下文等等。 图片关于智能体,有网友爆料,OpenAI 可能在 1 月份发布一个名为 “operator” 的 Agent,这个 Agent 将具备直接控制电脑的能力。 图片其实24年10月份的时候,Claude 就已经发布了基于 Claude 3.5 Sonnet 多模态大模型,可操作电脑的智能体。
阿里云与零一万物达成战略合作,成立“产业大模型联合实验室” ,加速落地应用
近期,阿里云和大模型头部企业零一万物达成模型平台业务的战略合作,双方将成立“产业大模型联合实验室”,联手加速大模型从技术到应用的落地,进一步扩大产业大模型的生态整合。 据悉,双方深度战略合作的产业大模型联合实验室包含技术、业务、人才等板块,阿里和零一万物将结合两个团队全球顶尖的大模型研发实力,形成从下一代基座模型技术探索到产业落地大模型服务的组合拳,全面通过阿里云百炼大模型平台的模型服务层面向市场,针对 ToB 行业打造更强更全面的大模型解决方案,加速大模型穿透千行百业。 在开展的合作中,阿里云拥有从技术到算力到服务层的平台级完整链条, 通义系列大模型将作为具有强大通用能力的“教师模型”,零一万物拥有国际前沿的高性价比模型能力,能够敏捷批量训练垂直定向的产业智能模型,双方联手将加速大模型的产业落地,拓宽大模型生态前景。