字节整活!1.58比特FLUX:手机也能流畅运行的顶尖AI画图神器来了

自字节跳动和POSTECH的研究团队发布了一项名为“1.58-bit FLUX”的突破性研究成果,该成果成功将最先进的文本到图像(T2I)生成模型FLUX.1-dev的权重参数量化至1.58比特,同时保持了生成1024x1024图像的质量,为在资源受限的移动设备上部署大型T2I模型开辟了新的道路,这项研究成果已发布在arXiv上,并配有开源代码库(代码目前还没有上传)AI画图模型也能“减肥”? 简单来说,就是把 FLUX(由Stable Diffusion作者团队成立的黑森林实验室Black Forest Lab推出) 的超强AI画图模型进行了“压缩”。 大家都知道,现在的AI画图模型,像DALLE 3、Stable Diffusion 3、Midjourney等,展现出强大的图像生成能力,在现实应用中潜力巨大。

自字节跳动和POSTECH的研究团队发布了一项名为“1.58-bit FLUX”的突破性研究成果,该成果成功将最先进的文本到图像(T2I)生成模型FLUX.1-dev的权重参数量化至1.58比特,同时保持了生成1024x1024图像的质量,为在资源受限的移动设备上部署大型T2I模型开辟了新的道路,这项研究成果已发布在arXiv上,并配有开源代码库(代码目前还没有上传)

图片

AI画图模型也能“减肥”?

简单来说,就是把 FLUX(由Stable Diffusion作者团队成立的黑森林实验室Black Forest Lab推出) 的超强AI画图模型进行了“压缩”。大家都知道,现在的AI画图模型,像DALLE 3、Stable Diffusion 3、Midjourney等,展现出强大的图像生成能力,在现实应用中潜力巨大。然而,这些模型动辄数十亿的参数量和高昂的推理内存需求,使其难以在手机等移动端设备上部署

这就好比,你想用手机拍个8K超清电影,结果手机内存直接爆了,这不就尴尬了?

而 FLUX 这个模型,本来就已经很厉害了,现在又被“压缩”成了 1.58-bit FLUX,体积直接缩小了 7.7倍!这意味着,以后在手机上跑这些超强AI画图模型,不再是梦!

1.58-bit是啥?听起来很高端的样子

研究团队选择了开源且性能优异的FLUX.1-dev模型作为量化目标,探索了极低比特量化方案。通过将模型中99.5%的视觉Transformer参数量化至1.58比特,即限制参数值为{-1, 0, +1},并开发了专门针对1.58比特运算的定制化内核,1.58-bit FLUX在模型大小、推理内存和推理速度上都取得了显著的提升

其实,“1.58-bit”可以理解为一种超级高效的“打包”方式。你可以把AI模型的参数想象成一个个小积木,原本这些积木可能有很多种颜色、很多种形状。而“1.58-bit”就像是一个神奇的收纳盒,它把这些积木简化成了只有三种:“-1”、“0”和“+1”。

这样一来,原本需要很大空间才能存放的积木,现在用一个小小的盒子就能装下,而且这些积木还能拼出和原来几乎一样的图案!这波操作,是不是很像你平时用的压缩软件?只不过,这是针对AI模型做的超级压缩!

核心技术及创新

1. 数据无关的1.58比特量化: 与以往需要图像数据或混合精度方案的量化方法不同,1.58-bit FLUX的量化过程完全不依赖图像数据,仅通过对FLUX.1-dev模型进行自监督即可完成。这大大简化了量化流程,使其更具普适性

2. 定制化1.58比特运算内核: 为了进一步提升推理效率,研究团队开发了针对1.58比特运算优化的内核。该内核显著降低了推理时的内存占用,并提升了推理速度

实验结果及分析

实验结果表明,1.58-bit FLUX实现了以下显著提升:

• 模型存储减少7.7倍: 由于权重被量化为2比特有符号整数,模型存储空间大幅下降

• 推理内存减少5.1倍: 在各种GPU类型上,推理内存使用量均有显著降低,在A10-24G等资源受限的设备上尤为明显

• 推理速度提升: 特别是在L20和A10等性能较低的GPU上,推理速度提升高达13.2%图片

“压缩”过的模型,画质会打折吗?

这可能是大家最关心的问题了。毕竟,如果画质变差了,那“瘦身”还有啥意义呢?

放心,研究团队早就想到了这一点!他们在 GenEval 和 T2I Compbench 这两个超权威的测试平台上,对“压缩”前后的模型进行了严格的对比测试。结果表明,1.58-bit FLUX 的画质,和原来几乎一模一样!

图片

论文里还放出了大量的对比图,比如“一只在图书馆里行走的海水猫”、“一条在城市上空盘旋的火龙”等等,这些天马行空的画面,1.58-bit FLUX 都能轻松驾驭,细节满满,效果惊艳!

图片

图片

这黑科技,到底有什么用?

这项技术,最大的意义在于,它让我们看到了 在手机上运行大型AI画图模型的可能性! 以前,我们只能在电脑上,甚至是用专业的服务器才能体验到AI画图的乐趣。现在,随着 1.58-bit FLUX 的出现,未来我们也许只需要一部手机,就能随时随地进行AI创作!

相关资讯

Meta 发布新 AI 模型:利用 AI 来评估 AI 的能力,无需人类参与

据路透社报道,Meta 当地时间周五宣布,其研究团队推出了一系列新的 AI 模型,其中包括一个名为“自我训练评估器”的工具。该工具有望推动 AI 开发过程中减少对人类干预的依赖。这个工具早前在 8 月的论文中首次亮相,其使用与 OpenAI 新发布的 o1 模型类似的“思维链”技术,让 AI 对模型的输出做出可靠判断。

剑桥计算机博士推荐,毕业之前,我需要掌握这9个工具

无论你在创业还是在做学术研究,这些工具都将使你的技能更上一层楼。 ​

Nature | 一场人工智能革命正在医学领域酝酿,它会是什么样子?

编辑 | 绿萝10 月 24 日,《Nature》发布了一篇题为《An AI revolution is brewing in medicine. What will it look like?》的新闻专稿。文章指出 AI 模型应用于医疗的当前局限性,新兴的通才模型可以克服第一代机器学习工具在临床使用中的一些局限性。为了解决医学人工智能工具的一些局限性,研究人员一直在探索具有更广泛功能的医学人工智能。并介绍了一些大型科技公司在医疗成像的基础模型。Jordan Perchik 在美国阿拉巴马大学伯明翰分校(The U