文章列表
效率翻倍!6 款不容错过的免费 AI 神器(六)
大家好,我是花生~
今天继续我们的 AI 效率神器推荐第 23 期,内容包括免费的文本转语音工具、AI 写真 / AI 音乐生成工具等。
上期回顾:一、AI 音乐生成模型 Stable Audio Open
在线试玩:
ComfyUI 插件:
之前为大家推荐过 AI 音乐生成工具 Stable Audio,可以通过文本生成时长 3 分钟的高质量音乐。最近 Stability AI 宣布开源 Stable Audio Open 音乐生成模型(授权类型:不可商用),可以通过文本生成鼓点、乐器旋律、环境声音和配音,单
如何用AIGC打造品牌IP?报价6位数的实战项目复盘来了!
大家好,好久不见!随着 AIGC 技术近期的迅猛发展,我们在过去的半年里深入探索了其在商业领域的多元应用。今天,我非常兴奋地与大家分享一个案例——我们最近为一家顶尖食品企业全方位打造的品牌IP。希望通过这次分享,能够启发并助力大家在AIGC领域取得更多成就。
往期推荐:一、作为视觉设计师,如何有效应对品牌升级需求
在过去,我认为品牌设计遵循着一套固定的流程:从市场调研到策略制定,再到视觉呈现。我们经常讨论和分享品牌升级的各种策略和见解。在这个专业领域中,很多人(包括我自己)曾认为掌握一套成熟的方法论和积累商业案例是
保姆级教程!如何用Midjourney快速生成版画人像Logo?
这篇教程主要是教你用垫图法来生成一个版画风格的人像 Logo—iw 参数(控制垫图权重)
数值一半是 0.5-1-1.5-2 数值越小与垫图越相似
—quality 参数(控制图片质量)
默认值是 1 最高为 5 越低细节越低
在使用 midjourney 辅助设计这款人物标志的过程中,需要不断优化提示词,才能得到满意的处理。
垫图在此次学习中非常关键,图片的后期矢量化处理主要在简化人物的细节和整合色彩,才能做到更符合商业视觉化的要求。
最后,最近用能接受 MJ 素材图的商业需求变多了,成功变现了几个案子赚到钱就更
俄罗斯科技巨头 Yandex 宣布开源“YaFSDP”大语言模型训练工具:大幅提升 GPU 利用率,对 Llama 3 可实现 26% 加速
俄罗斯科技巨头 Yandex 推出了一款开源的大语言模型训练工具 ——YaFSDP,号称与现有工具相比速度最高可提升 26%。据介绍,YaFSDP 在训练速度方面优于传统的 FSDP 方法,尤其适用于大型模型。在预训练 LLM 方面,YaFSDP 速度提高了 20%,并且在高内存压力条件下表现更佳。例如,YaFSDP 对具有 700 亿参数的 Llama 2 可以实现 21% 的效率提升,对具有同级参数的 Llama 3 也实现 了 26% 的效率提升。IT之家附官方数据一览:模型gpu-countseq-lenn
Yandex 开源 LLM 训练工具节省高达 20% 的 GPU 资源
跨国科技公司 Yandex 最近推出了 YaFSDP,这是一种用于训练大型语言模型 (LLM) 的开源方法。YaFSDP 是目前最有效的公开可用工具,用于增强 GPU 通信并减少 LLM 训练中的内存使用量,与 FSDP 相比,其训练速度提升最高可达 26%,具体取决于架构和参数数量。通过使用 YaFSDP 减少 LLM 的训练时间可以节省高达 20% 的 GPU 资源。Yandex 承诺为全球人工智能社区的发展做出贡献,将YaFSDP开源提供给全球的 LLM 开发人员和人工智能爱好者即是履行此承诺的其中一步。“目
预测准确率达95.7%,ChatMOF利用LLM预测和生成金属有机框架
编辑 | X金属有机框架(MOF)因其孔隙率大、表面积大和出色的可调性而用于许多化学应用。然而,在利用 AI 深入探索 MOF 设计与性能优化的研究征途中,科学家们正面临着前所未有的挑战。去年 3 月,韩国科学技术院(Korea Advanced Institute of Science and Technology,KAIST)的研究人员提出的 MOFTransformer 模型经过一百万个假设的 MOF 的预训练,在预测各种属性方面表现出色。近日,KAIST 团队提出了一种 AI 系统——ChatMOF,用于预
视觉语言模型导论:这篇论文能成为你进军VLM的第一步
近些年,语言建模领域进展非凡。Llama 或 ChatGPT 等许多大型语言模型(LLM)有能力解决多种不同的任务,它们也正在成为越来越常用的工具。这些模型之前基本都局限于文本输入,但现在也正在具备处理视觉输入的能力。如果能将视觉与语言打通,那么势必能造就多种多样的应用 —— 这实际上也正是当前 AI 技术革命的关键方向。即便现在已有不少研究将大型语言模型扩展到了视觉领域,但视觉与语言之间的连接尚未被彻底打通。举些例子,大多数模型都难以理解空间位置关系或计数 —— 这还需要复杂的工程设计并依赖额外的数据标注。许多视
夺冠!卓世AI斩获全球顶会AAMAS 2024 CE 竞赛冠军
近日,在全球瞩目的AAMAS 2024 Computational Economics Competition(计算经济学挑战赛)上,卓世科技人工智能前沿实验室团队“Zhuoshi Technology AI Cutting-edge Laboratory”一举夺得两个核心赛道的冠军和亚军,展现出其在计算经济学和人工智能领域的强大竞争力。冠军证书亚军证书AAMAS 2024 是第23届国际自主智能体和多智能体系统会议(International Conference on Autonomous Agents and
OpenAI 官宣新任首席财务官、首席产品官,并与苹果达成合作
感谢OpenAI 今日官宣聘请了两名高管,并与苹果建立合作伙伴关系。该公司在博客文章中宣布,Nextdoor 前首席执行官兼 Square 财务总监 Sarah Friar 将加入公司,担任首席财务官(CFO)。Friar 还是斯坦福大学数字经济实验室的联合主席。此外,Kevin Weil 加入 OpenAI 担任首席产品官(CPO)。他将领导一个产品团队,专注于将研究应用于消费者、开发者和企业的产品和服务。他曾经担任 Planet Labs 前总裁、Twitter 产品高级副总裁、Facebook 和 Insta
Copilot Pro 订阅魅力下降,微软 7 月 10 日下线用户自建 GPT 服务
微软今天发布公告,宣布 Copilot Pro 服务将移除 GPT Builder,意味着订阅用户无法继续创建自己的 Copilot GPT。GPT Builder 也称为 Copilot GPT,订阅 Copilot Pro 的用户可以使用文档、外部或内部资源以及自定义指令创建自己的 Copilot GPT。Copilot Pro 是售价 20 美元的 Microsoft Copilot 订阅版本,具有一些附加功能,如 GPT 生成器和 Copilot 在 Word、Excel、PowerPoint 和 Outl
不只 ChatGPT,苹果希望将谷歌 Gemini 等其他 AI 模型也添加到 iOS 18 中
在宣布与 OpenAI 旗下的 ChatGPT 达成合作后,苹果软件工程高级副总裁 Craig Fedrighi 在 WWDC24 开发者大会上确认了与其它第三方模型合作的计划。Fedrighi 在主题演讲后的采访中透露:“我们期待在未来与其它 AI 模型集成,例如谷歌的 Gemini。”OpenAI 的 ChatGPT 将在今年晚些时候成为第一个集成至苹果系统的 AI 模型。Fedrighi 特别提到,苹果希望最终让用户在不同的 AI 大模型之间进行选择,从而与 Apple Intelligence 一起使用。而
Karpathy最新四小时视频教程:从零复现GPT-2,通宵运行即搞定
这是Karpathy「Neural Networks:zero to hero」系列视频的最新内容。AI 大牛 Andrej Karpathy 又「上新」了,这次一口气放出了长达四个小时的视频。视频主题为「让我们来复现 GPT-2(1.24 亿参数)」。Karpathy 表示,此次视频之所以这么长,是因为它很全面:从空文件开始,最后得到一个 GPT-2(124M)模型。具体实现步骤包括如下:首先构建 GPT-2 网络。然后对其进行优化,以便快速训练。然后通过参考 GPT-2 和 GPT-3 论文来设置训练运行优化和
从LLM中完全消除矩阵乘法,效果出奇得好,10亿参数跑在FPGA上接近大脑功耗
让语言模型「轻装上阵」。一直以来,矩阵乘法(MatMul)稳居神经网络操作的主导地位,其中很大原因归结为 GPU 专门针对 MatMul 操作进行了优化。这种优化使得 AlexNet 在 ILSVRC2012 挑战赛中一举胜出,成为深度学习崛起的历史性标志。在这当中,有个值得注意的点是,AlexNet 利用 GPU 来提高训练速度,超越了 CPU 的能力,至此,GPU 的加入使得深度学习仿佛赢得了「硬件彩票」。尽管 MatMul 在深度学习中很流行,但不得不承认的是它占据了计算开销的主要部分,主要表现为 MatMu
深度解析!Midjourney 三大常用参数 --s/c/w 的区别与使用技巧
大家好,这里是和你们一起探索 AI 的花生~
之前为大家推荐了很多期 midjourney 提示词,然后有小伙伴问我推荐的提示词后跟着的参数,比如 --s 250、--c 6 等,是随便添加的还是有意识地用它们控制出图效果;如果是有意识的,又是如何确定使用哪一项参数和具体数值的。那今天就专门开一篇文章,为大家详细介绍一下 Midjourney 的三大常用参数 stylize、chaos 和 werid 的区别以及使用技巧 (本文中仅讨论仅限于目前最新的 v6 版本) 。
相关推荐:一、--Stylize 风格化
S
两句话,让 LLM 逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出 GPT、Claude 等重大缺陷
感谢IT之家网友 刺客 的线索投递!在基准测试上频频屠榜的大模型们,竟然被一道简单的逻辑推理题打得全军覆没?最近,研究机构 LAION 的几位作者共同发表了一篇文章,以「爱丽丝梦游仙境」为启发涉及了一系列简单的推理问题,揭示了 LLM 基准测试的盲区。一道简单的逻辑问题,竟让几乎所有的 LLM 全军覆没?对于人类来说,这个名为「爱丽丝梦游仙境」(AIW)的测试并不算很难 ——「爱丽丝有 N 个兄弟,她还有 M 个姐妹。爱丽丝的兄弟有多少个姐妹?」只需稍加思考,答案显而易见:M 1。(爱丽丝拥有的姐妹数量,再加上爱丽
语音克隆技术引发担忧,OpenAI 再次解释其文本转语音工具
OpenAI 在几个月内第二次就其文本转语音工具进行解释,并再次强调该工具目前并未大范围开放,且未来也可能不会。图源 Pexels“无论我们最终是否会大规模部署这项技术,让世界各地的人们理解这项技术的发展方向都非常重要,”OpenAI 公司周五在其网站上发布的一份声明中表示,“这就是为什么我们想要解释模型的运作方式、我们如何将其用于研究和教育,以及我们如何围绕该技术实施安全措施的原因。”据IT之家了解,去年年底,OpenAI 与一小部分外部用户分享了其“语音引擎”。该引擎利用文本输入和 15 秒的人声音频剪辑,即可
OpenAI 旧金山办公室被指神秘兮兮,便衣保安引周边商户不安
位于旧金山的 OpenAI 人工智能公司因其办公室的安保措施引起周边商户的不安。据《旧金山标准报》报道,该公司办公室里到处都是便衣保安,他们对来自邻居的询问守口如瓶,这种神秘兮兮的气氛让周边商户感到不安。《旧金山标准报》的摄影记者最近注意到,OpenAI 办公楼外有可疑人员站岗,身着黑色棒球帽、太阳镜,并隐蔽地佩戴着耳机,看起来像是便衣保安。附近 In-Symmetry Spa 美容院的老板坎达斯・科姆斯 (Candace Combs) 称,她曾询问过这些可疑人员的工作单位和所在的公司,但他们都拒绝透露任何信息。据
成功率达 53%,研究显示 GPT-4 可自主利用“零日”漏洞攻破网站
据 NewAtlas 报道,研究人员利用自主协作的 GPT-4 机器人小组成功入侵了一半以上的测试网站,这些机器人可以自主协调行动并根据需要生成新的“帮手”。更令人吃惊的是,他们利用的是以前未知的、现实世界中从未公开的“零日”漏洞(zero-day vulnerabilities)。图源 Pexels早在几个月前,同一批研究人员就发表了一篇论文,声称他们能够使用 GPT-4 自动利用“N day”漏洞,即业界已知但尚未修复的漏洞。实验中,GPT-4 仅凭已知的常见漏洞和披露列表 (CVE),就能自主利用其中 87%