文章列表
AIGC大厂实战!京东家政如何将AI融入设计流程?
AIGC作为现阶段设计领域的潮流风向标,正快速的影响着设计行业。本次为大家带来京东家政AIGC的实践经验与思考,探讨如何将AI工具引入设计流程之中。通过一系列尝试,不仅实现了工作效率的大幅提升,更在保持设计独特性与高质量输出的同时,为业务项目注入了新的可能性与竞争力。
小而强,英伟达剪枝、蒸馏出 Llama-3.1-Minitron 4B AI 模型
英伟达公司联合 Meta 公司发布了最新的 Llama-3.1-Minitron 4B AI 模型,主要通过结构化权重剪枝、知识提炼等尖端技术,成功蒸馏(Distill)出 40 亿参数的“小而强”模型。图源:英伟达Llama-3.1-Minitron 4B 模型在 Llama-3.1-Minitron 8B 基础上蒸馏而来,英伟达在深度和宽度方向上使用了结构化剪枝技术。AI在线注:剪枝是一种删除网络中不那么重要的层或神经元的技术,保留其性能的情况下,目的是减小模型的大小和复杂度。英伟达通过从模型中删除 16 层来
以「垂直模型」引领AIGC商业化落地,FancyTech的技术路径是什么?
我们正在见证又一轮技术革新,这一次是 AIGC 为个体提供表达自我的工具,让创作变得更加容易和普及,但背后的推动力却并不是「大」模型。两年以来,AIGC 技术的发展速度超过所有人的想象,席卷了从文本、图像到视频的各个领域。关于 AIGC 商业化路径的讨论从来没有停止过,其中,有共识也有路线分化。一方面,通用模型的强大能力令人惊叹,在各行各业展示出应用潜力。特别是 DiT、VAR 等架构的提出,让 Scaling Law 实现了从文本到视觉生成领域的跨越。在这一法则的指引下,很多大模型厂商朝着增加训练数据、算力投入和
Perplexity 热度爆表,单月搜索量达 2.5 亿是去年一半,AI 搜索让谷歌掉队?
AI 搜索需求市场广阔,Perplexity 搜索在上个月回答了大约 2.5 亿个问题,预期收入猛增 7 倍。最近,人工智能搜索引擎市场持续「升温」。一方面,市占率 90%以上的搜索界「一哥」谷歌正在将 Gemini 集成到搜索引擎中;另一方面,OpenAI 也要来 AI 搜索市场分一杯羹,推出了 SearchGPT。面对激烈的市场竞争,Perplexity 似乎并没有在巨头前后夹击下流失掉大量用户,反而迎来新一轮用户使用量的猛增。一个月 2.5 亿回答量在 ChatGPT 推出前三个月,前 OpenAI 研究科学
一键复刻!12 组超惊艳的 Midjourney 风格代码推荐(三)
大家好,我是花生~
今天继续为大家推荐一些我最近收集的优质 Midjourney 风格代码,在 v6.1 模型下这些风格质量变得更好了,用来生成设计素材非常方便。
上期回顾:一、--sref 2715027730
特点:很像我之前推荐过的 --sref 794 风格,都是蓝紫色系的插画风,但是这个线条造型更随意柔和,适合生成儿童绘本/插画海报。
① Nostalgic postcard of a European countryside in spring, with rolling green hills, wi
Llama 8B 搜索 100 次超越 GPT-4o,推理 + 搜索即可提升性能
最新论文表明,LLM 等生成模型可以通过搜索来扩展,并实现非常显著的性能提升。另一个复现实验也发现,让参数量仅 8B 的 Llama 3.1 模型搜索 100 次,即可在 Python 代码生成任务上达到 GPT-4o 同等水平。强化学习先驱、加拿大阿尔伯塔大学 CS 系教授 Rich Sutton 曾在 2019 年写下一篇名为《The Bitter Lesson》的博文,成为 AI 领域的经典论述之一。甚至,Rich Sutton 在字里行间体现出的直觉已经颇有 Scaling Law 的意味。原文地址: /
OpenAI 投的代码工具 Cursor“叛变”了:默认使用 Claude,程序员叫好
我们尝试注册新账号、新安装不修改任何设置,第一次唤出代码补全,就是 Claude-3.5-Sonnet 来接待。
Nature 曝惊人内幕:论文被天价卖出喂 AI,作者 0 收入
Nature 的一篇文章透露:你发过的 paper,很可能已经被拿去训练模型了!有的出版商靠卖数据,已经狂赚 2300 万美元。然而辛辛苦苦码论文的作者们,却拿不到一分钱,这合理吗?全球数据告急,怎么办?论文来凑!最近,Nature 的一篇文章向我们揭露了这样一个事实:连科研论文,都被薅去训 AI 了……据悉,很多学术出版商,已经向科技公司授权访问自家的论文,用来训练 AI 模型。一篇论文从酝酿 idea 到成稿,包含了多少作者日日夜夜的心血,如今很可能在不知情的情况下,就成为训 AI 的数据。这合理吗?更可气的是
古尔曼:苹果在 AI 领域至少落后谷歌两到三年
昨天谷歌提前召开新品发布会,抢在苹果 iPhone 16 系列发布前展示了 Pixel 9 系列搭载的全新 AI 功能,引发业内广泛关注。彭博社记者马克・古尔曼称,苹果在 AI 技术方面至少落后谷歌两三年。谷歌在本次发布会上全面展示了 Gemini AI 的强大功能,将其深度整合到了 Android 和 Pixel 手机中。相比之下,苹果虽然在 WWDC 上公布了 Apple Intelligence,但实际应用尚不成熟,消息称部分功能甚至无法在 iPhone 16 发布时及时推出。此外,谷歌还强调 Gemini
OpenAI 首席战略官 Jason Kwon:不会一夜之间突然发布一个“包罗万象”的 AI
韩媒“Chosun Ilbo”当地时间周二公布了 8 月 7 日对 OpenAI 首席战略官 Jason Kwon 的采访内容。Jason Kwon 负责监督 OpenAI 未来的战略制定,处理围绕 AI 的伦理和法律问题,同时也参与技术开发。图源 PexelsAI在线汇总对话主要内容如下:Jason Kwon 认为,关键技术发展到通用人工智能(AGI)可能还需几年时间。“我们内部假设这可能比预期更快到来,因此正在相应地准备安全措施。”尽管业界认为 AGI 可能在三到五年之间出现,但 Jason Kwon 认为这一
第二波!2024年8月精选实用设计工具合集
大家好,这是 2024 年 8 月的第 2 波干货合集!
在搜集整理 3D 工具的时候,我注意到 2 个对于设计师非常友好的 3D 工具,其中一个是更加适宜新手入坑 3D 的建模平台 Womp3D,以及可以帮助前端快速将 3D 资源插入到网页中的代码工具,这俩在网页前端设计落地的过程中,甚至可以直接联动起来。
而 AI 工具这边,这期搜集到了 3 个非常值得关注的好东西,一个是阿里出品的开源的 AI 自动剪辑工具,对于做影视的小伙伴会非常友好,另外 2 个则和 UI 设计落地有关的 AI 平台,它们甚至隐约呈现出了
集成 Photoshop 功能的强大节点!ComfyUI layer style节点保姆级教程(一)
前言:
学习 ComfyUI 是一场持久战,而 ComfyUI layer style 是一组专为图片设计制作且集成了 Photoshop 功能的强大节点。该节点几乎将 PhotoShop 的全部功能迁移到 ComfyUI,诸如提供仿照 Adobe Photoshop 的图层样式、提供调整颜色功能(亮度、饱和度、对比度等)、提供 Mask 辅助工具、提供图层合成工具和工作流相关的辅助节点、提供图像效果滤镜等。旨在集中工作平台,使我们可以在 ComfyUI 中实现 PhotoShop 的一些基础功能。一、安装方式
方
AI在用 | 穿越了!3款AI工具让梵高、莫扎特们「活」在当下
机器之能报道编辑:杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。 我们也欢迎读者投稿亲自实践的创新型用例。最近,有博主将一堆世界名人的自画像制成了动画,吸引了不少网友围观。例如,文森特・梵高略带忧郁地抚摸着红色的络腮胡子:一副贵族气质的莫扎特摆弄起礼服:写出《傲慢与偏见》的简・奥斯汀坐在椅子上露出微笑:贝多芬忘我地拉着小提琴:还有达芬
OpenAI 找回场子:chatgpt-4o-latest AI 模型力压谷歌 Gemini 1.5 Pro,多项跑分重夺第一
谷歌上周发布最强 Gemini 1.5 Pro 模型,在 LMSYS 的聊天机器人竞技场(Chatbot Arena)比赛中取得第一名,而 OpenAI 迅速“找回场子”,最新 chatgpt-4o-latest 模型重夺第一。chatgpt-4o-latest 简介OpenAI 公司上周发布了 gpt-4o-2024-08-06,其 API 支持结构化输出;昨日再次发布了名为 chatgpt-4o-latest 的全新前沿模型,是 GPT-4o 的最新版本,上下文窗口输入最高 128000 个词元(tokens)
谷歌版 Her 大翻车:试了 3 次且换手机才成功… 网友:我手动只需 10 秒
翻车,大翻车。就在今天凌晨,谷歌版 Her——Gemini Live 正式发布。毕竟明显是对标 OpenAI 家的 GPT-4o,可以说是吸足了科技圈的眼球。在官网发布的 demo 中,拍照问答功能的效果是这样的:它大致实现的功能,是用手机拍摄演唱会的海报,并让 Gemini 查看用户的日历,看看行程是否适合参加。以及还可以基于此进行一系列后续的操作,包括定时间查票价等等。然而…… 当来到发布会现场演示环节的时候,画风却 180° 大变样。请看 VCR: 第一次:失败了。第二次:失败了。第三次:换手机,成功了。嗯…
集体诉讼已受理:艺术家指控 Stability AI、Midjourney 等公司非法利用其版权内容训练 AI
美国当地法院主审法官昨日(8 月 13 日)裁定,可以继续推进 AI 图片训练集体诉讼案件,不过驳回了部分诉求。AI在线从报道中获悉,原告由多名艺术家组成,被告为 Stability AI、Midjourney 和其它 AI 相关公司,原告指控其非法使用版权作品用于训练 AI。该集体诉讼原告表示,目前诸多主流 AI 文生图服务所使用的数据集中,包含了他们创造的版权作品。法官威廉・奥里克(William Orrick)批准了针对 Stability 公司的额外诱导性版权侵权索赔,并受理原告对 DeviantArt(该
谷歌发布 Gemini Live:支持 AI 语音聊天,可模拟面试场景、推荐演讲技巧
谷歌在今天召开的 Pixel 9 系列手机发布会上,发布了 Gemini Live 服务,将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。 推动自然、流畅的对话交流谷歌表示 Gemini Live 提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。谷歌表示用
神器大盘点!B站700万人气的AI整活视频都是如何完成的?
大家好,这里是和你们一起探索 AI 的花生~
巴黎奥运会已经结束了,这段时间除了观看激动人心的竞赛,我的另一大乐趣就是在 B 站看各种奥运会的吐槽/整活视频。而在这个过程中,我也发现不少视频都用上了 AI 技术,给人带来了新的观看体验。那么今天就和大家聊聊其中比较新奇有趣的效果以及相关实现方法,说不定哪天你也用得上~
相关推荐:一、视频角色替换
首先是一个调侃在奥运 会开幕式上出场的 “蓝精灵” 的视频。由于 “蓝精灵” 的装扮造型和 86 版《西游记》里的青狮怪非常相似,于是一个 B 站 up 主借用了电影《美人