文章列表
各大高校特邀讲师!优设专访AI人气创作者焦渝轩
设计师Stephen在展陈空间和建筑领域不断探索,致力于将AIGC带来的创新性与传统的设计流程进行融合,探索如何能让AI真正服务设计行业。目前已制作发布SD模型百余件。他近期制作的作品《莲》荣获2024阿里D20未来青年AI设计入围奖、2024ROCA平面与空间设计奖铜奖、第五届紫金奖设计展入围奖等。
AIGC案例实战!百度APP 如何用 AI 完成242个彩蛋设计?
导语
得益于 AI 技术的有力支撑,百度 APP 塑造出独特的互动彩蛋体验模式,大幅提升了用户参与度与社区凝聚力。早在 2023 年端午节时,我们对彩蛋初次探索即获好评,故将其作为长效运营手段,决定全年运营,筹划借助 AI 提效互动彩蛋生产,为互动生态注入全新活力与创造力。接下来,就让我们一同探讨 AI 与彩蛋的双向奔赴,实现百度 APP 互动规模化氛围营造。一、规模化难
在视频、图文等多场景中,我们建立了视频弹幕、评论、点赞三大互动阵地,不断拓展互动的边界,为用户和社区缔造出更为丰富且多元的价值。然而,传统的彩蛋
OpenAI 推出 AI 模型 GPT-4o mini,号称功能最强、成本效益最高的小模型
感谢据 CNBC 报道,OpenAI 今天发布了全新的 AI 模型“GPT-4o mini”,这是 OpenAI 为扩大其聊天机器人的使用范围所做的最新努力。OpenAI 方面称,此次新发布的产品将是“目前功能最强大、成本效益最高的小型模型”,并计划晚些时候将图像、视频和音频能力整合到该模型中。GPT-4o mini 同样也是 OpenAI 推动“多模态”(multimodality)技术发展的一部分,“多模态”是指在一个工具中提供多种类型的人工智能生成媒体,如文本、图像、音频和视频。据悉,GPT-4o mini
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
如果 AI 模型给的答案一点也看不懂,你敢用吗?随着机器学习系统在更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是,要求系统对其输出产生一种解释,这种解释对人类或另一个受信任的系统来说是可读的,即可以完全理解以至于任何可能的错误都可以被发现。例如,为了建立对司法系统的信任,我们要求法院提供清晰易读的书面意见,解释并支持其决策。对于大型语言模型来说,我们也可以采用类似的方法。 不过,在采用这种方法时,确保语言模型生成的是易于理解
对话南洋理工大学安波教授:如何让大语言模型适应动态环境?丨IJAIRR
对人类越是简单的问题,大语言模型反而越难以做好? 尽管现在的大模型已经有能力冲击数学竞赛级别的题目,但在像“9.11和9.9谁大”这样的简单问题上仍然会翻船。 而从推特上网友对问题的讨论中猜测,出现这种错误的原因可能是由于大模型以token的方式来理解文字,当9.11被拆成“9”、“.”和“11”三部分时,11确实比9大。
因监管问题,Meta 将不会在欧盟发布新的多模态 AI 模型
据 Axios 报道,Meta 在一份声明中表示,他们即将发布一个多模态的 Llama 模型,但由于监管环境的不确定性,该模型不会在欧盟发布。Meta 表示,这一决定也意味着即使在开放许可下发布,欧盟的客户和公司也无法使用多模态模型,Meta 将向欧盟的客户和公司提供仅支持文本(text only)的 Llama 3 模型。报道称,Meta 的问题不在于《人工智能法案》,而在于如何在遵守《通用数据保护条例》(GDPR)的同时,使用欧盟客户的数据来训练模型。Meta 表示使用当地数据进行训练,对于确保其产品正确反映该
SD WebUI 手把手教程!5 步搞定黑白照片修复、上色和高清放大
大家好,这里是和你们一起探索 AI 花生。
上次为大家推荐了 9 款在线免费的 AI 工具,可以帮我们一键完成老照片修复/上色的工作。但是这些工具大多有使用次数、图像尺寸方面的限制,处理效果并不能完全让人满意。而随着 AI 绘画的普及,我们可以借助 SD Web UI 这样的开源工具,免费实现黑白照片修复、上色、高清放大等一系列操作,不仅可以没有使用上的各种限制,图像的修复、上色效果也更准确精致。整个过程大概分为 “面部强化-破损修复-上色-高清放大” 四个步骤,如果你还不了解 SD WebUI 的用法,可以了解我
ComfyUI 进阶篇!完整梳理 ComfyUI 的核心节点(三)
前言:
学习 ComfyUI 是一场持久战。当你掌握了 ComfyUI 的安装和运行之后,会发现大量五花八门的节点。面对各种各样的工作流和复杂的节点种类,可能会让人感到不知所措。在这篇文章中,我们将用通俗易懂的语言对 ComfyUI 的核心节点进行系统梳理,并详细解释每个参数。希望大家在学习过程中培养自我思考的能力,真正掌握和理解各个节点的用法与功能。在实践中不断提升自己的技术水平。只有通过不断的探索和总结,才能在面对复杂的工作流时游刃有余。祝大家学习顺利,早日成为 ComfyUI 的高手!一、Apply Cont
第三波!2024年7月精选实用设计工具合集
大家好,这是 2024 年 7 月的第 3 波干货合集!这一期干货合集包含有好几个资源合集类型的素材,有基于 Notion 整合的资源和 AI 工具合集,有免费的矢量 LOGO 素材网站,有超全面的海外版设计资源导航,也有专业的图标和插画素材网站。此外,这次合集中还有基于 AI 的配色工具,可以直接导入 Figma 的那种,还有基于 AI 的手绘转数字版图表的工具,相当专业。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、基于 Notion 的设计资源和 AI 工具合集
ComfyUI 进阶篇!完整梳理 ComfyUI 的核心节点(二)
前言:
学习 ComfyUI 是一场持久战。当你掌握了 ComfyUI 的安装和运行之后,会发现大量五花八门的节点。面对各种各样的工作流和复杂的节点种类,可能会让人感到不知所措。在这篇文章中,我们将用通俗易懂的语言对 ComfyUI 的核心节点进行系统梳理,并详细解释每个参数。希望大家在学习过程中培养自我思考的能力,真正掌握和理解各个节点的用法与功能。在实践中不断提升自己的技术水平。只有通过不断的探索和总结,才能在面对复杂的工作流时游刃有余。祝大家学习顺利,早日成为 ComfyUI 的高手!一、VAE Decode
科技巨头被曝未经授权用 YouTube 内容训练 AI,苹果、英伟达在列
据 Wired 报道,包括苹果在内的一些科技巨头未经 YouTube 视频创作者同意,就使用了他们视频的字幕文件来训练人工智能模型。AI在线注意到,此次事件影响到的创作者包括知名科技博主 MKBHD (Marques Brownlee)、MrBeast、PewDiePie、以及脱口秀主持人斯蒂芬・科尔伯特、约翰・奥利弗和吉米・坎摩尔等。这些被用于训练 AI 的字幕文件相当于视频的文本转录内容。调查记者披露,一些世界上最富有的科技公司一直在利用来自成千上万个 YouTube 视频的素材来训练 AI,而这违反了 You
微软 CTO 坚信大型语言模型的“规模定律”依然奏效,未来可期
微软首席技术官(CTO)凯文・斯科特(Kevin Scott)上周在接受红杉资本旗下播客采访时,重申了他坚信大型语言模型 (LLM) 的“规模定律”将继续推动人工智能进步的观点,尽管该领域一些人怀疑进步已经停滞。斯科特在推动微软与 OpenAI 达成 130 亿美元的技术共享协议方面发挥了关键作用。斯科特表示:“其他人可能持不同观点,但我认为规模化并未达到边际收益递减的临界点。我想让人们理解这里存在着一个指数级提升的过程,遗憾的是,你只能每隔几年才能看到一次,因为建造超级计算机然后用它们训练模型都需要时间。”202
效果超棒!9 款免费好用的老照片修复和上色 AI 神器
大家好,这里是和你们一起探索 AI 的花生~
最近有关 “老照片动起来” AI 视频在互联网上爆火, 制作教程优设网上就有,大家可以点击这里学习。今天则为大家推荐 9 款免费的老照片处理工具,它们都用了 AI 技术,能让我们轻松实现破损照片修复、模糊人脸高清化、黑白照片上色等效果,点开即用非常方便,这样 AI 视频的生成效果也会更好,下面一起来看看吧~
相关推荐:一、AI 老照片修复
网站直达:
「AI 老照片修复 」是 ModelScope 社区内的一个图片处理小工具,借助 AI 实现画质增强、智能上色等效果,
AI设计必看指南!简析谷歌+微软的AI设计原则
在这个 AI 触手可及的时代,智能技术已经悄无声息地融入了我们的日常生活。但你知道吗?每一个让人惊叹的 AI 产品背后,都有一套精妙的设计原则在支撑。谷歌和微软这样的科技巨头,他们不仅是技术的先锋,更是体验设计的领航者。他们在丰富的产品实践中提炼出这些 AI 设计原则。学习它们,可以让我们用更理性、更科学的方法进行设计,创造出更智能且更有温度的用户体验。
下滑,让我们一起了解这些 AI 设计原则吧~一、谷歌AI设计指南
《The People AI Guidebook》由 Google 的 PAIR 团队发布,
传 4050 亿参数版 Llama3 将在 23 日发布;机械臂公司获 6300 万美元融资丨AI情报局
今日融资快报机械臂公司 Standard Bots 获 6300 万美元融资,亚马逊、三星等参投Standard Bots Inc. 是一家为制造业和物流业开发机械臂的初创公司,该公司已获得 6300 万美元的 B 轮新资金。 本轮融资由 General Catalyst 领投,亚马逊工业创新基金、Samsung Next 和几家老投资者也参与了该公司的投资。
谷歌 Gemini 被曝今日起推出多项新功能:定制 GPT、记忆或个性化回复等
根据反向工程师 @testingcatalog 的发现,谷歌将在近期为其 Gemini 人工智能助手带来几项更新。从该工程师发布的截图来看,这一轮更新原计划在 7 月 11 日、7 月 18 日分批推送,但他又声称 7 月 11 日的更新已经推迟至 7 月 15 日(AI在线注:日期即今日,但以具体时区为准),预计当天将带来 1 项功能。而在 7 月 18 日,谷歌计划发布 4 项 Gemini 新功能。媒体 Testing Catalog 披露了近期即将发布的新功能,但未说明这些功能的具体上线日期。文生图工具 I
谷歌 Gemini AI 遭质疑:未经用户同意读取 Google Drive 文档
感谢据 X 用户 @Kevin Bankston 的报告,谷歌的人工智能服务 Gemini AI 似乎在未经用户明确许可的情况下读取 Google Drive 中的私人文档。AI在线注意到,Bankston 在其推文中详细描述了这一问题。最初,他发现 Gemini 似乎在阅读他的 Google Drive 文档,但相关设置中找不到禁用该功能的选项。经进一步调查,他发现这是 Google Drive 本身的问题,而非 Google Docs,但两者可能都存在类似的漏洞。而且,根据 Gemini 人工智能的说法,用于控
赶时髦的 AIGC 营销人,如何实现「里子」与「面子」的双赢?
过去一年,AI 在各行各业掀起了一场技术变革狂潮。向来「赶时髦」的营销圈,更是率先拥抱 AIGC 技术。相关数据显示,2023年,我国已有近半数广告主企业在线上营销活动中应用 AIGC 技术,其中超过 90% 的应用聚焦于内容创作和创意开发。这种由技术驱动的广告营销新模式正在逐渐成型,为广告主降本增效带来更多可能。然而,AIGC 技术在营销领域大施拳脚的同时,也伴随着诸多挑战。例如,AIGC 技术在生成营销素材时可能会产生内容风险,重金投入的营销活动一不小心为黑产做了嫁衣……那么,AIGC 营销人该如何平衡创作内容