文章列表
万物皆可《毁灭战士》,专家利用 GPT-4V 模型运行该游戏
英国约克大学研究员 Adrian de Wynter 近日发表研究论文《Will GPT-4 Run DOOM?》,探讨了如何让 GPT-4V 模型来玩《毁灭战士》游戏。de Wynter 为此设计了一个系统,使用 GPT-4V(GPT4 的多模态衍生版本,可以接收图像作为输入)捕捉游戏引擎的画面截图,并返回游戏状态的结构化描述。他设计了一个 Agent 模型,根据视觉输入信息,并对比此前历史记录作出决策,并将其反应转化为《毁灭战士》游戏可以理解的按键命令。简单地说,系统会截取游戏截图,并利用这些截图找出游戏中发生
这 2 个工作流网站,让 Stable Diffusion 新手一秒变大神!
大家好,这里是和你们一起探索 AI 的花生~很多小伙伴在学习完 Stable Diffusion WebUI 和 ComfyUI 的基础操作后,都在问我如何能实现更高级的应用,比如创意摄影、AI 换装、图像风格转换、AI 视频制作等。今天就为大家推荐 2 个资源网站,上面有很多 AI 大神分享的优质工作流,下载后导入到自己的工具中就能一键复刻同样的效果,实现 Stable Diffusion 新手快速生成酷炫效果图的梦想,一起来看看吧~
相关推荐:一、Lightflow
Lightflow 社区网址:
Light
微软 Copilot 全面升级 OpenAI GPT-4 Turbo 模型,包括免费用户
在经过一系列工作之后,微软现已针对 Copilot 用户群全面升级为 OpenAI 最先进的 GPT-4 Turbo 模型。IT之家提醒,Copilot Pro 用户如果不习惯的话还可以切换回标准 GPT-4 模型,但免费用户是没有选择权的。微软 Copilot 最初是作为 Bing Chat 聊天机器人推出的一款产品,早期迭代依赖于 GPT-3.5 模型,后来升级到 GPT-4 后有了大幅改进,而现在又升级到了 GPT-4 Turbo 模型,这意味着 Copilot 功能又一次实现飞跃。GPT-4 Turbo 以
阿尔特曼、老黄齐预测:AGI 五年内降临,代替 95% 工作!但马斯克断言 AGI 将被电力卡脖子
感谢IT之家网友 lemon_meta 的线索投递!【新智元导读】突然间,AGI 已经成为了一个新的「5 年内实现」的未来技术。从 Altman 到老黄,都在不同场合表示,达到人类智能水平的 AI 将很快到来。而技术路径和未来可能出现的能源短缺,可能是达到 AGI 过程中的最大变数。Claude 3、Sora、Gemini 1.5 Pro 的纷纷出现,以及或许今年内就会被放出的 GPT-5,让所有人都不约而同地隐隐感觉:我们似乎离 AGI 似乎越来越近了。OpenAI CEO Sam Altman 坚定地认为,AG
Midjourney 能让角色保持一致了!网友实测称直呼“改变游戏规则”
Midjourney 发布新功能,网友直呼“不可思议”!现在你可以让生成的图像几乎保持角色一致,belike:所有超级英雄长一个模样盯着你。甚至动漫风、写实风等跨风格生成也同样适用:保持同一风格,感觉配上文字可以讲一个故事了:面部、着装、发型可调控,换装玩法 get:新功能名为角色参照(Character Reference),和之前的风格参照类似,不过这次不是保持风格一致,而是保持生成图像的角色与给定的参照角色一致。网友们已经玩嗨了,纷纷表示这是迄今为止 Midjourney 最大的更新:还有网友认为生成式 AI
真实的商战:文生图 AI 平台 Midjourney 禁止 Stability AI 员工使用其服务
感谢Midjourney 和 Stability AI 是当前文生图 AI 领域的其中两家头部企业,然而“不是冤家不聚头”,据 The Verge 北京时间今日凌晨的报道,Midjourney 宣称已禁止 Stability AI 的员工使用其服务,并指责后者员工在本月早些时候尝试抓取 Midjourney 数据时,导致系统出现故障。早在 3 月 2 日,Midjourney 就在其 Discord 频道公告,承认服务器出现故障的时间延长导致用户无法获得生成图像。随后在 3 月 6 日,Midjourney 在其电
OpenAI 抨击马斯克指控:建立在不连贯、语无伦次的事实前提之上
感谢据彭博社报道,OpenAI 当地时间周一向美国加州旧金山法院提交了法庭文件,对此前埃隆・马斯克对其的指控进行猛烈抨击:该指控建立在“不连贯且语无伦次的”事实前提之上。马斯克上个月宣布起诉 OpenAI 公司及其 CEO 阿尔特曼、总裁格雷格・布罗克曼,声称 OpenAI 偏离了其“建立负责任的人工智能”这一最初使命,并成为其最大投资者微软事实上的子公司。需要注意的是,OpenAI 这次提交的文件是公司对马斯克起诉的首次法律回应。OpenAI 在文件中强调自身并未违反与马斯克的协议,因为“与马斯克之间根本不存在创
OpenAI开源了:Transformer自动debug工具上线GitHub
不用敲代码,就可以快速探索模型结构。最近时常被吐槽不够开源的 OpenAI,突然开放了一次。今天一早,OpenAI 机器学习研究员 Jan Leike 宣布,OpenAI 开放了自己内部一直用于分析 Transformer 内部结构的工具。GitHub 链接:,虽然没有经过太多宣传,star 数量上涨得也挺快。Transformer Debugger 介绍Transformer Debugger (TDB) 是 OpenAI 对齐团队(Superalignment)开发的一种工具,旨在支持对小体量语言模型的特定行为
王室修图何必用PS?Midjourney上新「换脸魔法」,奥特曼一秒COS罗马将军
这两天,英国王室的 P 图事件闹得沸沸扬扬。3 月 10 日,威廉与凯特的 X 官方账号分享了一张凯特王妃和 3 个孩子的合影。然而,这张本意为辟谣的照片却掀起了一场「大家来找茬」的游戏,眼尖的网友发现了多处修图痕迹:还有一些猜测是,这张照片是由 AI 生成的。照片中人物数量比较多,且是相互依靠的动作,AI 直接生成的结果未必有这么自然,但也不能排除「局部 AI 生成」的可能性。随后,凯特王妃为「发布修改过的照片」正式道歉:「和许多业余摄影师一样,我偶尔也会尝试修图。我想为昨天我们分享的家庭照片引起的任何混乱表示歉
谷歌承认“窃取”OpenAI 模型关键信息:成本低至 150 元,调用 API 即可得手
什么?谷歌成功偷家 OpenAI,还窃取到了 gpt-3.5-turbo 关键信息???是的,你没看错。根据谷歌自己的说法,它不仅还原了 OpenAI 大模型的整个投影矩阵(projection matrix),还知道了确切隐藏维度大小。而且方法还极其简单 —— 只要通过 API 访问,不到 2000 次巧妙的查询就搞定了。成本根据调用次数来看,最低 20 美元以内(折合人民币约 150 元)搞定,并且这种方法同样适用于 GPT-4。好家伙,这一回阿尔特曼是被将军了!这是谷歌的一项最新研究,它报告了一种攻击窃取大模
Stability AI 推出 TripoSR!一秒生成高质量 3D 模型,免费使用
大家好,这里是和你们一起探索 AI 的花生~
之前为大家系统推荐了 5 款 3D 模型生成神器,以及 Stability AI 推出的 3D 模型 Stable Zero123,他们都可以根据文本或图像生成较完整的 3D 模型。最近 Stability AI 又推出了一款新的开源 3D 生成模型 TripoSR,它不仅在生成速度上远超之前推荐的模型,而且质量上也有了极大的提升,今天为大家介绍一下它的用法。
相关推荐:一、TripoSR 简介
Github 项目主页:
TripoSR 试用 Demo:
Tripo
求职新方向?为什么AI时代离不开「设计系统架构师」?
看到国外有设计师在议论所谓 “AI 设计师”,聊的都挺虚的。大家关注这个话题,可能很大程度上是因为 AI 工具的发展给设计师的职业前景带来了很大的不确定性。
当然也有确定的,确定的是未来设计师数量肯定会大幅减少,这个已经在发生了。不确定的是未来留下来还可以继续以“设计师”的头衔来做设计的人会是什么样子的。一、未来 3 年内,设计师的职能分工方式会发生重组
我觉得未来 3 年内,设计师的职能分工会跟现在有很大的不同,现在的分工更多的是以专业技能垂直领域来划分的,比如交互设计师、视觉设计师、动效设计师之类的。大胆推测一
继起诉 OpenAI 并要求对方恢复开源后,马斯克宣布本周 xAI 将开源 Grok
感谢马斯克今日下午通过 X(推特)宣布,自家人工智能公司 xAI 将在本周内开源人工智能助手 Grok。随后,马斯克在回应网友“OpenAI 也应当如此,如果它们要像名字中的‘Open’那样”的帖子时表示,“OpenAI 就是谎言。”就在本月,马斯克宣布起诉 OpenAI 及其 CEO 阿尔特曼,声称 OpenAI 及其 CEO 阿尔特曼违背了公司成立的协议,该协议旨在推动 AI 技术朝着造福人类而非牟利的方向推进。马斯克对 OpenAI 提出了包括违反合同、违反信托义务和不公平商业行为在内的索赔,并要求该公司恢复
因使用受版权保护书籍训练 AI 平台,英伟达被三名作者起诉
感谢据美国福克斯电视台北京时间今日报道,科技巨头英伟达已被三名作者起诉,因为英伟达在训练其 AI 平台 NeMo 时,未经许可使用了他们受到版权保护的书籍。三名作者 Brian Keene、Abdi Nazemian 和 Stewart O'Nan 声称,自己的作品被收录在一个包含约 196640 本书籍的数据集内,这些书籍帮助训练 NeMo 模拟普通书面语言,但这个数据集因“被举报侵犯版权”在去年 10 月被撤下。(IT之家注:该数据集原本被托管在 Hugging Face 网站上)作者们在 3 月 8 日晚提交
AI 结合汽车,蔚来宣布 NOMI GPT 领航版开启招募
蔚来汽车今日宣布,2024 NOMI 焕新,GPT 领航版正式开启招募。经历 132 次版本迭代更新、为用户带来了超 2000 项功能的 NOMI,即将进入体验升级新篇章。官方称登陆蔚来 App,关注用户领航团发布的最新招募信息。然而,IT之家暂未找到招募入口,评论区网友也表达了同样的疑惑,蔚来对此表示“别着急,刷一刷就上线了”。IT之家注意到,2024 款蔚来全系车型均将采用全新的中央计算平台 ADAM,搭载高通骁龙 8295 座舱芯片,座舱算力得到明显提升。其中,8295 芯片相较于 8155 芯片,CPU 算
怎么劝ChatGPT干活效果最好?我们尝试了100种方法,有图有真相
在 ChatGPT API 中,系统提示是一项很有亮点的功能,它允许开发人员控制 LLM 输出的「角色」,包括特殊规则和限制。系统提示中的命令比用户输入提示中的命令要有效得多,这让开发人员拥有了更大的发挥空间,而不是像现在使用 ChatGPT 网页应用程序和移动应用程序那样仅仅使用用户提示。举个例子,一个很有趣的 Trick 就是「给小费」。BuzzFeed 数据科学家 Max Woolf 是数亿 ChatGPT 用户中的一员。他亲自尝试过:如果没有 500 美元的小费奖励,ChatGPT 只会返回一个表情符号,这
奥特曼重返OpenAI董事会:看完3万份文件,调查组认定了
过山车一样的剧情。特别独立调查委员会发现,在去年 OpenAI 管理层动荡时,首席执行官萨姆・奥特曼(Sam Altman)的行为「不构成强制解雇」,现在他重新加入董事会了。历时超过 110 天,OpenAI 的宫斗剧现在迎来了盖棺定论的时刻。没有通用人工智能危机,也和神秘的技术突破 Q* 无关,国际律师事务所 WilmerHale 在大量调查之后认定,这次动荡的原因在于董事会成员之间关系破裂。现在,奥特曼和 Greg Brockman 是「OpenAI 的正确领导者」。在发布消息与记者通话时,奥特曼坐在 Greg
OpenAI 视频生成服务 Sora 引发隐私担忧,意大利数据监管机构展开调查
感谢意大利数据保护机构 (Garante) 周五宣布,已对微软支持的 OpenAI 公司开发的一项服务展开调查,这个名为 Sora 的服务可以根据文本提示生成视频。监管机构要求 OpenAI 澄清其向用户和非用户告知其产品 Sora 使用的数据的方式是否符合欧盟法规。OpenAI 公司暂未对此事发表评论。意大利数据监管机构是欧盟国家中最为积极的监管机构之一,一直致力于评估人工智能平台是否符合欧盟的数据隐私法规。IT之家注意到,去年该机构就以涉嫌违规使用用户数据为由,禁止了聊天机器人 ChatGPT 在意大利的使用。