文章列表
非法阻止员工披露AI安全风险,OpenAI严厉「封口协议」再遭举报
OpenAI 在人工智能领域的领头羊地位家喻户晓。其产品聊天机器人 ChatGPT 系列、文生图 DALL・E 系列、文生视频 Sora 等都被誉为生产力提升的超强助手据透露,OpenAI 内部正在一个代号为「草莓(Strawberry)」的项目中开发一种新的人工智能模型。该项目的细节此前从未被报道过,而 OpenAI 正努力证明其提供的各类模型能够提供高级推理能力。不过 OpenAI 现在似乎正陷在另一场风波当中。据《华盛顿邮报》报道,一位举报人向美国证券交易委员会(SCE,Securities and Exch
OpenAI Lilian Weng万字长文解读LLM幻觉:从理解到克服
Lilian Weng 出品,必是精品。人会有幻觉,大型语言模型也会有幻觉。近日,OpenAI 安全系统团队负责人 Lilian Weng 更新了博客,介绍了近年来在理解、检测和克服 LLM 幻觉方面的诸多研究成果。Lilian Weng,中文名翁丽莲,是 OpenAI 安全系统团队负责人。她 2018 年加入 OpenAI,参与了 GPT-4 项目的预训练、强化学习 & 对齐、模型安全等方面的工作。她的博客深入、细致,具有前瞻性,被很多 AI 研究者视为重要的参考资料(其他博客见文末扩展阅读)。大型语言模型的幻觉
万能模型 ControlNet Union !10+控制效果一键生成!
大家好,这里是和你们一起探索 AI 的花生~
Controlnet 可以说是目前最重要的一款 AI 绘画控制插件,可以帮我们实现轮廓、深度、动作姿势、颜色等多种控制效果。由于每种控制条件都需要调用不同的控制模型,加上 SD1.5 和 SDXL 的生态并不互通,大家肯定都至少安装了十几种模型文件,给磁盘空间带来了很大的压力。
最近一款名为 ControlNet 的模型却改变了这个状况,它将十多种控制功能合为一体,只需要安装一个模型,就能和多种不同的预处理器搭配使用,今天就来看看它的具体用法。
相关推荐:一、Con
模型训练成本“平民化”,前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2
GPT-2 是 OpenAI 于 2019 年推出的模型,其训练费用一度为每小时 256 美元,那么 5 年过后的 GPT-4 时代,软硬件和数据的进步,是否意味着训练同一模型所需的时间和成本会随之减少呢?答案是肯定的。据 Tom's Hardware 今日报道,前特斯拉 AI 总监、OpenAI 联合创始人、项目开发者 Andrej Karpathy 使用 llm.c“重现”了 GPT-2,其成本降到了每小时仅 28 美元(AI在线备注:当前约 204 元人民币),在短短 5 年内降低了近 90%。图源 Pixa
代号“草莓”,OpenAI 被曝研发新项目:将 AI 推理能力提至新高度
感谢路透社今天发布报道,称 OpenAI 公司正在研发代号为“草莓”的全新项目,进一步延伸去年 11 月宣布的 Q* 项目,不断提高 AI 推理能力,让其更接近人类的智力。AI在线援引该媒体报道,“草莓”项目会自主、高效地扫描互联网,并可靠地执行 OpenAI 所描述的“深度研究”,让其能够大规模解决更复杂的现实世界问题。一位内部知情人士透露:“我们希望我们的人工智能模型能够像我们一样看待和理解这个世界。不断研究新的人工智能能力也成为业界共识,我们都相信,这些系统的推理能力会随着时间的推移而不断提高”。“草莓”项目
如虎添翼,谷歌探索 AI + 机器人未来:836 平方米复杂场景下指令成功率高达 90%
感谢科技媒体 The Verge 昨日报道,谷歌旗下的 DeepMind 团队正在使用 Gemini 训练其机器人,让其能够完成更复杂的任务,且能在复杂的环境下自由穿梭。DeepMind 团队已经发表了最新的研究论文,利用 Gemini 1.5 Pro 的上下文窗口(达到 200 万个词元),让用户可以更轻松地使用自然语言指令与 RT-2 机器人互动。AI在线注:上下文窗口(context window)是指语言模型在进行预测或生成文本时,所考虑的前一个词元(token)或文本片段的大小范围。其工作原理是拍摄指定区
“最强开源 AI 模型”,4050 亿参数版 Meta Llama 3 被曝 7 月 23 日发布
感谢科技媒体 The Information 本周五发布博文,援引内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3-405B,在现有 80 亿和 700 亿参数两个版本之外,推出 4050 亿参数版本,号称是最强大的开源大语言模型。Meta 公司今年 4 月发布 Llama 3 AI 模型时,扎克伯格就在采访中透露正在训练 4050 亿像素的密集模型,但当时没有透露太多的信息。AI在线注:上图为机翻字幕,存在错误报道称 Llama 3-405B 是一个多模态 AI 开源模型,
机器人大模型新公司!数据规模比同行大1000倍!贝索斯、孙正义等押注
机器之能报道编辑:Sia用 OpenAI 的方式颠覆机器人世界。「GPT-3 时刻正在进入机器人世界。」最近,Sequoia 合伙人 Stephanie Zhan 在投资了一家新机器人初创后说道。无论是在物流、车厂试点的人形机器人,还是四足机器狗,都要有脑子。过去,脑子要定制,「专款专用」,现在,不必了。最近,位于匹兹堡的机器人初创 Skild AI 声称,已经开发出一种通用的智能系统。它就像一个通用的智能模块,可以接入不同机器人,让他们立刻获得一些基本能力,如爬坡、跨过障碍、识别和捡起物品。7 月 9 日,Sk
五年后的今天,训练GPT-2只需不到700刀、24小时,Karpathy又整新活
论老黄卖铲子的技术含量。2019 年 2 月,OpenAI 发布了 GPT-2,因为在文本生成上的优异表现,以及对于预训练 Transformer 架构的充分运用,被认为是如今大预言模型的「始祖」。五年后的今天,训练 GPT-2 这样 15 亿参数的大模型,只需要花费 672 美元,在一个 8XH100 的 GPU 节点上跑 24 个小时就可以搞定了。本周四,前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 在他纯 C 语言复现 GPT-2 大模型的项目「llm.c」的最新
OpenAI 提出通用人工智能五级标准,自认为接近但未达到第二级
彭博社报道称,OpenAI 提出通用人工智能五级标准,用来确认人工智能的进展。OpenAI 高管告诉员工,公司自认为目前还处于第一级,但即将达到第二级。通用人工智能(AGI、Artificial General Intelligence),是指具有高效的学习和泛化能力、能够根据所处的复杂动态环境自主产生并完成任务的通用人工智能体,具备自主的感知、认知、决策、学习、执行和社会协作等能力,且符合人类情感、伦理与道德观念。AI在线附 OpenAI 提出的等级标准:第一级:聊天机器人,具有会话语言的人工智能第二级:推理者,
最近超火的用AI制作老照片视频,完整教程来啦!
Hello,大家好,我是益达,不知道大家有没有发现,最近小红书和抖音,出现了很多把老照片做成视频,并且数据都不错,今天我就来教大家如何制作。一、寻找或制作老照片
1. 百度寻找老照片
可以在百度、谷歌搜索2. 自己制作老照片
这个方法适合自己制作系列照片,统一风格,需要发内容的小伙伴,可以通过 Midjourney 或者一些 AI 绘画平台进行制作
比如我用即梦做的老照片,出的风格都挺一致的,自己再做旧一下就可以使用了二、修复画质
我以这张图片为例1. 腾讯 ARC
首先需要修复画质,可以通过腾讯 ARC:
目前
国产开源绘画模型 Kolors!可生成中文字符,质量超越 SD3 与 MJ
大家好,这里是和你们一起探索 AI 的花生~
最近国内科技公司快手在 AI 方面接连发力,推出了类 Sora 视频生成模型「可灵 Kling」、人像动画控制模型「Liveportait」、以及文生图扩散模型「可图 Kolors」,质量均位于同类模型前列,在国外互联网上都引起了广泛的关注和讨论,颇有异军突起之势。
其中「可图 Kolors」为开源模型,它不仅在生成质量上超过了前段时间推出的 SD3,与 Midjourney v6 模型不相上下,还支持识别中文提示词和生成中文字符,可谓是国产开源绘画模型之光,今天就为大
ComfyUI 进阶篇!完整梳理 ComfyUI 的核心节点(一)
前言:
学习 ComfyUI 是一场持久战。当你掌握了 ComfyUI 的安装和运行之后,会发现大量五花八门的节点。面对各种各样的工作流和复杂的节点种类,可能会让人感到不知所措。在这篇文章中,我们将用通俗易懂的语言对 ComfyUI 的核心节点进行系统梳理,并详细解释每个参数。希望大家在学习过程中培养自我思考的能力,真正掌握和理解各个节点的用法与功能。在实践中不断提升自己的技术水平。只有通过不断的探索和总结,才能在面对复杂的工作流时游刃有余。祝大家学习顺利,早日成为 ComfyUI 的高手!一、Load Check
人形机器人将当上银行“大堂经理”,国内首个场景训练基地在上海浦东启用
据“上海金融官微”公众号,国内首个人形机器人银行大堂经理场景训练基地在建行上海浦东分行正式启用。银行大堂经理场景训练基地是业内首个商业银行场景应用训练基地,其首次采用开放式的创新训练模式,有助于加快提升人形机器人的能力,推动关键技术、重点产品和重点场景应用。据介绍,此次参训的机器人拥有高度仿生的躯干构型和拟人化的运动控制,结合视觉、听觉、语音等人工智能技术,科学家可以通过具身智能的推理和规划等对其进行训练。目前,该银行已对智能人形机器人开展银行大堂业务咨询、业务分流、智慧柜员机个性化操作指南、反欺诈宣传等面向客户的
三星确认今年将推出 AI 升级版 Bixby,由自研大语言模型提供支持
三星确认 Bixby 将很快获得人工智能升级。在 Galaxy Z Flip 6 和 Galaxy Z Fold 6 发布后,三星移动部门 CEO TM Roh 在接受 CNBC 采访时表示,公司将在今年晚些时候发布升级版 Bixby,并由三星自家的大语言模型(LLM)提供支持。Roh 表示:“我们将通过应用生成式人工智能技术来提升 Bixby 的能力。”几个月前,三星推出过名为“Samsung Gauss”的自研 LLM。此前曾有报道称三星正在研发升级版 Bixby,但这是三星首次确认相关消息,并透露了大致发布时
Llama分子嵌入优于GPT,LLM能理解分子吗?这一局Meta赢了OpenAI
编辑 | 萝卜皮OpenAI 的 GPT 和 Meta AI 的 Llama 等大型语言模型 (LLM),因其在化学信息学领域的潜力而日益受到认可,特别是在理解简化分子输入行输入系统(SMILES)方面。这些 LLM 还能够将 SMILES 字符串解码为矢量表示。加拿大温莎大学(University of Windsor)的研究人员比较了 GPT 和 Llama 与 SMILES 上的预训练模型在下游任务中嵌入 SMILES 字符串的性能,重点关注两个关键应用:分子特性预测和药物-药物相互作用预测。该研究以「Can
第二波!2024年7月精选实用设计工具合集
大家好,这是 2024 年 7 月的第 2 波干货合集!这一期干货合集有专门生成 SVG 矢量素材的 AI 平台,免费生成 PNG 透明背景的 AI 平台,基于 AI 进行前期产品灵感探索的平台,以及在线生成可编辑 Banner 的 AI 平台,此外还有免费生成渐变背景的工具,以及次世代 3D 可视化设计的平台,都是精选的好东西。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、AI 生成的免费 SVG 矢量素材合集网站
SVGStud.io 的网站,是一个基于 AI 来
保姆级教程!小学生看了都会的AI视频短片制作教程
前言
我相信这是一篇针对大朋友、小朋友都通俗易懂的视频剧本构思到视频落地的全流程拆解教程。基于大语言模型和绘图模型的前提,有了一次和小伙伴们探索文生图到图生视频的创作实践。
废话不多说,直接上保姆级干货教程!保证你能够轻松学会!学之前,快来看看我们制作的视频短片吧~当视频在手机上无法加载,可前往PC查看。一、前期准备
1. 确定主题
针对于现有的 AI 生成能力,央视推出了多组 AI 视频短片,为此我们也决定生成一个符合时代主旋律的 AI 小视频。经过脑暴阶段,有了一带一路背景下丝绸之路这个角度的创作故事。创作方向