应用
“国家队”评测30个大模型数学能力,九章、文心、星火位列前三
去年ChatGPT横空出世后,我国也迎来“百模大战”,大模型能力测评成为业界前沿课题。近日,大模型数学能力权威测评基准MathEval围绕数学能力,对国内外30个大模型(含同一模型的不同版本)开展测评。根据测评结果,学而思九章、百度文心一言4.0、讯飞星火V3.5摘得前三名。其中,学而思旗下九章大模型在整体表现和中文、英文、各学段子榜单中,都具备领先优势。 数据显示,截至去年10月,国内累计发布大模型超200个。大模型越来越多地被运用到数学应用领域,包括数学问题解决、数据分析、学术研究、学习辅导等。目前,通用或垂类
海报素材不用愁!10 组高质量数字专题 Midjourney 提示词
大家好,这里是和你们一起探索 AI 绘画的花生~
之前为大家系统讲解了如何在 Midjourney 中生成一套完整的数字,今天继续为大家推荐 10 组不同风格材质的数字主题 Midjourney 提示词,生成的图片可以当做海报主视觉或者装饰元素使用~
上期回顾:一、油漆材质
Number 6, composed of colored paint, dynamic splash, floating on pure white background, minimalist, 3D rendering --v 6.0
数
拿下微软合作、旗舰模型对标GPT-4,认识一下「欧洲版 OpenAI」
机器之能报道编辑:SiaMistral 目前法国科技界的骄傲和喜悦,也是开源力量的代表。它的初期成功要归功于能巧妙地将AI技术与政治结合起来。问题是Mistral能否将这种诱人的技术与政治混合优势转化为实实在在的利润。这家法国 AI 初创的崛起就像西北风一样轻快,这也是它名字 Mistral 的由来。Mistral 翻译过来是密史脱拉风,法国南部罗纳河谷一带特有的强风,干寒强烈,持续时间长。据说,梵高和高更的决裂也与普罗旺斯刮起的密史脱拉风有关。Mistral位于巴黎的办公室,它们也是法国目前最有前途的大模型初创公
想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速
作为 2024 开年王炸,Sora 的出现树立了一个全新的追赶目标,每个文生视频的研究者都想在最短的时间内复现 Sora 的效果。根据 OpenAI 披露的技术报告,Sora 的核心技术点之一是将视觉数据转化为 patch 的统一表征形式,并通过 Transformer 和扩散模型结合,展现了卓越的扩展(scale)特性。在报告公布后,Sora 核心研发成员 William Peebles 和纽约大学计算机科学助理教授谢赛宁合著的论文《Scalable Diffusion Models with Transform
SDXL-Lightning 来啦!让AI出图速度提升 10 倍!
大家好,这里是和你们一起探索 AI 绘画的花生~
AI 绘画自出现以来一直在不断发展,最明显的体现就是图像生成质量越来越高,还有很重要的一点就是出图速度的提升。比如之前为大家介绍过的 LCM 和 SDXL Turbo,仅用 1-4 步就能完成图像推理,使模型出图速度比之前快了 8-10 倍 。最近,字节又推出了一个新的模型 SDXL-Lightning,它同样能在几秒之内就生成 1024px 的图像, 且出图质量比 LCM 和 Turbo 都要好,今天就为大家介绍一下 Lightning 的功能和用法。
相关推荐:
反转?OpenAI:纽约时报「黑客攻击」了ChatGPT,要求驳回版权诉讼
去年年底,《纽约时报》向微软和 OpenAI 提起侵犯版权诉讼,指控其违规使用了《纽约时报》的内容来进行人工智能开发。在这份起诉书中,《纽约时报》列出了 GPT-4 输出「抄袭」《纽约时报》的「证据」,GPT-4 的许多回答与《纽约时报》的报道段落几乎完全一致:《纽约时报》指责 OpenAI 和微软试图「搭《纽约时报》对其新闻业的巨额投资的便车」,并创建报纸的替代品。彼时,《纽约时报》发言人在一份电子邮件声明中表示:「如果微软和 OpenAI 想要将我们的作品用于商业目的,法律要求他们首先要获得我们的许可,但他们没
仅用 53 秒,商汤办公小浣熊就能助你化身高级打工人
作者丨郭思编辑丨陈彩娴继推出ChatGPT后,龙年伊始,OpenAI公司又推出了最新人工智能文生视频大模型Sora,其火爆效果被誉为即将重塑视频内容创作的未来。 而无论是ChatGPT还是Sora,众多身处职场的「男工女工」都在一边期待一边害怕,工作方式被彻底颠覆。 这一切都是因为AI可以通过现有的网络、数据、资料、知识,展示出超出一般人类的记忆、逻辑、分析、综合能力,如果它能够突破与人交互的界面(语言也是一种界面),那这种能力不仅会超过人类,而且超过几万倍,能较大限度地提高生产效率,也可能会取代部分传统工种。
优刻得为智谱AI构建千卡推理集群,助力全球用户畅享大模型智能生活
时光倒回到 2021 年的那个夜晚。一位妈妈灵感枯竭,无法继续她的小说创作;一旁的爸爸正忙碌于代码的世界,他想要在工作之余开发一款小游戏,却困于代码调试;而他们的孩子,正眉头紧锁地趴在书桌上,为一道奥数题苦思冥想。2024 年的今天,AI 大模型的出现让这一切发生改变。在「智谱清言」的助力下,妈妈的小说创作焕发新生,她只需将自己的创意和构思输入给大模型,就可以生成自然生动的故事情节和对话;爸爸用大模型进行代码编程和调试,通过分析代码逻辑,大大减少了开发的繁琐流程,减轻了一大半的⼯作量;大模型也成为了小朋友学习上的得
重磅发布!Stable Video 零基础使用教程及应用案例
前言
上周 Stable Video 开放公测,可以生成 4s 视频,我第一时间体验了一波。
相比 Sora 可生成 60s 多角度多机位多角色的视频,Stable Video 效果没有那么惊艳。但是相比市面上主流的 AI 视频 Runway、pika 等还是有一定优势的,下文中我也会进行效果对比。
目前 Stable Video 对所有用户都可以免费开发,每天可领 150 积分,图生视频每使用一次消耗 10 积分,文生视频消耗 11 积分,还可以付费升级。
接下来让我们一起来试一试吧。
关于 Sora:一、初步体
自动驾驶领域,「决策」和「感知」终于握手言和
作者丨郭思编辑丨陈彩娴围绕大模型应用于自动驾驶的讨论热度持续升温,却呈现出愈发复杂而矛盾的现象。 一方面,资本力量的积极投入,行业巨头纷纷抢占先机。 例如,特斯拉近期推出了其“端到端”的全自动驾驶软件FSD v12版本,并已在美国和加拿大地区逐步面向非员工用户提供更新服务。
3000字干货!五个章节深入掌握 Stable Cascade(附模型下载)
在 2024 年 2 月 12 日,Stability.Ai 公司发布了新模型 Stable Cascade。
上线了一段时间的新模型,小伙伴们体验感如何呢?这篇文章和你深度聊聊~
往期介绍:一、前言
Stable Cascade 模型最大的优点是是能生成带有文字的图片,文字出错率相比以前模型少很多;
其次是硬件要求降低,甚至与 sd1.5 相比,该架构比之前版本实现了 16 倍的成本降低;
最后一大亮点是模型更加理解提示词语义。这篇文章带大家详细了解 Stable Cascade 模型。最后我整理打包了此模型,「
从 Sora 的发展史,聊聊设计师如何面对 AI 焦虑
经过春节小休整,很多朋友都鼓起信心重新出发,因为吉祥话听多了还是会受用,没想到返岗途中还没来得及跟大家道句开工大吉,资讯话题就被Sora的发布信息填满。
关于这款神器的详细介绍:Sora的发布让人感叹科幻电影都不敢这样拍,而且很多权威平台都认为奥特曼的大招还没亮出来,几句话做60秒视频只是前戏,先吊吊大家胃口,为他后面融资铺垫。此图最近已经符号化了
Sora这个名字据说来自日文中的“空”(そら sora),象征“无限创造力”,众所周知,空也是佛家用语,以我的无知只能找来《道德经》的“无”来应战,无中生有,有生于无,
Sora 面世,视频生成的 GPT-3 时刻来了
2月16日凌晨,正值中国春节法定节假日期间,OpenAI 毫无预兆地发布了 AI 视频生成大模型 Sora。 看过视频效果后,网友纷纷感叹「现实,不存在了。 」不夸张地说,Sora 的技术结果直接碾压了过去世界范围内所有文生视频的探索结果,颠覆了 AI 短视频生成的现状。
新模型 Stable Diffusion 3 与 Stable Cascade 全面解析
大家好,我是花生~
最近 Stability AI 又接连推出了 2 个新的模型:Stable Diffusion 3 和 Stable Cascade,在图像生成效率和质量上比半年前推出的 SDXL 1.0 有了明显提升,今天就为大家介绍一下 2 款新模型的特点和用法。
:一、Stable Diffusion 3 简介
官方介绍:
加入等候名单:
2 月 22 号,Stability AI 发布了新模型 Stable Diffusion 3(下面简称为 SD 3.0),这也是 Stable Diffusion
7000字干货!Sora 提示词秘籍和竞品效果对比
2024 年 2 月 16 日凌晨,OpenAI 正式发布了文本到视频生成模型 Sora,直接生成 60s 视频,多角色多镜头切换的视频,还上了央视新闻。
目前 Sora 并未开放,只向少数导演艺术家开放邀请码。
至此,好莱坞的时代结束了,人人可以做视频电影的时代到来啦!
今天我们就 Sora 生成视频来拆解提示词秘籍公式,竞品视频生成效果对比,解析 Sora 优势劣势和 Sora 模型原理。一、AIGC 视频模型效果对比
首先让我们看看,目前主流的 AI 视频工具 Runway、Pika、Stable Video
幼儿园学历都能看懂! Sora 技术原理科普
本文来源于公众号赛博禅心 ,作者金色传说大聪明
写在前面本文的阅读门槛很高,需要至少幼儿园毕业
本文讲述 Sora 的 Spacetime Patches 技术,此处意义为时空碎片
图片主要来自《哆啦 A 梦:二次元口袋照相机》
OpenAI 好棒,哆啦 A 梦好棒,我好棒!大雄慵懒地躺在房间的地毯上,眼神迷离地看着天花板上的光斑。他翻来覆去地玩着手中的老旧玩具小兵,回想着上个暑假和小伙伴们的那场刺激的野营冒险。大雄:“哆啦 A 梦,那次野营真的很好玩,但我现在只能记得一点点。要是能有办法随时重温那种感觉就好了。”
谷歌Gemini生图功能紧急关闭,口碑一夜塌房,Yann LeCun:我早就知道
Gemini 好像终于被玩坏了。去年年底,谷歌 Gemini 震撼了业界,它是谷歌「最大、最有能力和最通用」的 AI 系统,号称第一个原生多模态大模型,能力超越 GPT-4,也被认为是谷歌反击微软和 OpenAI 的强大工具。对此,在 2 月 8 日,谷歌还把自家对标 ChatGPT 的服务 Bard 更名为 Gemini,以着重体现新使命 —— 旨在提供对「最强模型系列」的访问。上周谷歌还火速更新了 Gemini Pro 1.5 版。结果,推出不到一个月,这个 Gemini 就翻车了。多离谱呢,作为一个多模态的生
国内高校打造类Sora模型VDT,通用视频扩散Transformer被ICLR 2024接收
2 月 16 日,OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构,和市面上大部分主流方法(由 2D Stable Diffusion 扩展)并不相同。为什么 Sora 坚持使用 Diffusion Transformer,其中的原因从同时期发表在 ICLR 2024(VDT: General-purpose Video Diffusion Transformers via Mask Modeling)的论文可以窥见一二。这项工作由