文章列表

Runway Gen-3的视频转绘功能太牛了!大片制作0门槛!

大家好我是花生~ Runway 在推出 Gen-3 Alpha 视频生成模型后,还一直有一些小的更新,比如推出了新的 Turbo 模型,生成速度比原来快了 7 倍;支持尾帧控制;支持将视频延长至 40s 等,都是非常符合用户需求的优化提升。 而它前几天推出的 V2V (Video to Video) 功能,更是将 AI 视频在风格转绘上的水平提升到了一个新的高度,再次秀了一波「AI 视频生成王者」的实力。该功能一经推出就受到众多专业 AI 视频创作者的称赞,并迅速衍生出多种玩法,很有潜力成为一个新的流量风口,喜欢

第三波!2024年9月精选实用设计工具合集

大家好,这是 2024 年 9 月的第 3 波干货合集! 今天推荐近期发现的一些有用、有意思的设计素材。工具合集类的网站一直是我的最爱,今天的合集当中有一个专注于发掘宝藏设计资源的合集网站,此外,还有 Spotify 出品的创作工具,可以生成 UI 和代码的多功能 AI 工具,还有渐变背景素材,以及非常实用的一套 Midjourney 风格提示词库。 当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货: 1、宝藏设计资源和工具合集 ,你的设计速度不够快、效率不够高、效果不

研究称生成式 AI 耗水量巨大:使用 GPT-4 生成 100 字文本需消耗 3 瓶水

据《华盛顿邮报》报道,美国加州大学河滨分校的一项新研究揭示了生成式 AI 的惊人环境成本,尤其是其对水资源的消耗。研究发现,即使只是生成文本,AI 也需要大量的水来冷却服务器。再加上其对电网的巨大压力,进一步凸显了 AI 发展的环境挑战。图源 Pexels研究指出,AI 的用水量因州和数据中心位置的不同而有所差异,但总体而言,水耗与电费成反比。AI在线注意到,得州的水耗最低,生成一封 100 字的电子邮件仅需 235 毫升水,而华盛顿则高达 1,408 毫升,相当于三瓶 16.9 盎司的矿泉水。此外,数据中心本身就

阿尔特曼称 o1 仅仅是“推理模型的 GPT-2”,黄仁勋表示“给你加速 50 倍”

AI 界最有影响力的两个人,同时出现在一场活动:OpenAI CEO 阿尔特曼,暗示了 o1 满血版将在接下来几个月发布。英伟达创始人黄仁勋,则表示新一代 Blackwell 架构 GPU 能给 o1 推理提速 50 倍。阿尔特曼把 o1 在推理模型里的地位比作语言模型中的 GPT-2 阶段。几年后人们将看到“推理模型的 GPT-4”,不过最近几个月就会有重大改进,新范式的进步曲线非常陡峭。L2“推理者”与 L1“聊天机器人”非常不同,大家还没找到该怎么用这些模型,我们也没决定该为 App 继续添加什么功能。不过最

图森未来无人车:转型 AIGC 游戏是为了活下去

“最近出现了大量不实言论和报道,给图森未来造成很大影响”。时隔数年图森高层首次集体现身,包括陈默、吕程、郝佳男 —— 分别是董事长、CEO 和中国区 CEO。也是图森目前“硕果仅存”的领导层。今年年初以来,昔日无人驾驶第一股曝出一系列动向:2 月,失去所有国内自动驾驶合作伙伴;3 月,被曝停止所有研发和商业化活动;5 月,前 CTO 也是创始团队之一王乃岩被曝离职,加入小米汽车;图森也在此时和北美监管机构达成和解协议;8 月,图森发布公告,转向 AIGC 影视动画赛道;9 月,一封股东匿名举报信流出,直指现在的领导

门板上做研究的首席科学家:Jeff Dean解密谷歌和Gemini背后的故事

“最开始我就知道谷歌相当有希望,谷歌能发展到现在的规模不过是水到渠成。 ”这位谷歌首席科学家在谷歌度过了近乎一半的人生,对谷歌的喜爱不减反增,到现在还依然坚守着谷歌最初的愿景并为此奋斗:组织全球信息并使其普遍可用和有用Jeff Dean 还记得刚加入谷歌的时候,每到周二的流量高峰期就开始担心系统会不会崩溃,还好后来及时增加了设备,对代码和搜索功能做了更多优化,谷歌搜索这才步入了正轨。 后来吴恩达在谷歌担任顾问,Jeff Dean 和他商定了大型神经网络的研究目标,最终促成了 Google Brain 团队的成立。

新代码暗示 OpenAI 本月 24 日推出 ChatGPT AI 高级语音模式

科技媒体 testingcatalog 昨日(9 月 18 日)发布博文,报道称 OpenAI 公司可能会在 9 月 24 日进一步推广 ChatGPT 的高级语音模式,甚至可能是直接正式发布。OpenAI 于今年 7 月宣布向一小部分 ChatGPT Plus 用户开放 ChatGPT 的高级语音模式,让用户首次获得 GPT-4o 的超现实音频响应。AI在线援引该媒体报道,OpenAI 公司已更新高级语音模式 FAQ 页面,在代码中被发现“hasSeenAdvancedVoice/2024-09-24”的字符串,

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]本论文第一作者倪赞林是清华大学自动化系 2022 级直博生,师从黄高副教授,主要研究方向为高效深度学习与图像生成。他曾在 ICCV、CVPR、ECCV、ICLR 等国际会议上发表多篇学术论

新型蛋白质大语言模型即将登陆Google Cloud

编辑 | KX9 月 17 日,领先的细胞编程和生物安全平台 Ginkgo Bioworks 公司宣布了两项新产品,将助力制药和生物技术公司更容易开发新药,这是在去年与 Google Cloud 宣布的合作伙伴关系的基础上推出的。与 Google Cloud 合作构建的蛋白质大型语言模型 (LLM),是业内首创之一,它将使个人研究人员和企业公司能够利用 Ginkgo 私人数据的见解开发药物。其次,Ginkgo 正在推出其模型 API,这是一种强大的工具,旨在将生物 AI 模型直接带给机器学习科学家。该 API 现已

大语言模型如何助力药物开发? 哈佛团队最新综述

作者 | 莫纳什大学郑伊圳编辑 | ScienceAI大语言模型因其展现出类人般的推理、工具使用和问题解决能力而备受瞩目,此外,它在化学、生物学等专业领域也展现出深厚的理解能力,进一步提升了其应用价值。近日,哈佛大学、莫纳什大学和格里菲斯大学(Griffith University)组成的研究团队,发表最新综述《Large Language Models in Drug Discovery and Development: From Disease Mechanisms to Clinical Trials》。论文

实测 | GPT-o1:学会了思考,也学会了偷懒

我可能是全网第一个花钱向 GPT-o1 提问,人在深圳靠一条网线横跨太平洋到美国硅谷让 OpenAI 最强大模型 GPT-o1 模型思考 38 秒之后、宕机了半小时选择拒绝回答问题并收了我2.5块(一瓶肥宅快乐水)的韭菜......  (因为这个模型只支持订阅使用并且一个月只回复120条内容,plus会员订阅费1个月20美刀,约等于1.25软妹币1条回答......)OpenAI 今天凌晨突击更新 GPT-o1,早上起来全网都在开香槟,大意就是突破了LLM极限,新模型能力在生物、物理比肩甚至超越人类博士生。 另一个特性就是 o1 模型会用更长的时间思考以此来尽可能完善的回答问题。

易用性对齐 vLLM,推理效率提升超200%,这款国产加速框架什么来头?

一、行业背景2022 年 10 月,ChatGPT 的问世引爆了以大语言模型为代表的的 AI 浪潮,全球科技企业纷纷加入大语言模型的军备竞赛,大语言模型的数量、参数规模及计算需求呈指数级提升。大语言模型(Large Language Model,简称 LLM 大模型)指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大模型通常包含百亿至万亿个参数,训练时需要处理数万亿个 Token,这对显卡等算力提出了极高的要求,也带来了能源消耗的激增。据斯坦福人工智能研究所发布的《2023 年 AI

高手都在用 AI 做字体设计了!这 5 个神器你一定要了解

大家好我是花生~ 最近在浏览 AI 绘画的相关内容时,发现不少图像都是与字体相关的,而且其中一些呈现出的艺术特效很是让人眼前一亮。放在之前,我们需要掌握一些专业技能、并花费大量时间才能设计出精致酷炫的艺术字,但是现在却可以轻松用文本直接生成,这无疑极大地提升了设计效率,而且用 AI 探索出的风格也比我们能想象的更丰富多样。 那今天就为大家介绍一下目前在文本渲染上效果比较好的 5 款工具,它们各有自己的特色与优势,看完后你肯定会对 AI 绘画在字体设计上的应用有更全面的认识。 相关推荐:一、遥遥领先的 Ideogra

昂贵LLM的救星?Nature新研究提出新型忆阻器,比Haswell CPU高效460倍

前些天,OpenAI 发布了 ο1 系列模型,它那「超越博士水平的」强大推理性能预示着其必将在人们的生产生活中大有作为。但它的使用成本也很高,以至于 OpenAI 不得不限制每位用户的使用量:每位用户每周仅能给 o1-preview 发送 30 条消息,给 o1-mini 发送 50 条消息。实在是少!为了降低 LLM 的使用成本,研究者们已经想出了各式各样的方法。有些方法的目标是提升模型的效率,比如对模型进行量化或蒸馏,但这种方法往往也伴随着模型性能的下降。另一种思路则是提升运行这些模型的硬件——英伟达正是这一路

陶哲轩提前实测满血版 OpenAI o1:能当研究生使唤

原来早在 8 月份,陶哲轩就已经用上了 OpenAI o1。还是现在大家都用不上的满血版本(眼泪不争气地从嘴角流出来)。提前批大佬是怎么玩最新天花板的呢?他向 o1 模型提出一个措辞模糊的数学问题,发现它竟然能成功识别出克莱姆定理。而且答案是“完全令人满意的”那种。当然,陶哲轩还做了一些其它测试,测下来总体体验就是:比以前的模型更牛,多堆点提示词表现还不错,但仍然会犯不小的错误,也没有产生啥自己的思想。陶哲轩是这样形容的:这种感觉,就像给一个平庸无奇但又有点小能力的研究生提供建议。不过,这已经比以前的模型有所改进,

消息称 OpenAI 明年调整结构,转变为传统的营利性公司

《财富》(fortune)于 9 月 13 日发布博文,报道称山姆・阿尔特曼(Sam Altman)在最近周会上,向 OpenAI 公司员工宣布,将于明年调整颇为复杂的非营利性企业结构。报道称 OpenAI 在保留一个非营利部门之外,调整成为更传统的营利性公司。阿尔特曼表示 OpenAI 将摆脱非营利实体控制,转型为一家更为传统的营利性组织,但在周会上并未透露更多细节。AI在线援引消息源报道,OpenAI 一位发言人透露公司仍“致力于构建造福所有人的 AI”,并强调非营利性是“其使命的核心,并将持续存在”。Open

「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢

在 AI 领域,几乎每个人都在谈论大型语言模型,其英文全称为 Large Language Models,简写为 LLM。因为 LLM 中有「Language」一词,因此,大家默认这种技术和语言密切相关。然而,知名 AI 大牛 Andrej Karpathy 却对此有着独特的见解:「大型语言模型(LLM)名字虽然带有语言二字,但它们其实与语言关系不大,这只是历史问题,更确切的名字应该是自回归 Transformer 或者其他。LLM 更多是一种统计建模的通用技术,它们主要通过自回归 Transformer 来模拟

大厂AI设计实战!飞猪如何用AI打造100种不可思议的旅行?

以下视频来源于飞猪设计当视频在手机上无法加载,可前往PC查看。这 100 种全球不可思议的旅行玩法,是否有一个吸引了你,现在就想出发呢? 在这个人人都能营销的时代,传统的大市场、大高空、大观点的中心化营销方式正在逐步走向小团体、私空间、个性化的转变。曾经,一句响亮的 Slogan、一幅吸睛的大 KV、一段创意十足的 TVC 或许就能让消费者目不转睛,甚至占领心智。而如今,面对这类营销,对于消费者个体来说内心只会充满问号,who care?和我有什么关系?如果不能共情,那就请不要打扰我。 因为消费者早已不是信息的被动