文章列表

性能提升、成本降低,这是分布式强化学习算法最新研究进展

深度强化学习(Deep Reinforcement Learning,DRL)是一种公认的解决连续决策问题的有效技术。为了应对 DRL 的数据低效(data inefficiency)问题,受到分布式机器学习技术的启发,分布式深度强化学习 (distributed deep reinforcement learning,DDRL) 已提出并成功应用于计算机视觉和自然语言处理领域。有观点认为,分布式强化学习是深度强化学习走向大规模应用、解决复杂决策空间和长期规划问题的必经之路。分布式强化学习是一个综合的研究子领域,需

华为盘古大模型变「小」,1.5B也很能打

ChatGPT 等系列模型横空出世,以其强大的性能引起了全球的关注,有望改变人与计算机之间的交互方式,应用到千行百业。然而这些大型模型的实际需要极高的内存和计算资源,限制了它们在各种场景中的应用。例如,具有 175B 参数的 GPT-3 在使用 FP32 数据类型存储时需要大约 700GB 内存。尽管 7B 参数模型相对更高效,但其资源需求仍然难以直接部署在手机等边缘设备上。此外,尽管许多研究已经成功地打造出多个效果很好的大语言模型,但他们往往采用相似的训练策略。一方面,大量工作集中在收集和清理数据上,较少强调研究

7万亿美元:OpenAI超大芯片计划曝光,要重塑全球半导体行业

通用人工智能要迎来大结局了?OpenAI 的 CEO 山姆・奥特曼(Sam Altman)引领了近期生成式 AI 的大发展。最近,他又有了一个宏伟目标:重塑全球半导体行业。据《华尔街日报》近日报道,奥特曼正在推动一个旨在提高全球芯片制造能力的项目,并在与包括阿联酋政府在内的不同投资者进行谈判。一位消息人士称,奥特曼可能要为这一计划筹集 5 万亿至 7 万亿美元。OpenAI 发言人表示:「OpenAI 就增加芯片、能源和数据中心的全球基础设施和供应链进行了富有成效的讨论,这对于人工智能和相关行业至关重要。鉴于国家优

谷歌Gemini Ultra 大会员:每月19.99美元

谷歌大模型的新篇章翻开一页 —— 这还只是 Ultra 的 1.0 版。时代变了。北京时间 2 月 8 日晚,随着桑达尔・皮查伊(Sundar Pichai)的一声宣布,谷歌大模型体系全面进入了 Gemini 时代,并带来最新的 Gemini Ultra 模型。距离 Bard 推出还不到一年,谷歌的所有生成式 AI 服务这次实现了改头换面。原来的 Bard 网站已经改为 Gemini: 12 月 Gemini 系列的发布时,谷歌已经预告过能力最强的 Gemini Ultra 大模型。当时推出的 Gemini Pro

如何用AI工具快速制作红包封面?教程来了!

红包封面制作简易教程来啦! 更多教程:微信红包封面开发平台: WHEE-AI 绘画工具: RUNWAY-AI 视频工具: 美图抠图-抠图工具: 熊猫压缩-图片压缩工具:

系统Prompt长达1700个token,ChatGPT变「懒」的原因找到了?

ChatGPT:我不是不会,就是不想干活。现阶段,ChatGPT 已经成为很多人的得力助手,写文档、编代码、生成图片…… 但看似无所不能的 ChatGPT,也有其懒惰的一面。不知大家是否还记得去年年底 GPT-4 开始变「懒」的事实,比如对于用户提出的要求,ChatGPT 的响应会变得非常缓慢且敷衍,甚至还会单方面中断对话;又比如用户要求 ChatGPT 编写一段代码,它会建议用户自己去写。当时,OpenAI 给出的解释是模型行为是不可预测的,他们也在研究如何修复。一种看似无解的问题,现在另一种解释似乎正在被广大网

斯坦福和OpenAI提出meta-prompting,最强零样本prompting技术诞生了

在我们的工作群里,经常会有一位管理者来协调每个人的工作并汇总工作成果。近日,斯坦福大学的 Mirac Suzgun 和 OpenAI 的 Adam Tauman Kalai 提出了一种新的 prompting 方法:meta-prompting。类似于工作群,这种方法也是使用一个居中协调的指挥员(元模型)来协调使用不同用途的 AI 和其它工具。最新一代语言模型(尤其是 GPT-4、PaLM 和 LLaMa)已经成功拓展了自然语言处理和生成的边界。这些大规模模型可以解决许多不同任务,从写莎士比亚风格的十四行诗到总结复

吉他摇滚、电子音乐都能搞定,Meta开源音频生成新模型MAGNeT,非自回归7倍提速

MAGNeT 有望改变我们体验音乐的方式。在文本生成音频(或音乐)这个 AIGC 赛道,Meta 最近又有了新研究成果,而且开源了。前几日,在论文《Masked Audio Generation using a Single Non-Autoregressive Transformer》中,Meta FAIR 团队、Kyutai 和希伯来大学推出了 MAGNeT,一种在掩码生成序列建模方法,可以直接在多个音频 tokens 流上直接运行。与以往工作最大的不同是,MAGNeT 是由单阶段、非自回归 transform

5000字干货!盘点2023年Stable Diffusion GUI工具及其创作生态

正文开始之前,这里先用一句话概括性的介绍一下 Stable Diffusion:它是一种基于深度学习的文本到图像的生成模型。能够根据文本描述创造出丰富多样且具有高质量和细节的图像。它的生成模型是通过大规模图像及其描述的数据集训练而成,所以生成的图像在保持高创造性的同时,还具有较高的高分辨率。另外因其开源性质和强大的功能在 AI 绘画领域具有重要的地位。具体的原理这里就不展开讲了,我们只需要知道它是一种能够通过文本描述生成图像的 AI 绘画工具就够了。2023 年是 AI 相关技术井喷式爆发的一年,在 AI 绘画领域

ML Blocks!全新的节点式 AI 图像处理神器

大家好,我是花生~ 之前为大家介绍过不少 AI 图像处理神器,比如 Clipdrop、Pixian、Upscayl 等,可以帮我们便捷地完成抠图、修图、高清放大等任务。最近又发现了一个新的 AI 图像处理工具 ML Blocks,非常有意思,今天推荐给大家~ 相关推荐:ML Blocks 官网直达: 官方教程: 与我们常用的图像处理工具不同,ML Blocks 的工作界面是一块白板,它的各种图像处理功能则被分为一个个独立的模块,当我们想实现某种图像处理效果时,可以自己将对应的模块连接到一起形成的工作流(work

俄罗斯小哥ChatGPT找女友:聊了5239个女生,现在订婚了

有事 AI 它是真上啊。「我向一位女生求婚,ChatGPT 已经和她交流了一年。为了走到这一步,AI 已经尝试了和 5239 名女生进行过沟通……」                              来源:,社交网络上人们正在轮番向一位俄罗斯小哥送去祝福。23 岁的 Aleksandr Zhadan 是一名 AI 开发者,也是社交平台 TenChat 的一名产品经理。故事是这样开始的:GPT 除了搜索之外,还可以在配对后写入。这样在 50 次自动执行中,他可以获得 18 次配对。GPT 在没有 Aleksa

浙大团队发布 75 页科学 LLM 调查,重点关注生物和化学领域,指出七个未来发展方向

编辑 | X大型语言模型 (LLM) 已成为增强自然语言理解的变革力量,代表着通用人工智能的重大进步。LLM 的应用超越了传统的语言界限,涵盖了科学领域各学科中开发的专业语言系统。这也导致了科学 LLM 的出现。作为科学人工智能(AI for Science)领域的一个新兴领域,科学 LLM 值得全面探索。然而,目前缺乏系统的、最新的调查来介绍它们。近日,来自浙江大学的研究团队,系统地描述了「科学语言」的概念,同时对科学 LLM 的最新进展进行了全面回顾。鉴于科学学科领域广阔,该分析重点关注生物和化学领域。这包括对

Midjourney 又变强了!一文详解新功能 Style Reference

大家好我是花生~ 没错今天依旧是 Midjourney 的相关内容, 因为它又推出了一个非常重要的新功能—— Style Reference (风格参考),可以学习一张图像的风格并生成相似新图像。 新功能的用法是怎样的?与 Image Prompt 垫图又有什么区别呢?一起来看看吧~ 上期回顾:一、 Style Reference 使用介绍 如果说 Style Tuner 让我们能探索出更多独特的新风格,那么 Style Reference 就让复制某种特定风格变得更加容易,作用类似于 SD 里的 controln

重磅发布!大淘宝设计部 2023 年度AI设计实践报告出炉

22 年中,绘制头像还在用 3D 进行建模,到了年末,就已经用 AI 直接生成了。 22 年末,面对 AI 工具设想能不能在我们业务中进行尝试,到了 23 年中,AI 工具已经覆盖我们团队所承接的所有营销场景业务。 23 年初,团队同学讲到 AI 工具的应用时觉得这是一个专业亮点,到了 23 年末,AI 工具已成为我们团队设计师的基础能力。 这一切,都变的太快。 这一年,也积累了些心得。 首先 AI 工具带来降本增效,让我们的创意效果快速产生,设计方案有效达成。 其次增效不仅仅增的是效率,还有设计效果。设计自由度极

击败OpenAI,权重、数据、代码全开源,能完美复现的嵌入模型Nomic Embed来了

模型参数量只有 137M,5 天就能训练好。一周前,OpenAI 给广大用户发放福利,在下场修复 GPT-4 变懒的问题后,还顺道上新了 5 个新模型,其中就包括更小且高效的 text-embedding-3-small 嵌入模型。我们知道,嵌入是表示自然语言或代码等内容中概念的数字序列。嵌入使得机器学习模型和其他算法更容易理解内容之间的关联,也更容易执行聚类或检索等任务。可见,嵌入在 NLP 领域是非常重要的。不过,OpenAI 的嵌入模型并不是免费给大家使用的,比如 text-embedding-3-small

独家 | 月之暗面正在进行两亿美元融资,投前估值高达 15 亿美元

作者丨郭   思编辑丨陈彩娴AI 科技评论独家获悉,月之暗面近日正在进行 2 亿美元融资,本轮投资由蚂蚁和阿里集团共同投资,投前估值预计 15 亿美元。 据了解,月之暗面团队成员人数在100人至200人之间。 团队创始人杨植麟是一个90后,本科毕业于清华大学计算机科学与技术系,博士就读于全美自然语言处理排名第一的卡内基梅隆大学语言技术研究所(LTI),师从苹果AI研究负责人Ruslan Salakhutdinov、谷歌首席科学家William Cohen。

如何借助AI让用户体验更智能?来看手机天猫的实战案例!

AI 当前如火如荼,正以惊人的速度改变着我们的生活和工作方式。我们淘宝设计团队也在探索如何借助 AI 的能力,打破谈及 AI 即聊天对话的思维惯性,构建更高效、实用、符合电商场景的体验范式,来帮助用户解决全链路购物场景问题,重塑用户的购物体验。 更多天猫设计案例:手猫 AI 购物助手 一、回归需求本身 谈到 AI 智能工具,大家对 Chat GPT 这类沉浸式聊天对话式 AI 产品一定不陌生。 但对电商平台来说,用户场景更为复杂,用户常常在搜索和查看商品间反复横跳,在商品详情页庞杂的信息中翻找,在多个商品间纠结不知

Midjourney Niji 6 重磅更新!风格全面升级,支持文本生成!

大家好我是花生~ 在 V6 模型推出 1 个多月后,Midjourney 终于在昨天上线了 Niji 6 模型,其出图质量与 Niji 5 相比有了很大的提升,风格感也变得更强了,今天我们一起来看看 Niji 6 的特性以及相关使用技巧~ 上期回顾:Niji 本身就是一个“动漫风”模型,可以生成高质量的二次元图像以及插画,这点大家在使用过程中肯定都有感受到。而在生成非动漫主题的图像时,Niji 模型也偏向于将其处理成插画风,并赋予图像一种鲜明的风格,或者是朦胧梦幻,或者是绚烂多彩,让原本偏写实的图像更具美感。 下图