AIGC宇宙 AIGC宇宙

文章列表

面壁智能开源 MiniCPM-V 2.6 模型:号称端侧 AI 多模态能力对标 GPT-4V,6G 内存可用

面壁智能昨日开源了 MiniCPM-V 2.6 模型,官方表示将端侧 AI 多模态能力拉升至全面对标 GPT-4V 水平。官方称 MiniCPM-V 2.6 模型仅 8B 参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,有以下特点:“三合一最强”端侧多模态:首次在端侧实现单图、多图、视频理解等多模态核心能力全面超越 GPT-4V,单图理解越级比肩多模态王者 Gemini 1.5 Pro 和新晋顶流 GPT-4o mini多项功能首次上端:实时视频理解、多图联合理解、多图 ICL 视觉类比学习、多图
8/7/2024 10:05:21 AM
沛霖(实习)

传月之暗面完成 3 亿美元融资,最新估值 33 亿美元;OpenAI 加持,最强人形机器人 Figure 02 登场丨AI情报局

今日融资快报月之暗面完成3亿美元新一轮融资,投后估值33亿美元,月之暗面回应:不予置评据彭博社报道,月之暗面刚刚完成了新一轮 3 亿多美元融资,此次融资将月之暗面的估值推高至 33 亿美元,并吸引了包括腾讯、高榕资本和老股东阿里巴巴在内的其他投资者。 对此,有接近公司的知情人士表示,此次腾讯参投消息属实。 而月之暗面则回应称,对该融资消息不予置评。
8/7/2024 9:57:00 AM
我在思考中

OpenAI 在 API 中引入结构化输出,最新版 GPT-4o AI 模型达到 100% 满分

感谢OpenAI 公司昨日(8 月 6 日)发布新闻稿,宣布在 API 中引入结构化输出(Structured Outputs)。OpenAI 公司此前已提供结构化输出,用户可以指定 "response_format": {"type": "json_object"}} 来请求一个有效的 JSON 对象,也可以使用函数调用机制来请求符合特定模式的响应。OpenAI 在导言中表示,结构化输出功能可确保模型生成的响应始终符合用户提供的 JSON 模式,因此用户无需担心模型会遗漏必填键或生成无效的枚举值。AI在线附上结构
8/7/2024 9:54:41 AM
故渊

AI 绘画新标杆!一文详解最新开源模型 Flux.1(附新版工作流&模型资源包)

大家好,这里是和你们一起探索 AI 的花生~ 继 SD 3 Medium、Kolors 之后,开源领域又新增了一款文本-图像生成模型 Flux.1。它由 Stability AI 前核心成员主导开发,模型质量远超 SD 3,甚至与闭源的 Midjourney v6.1 模型不相上下,成为了 AI 文生图模型的新标杆,也给开源 AI 绘画带来了新的发展活力。今天就一起来看看 Flux.1 模型的特点和安装使用方法。 相关推荐:一、Flux.1 简介 Black Forest Labs 官网: Flux.1 是由 B
8/7/2024 8:15:14 AM
夏花生

第一波!2024年8月精选实用设计工具合集

大家好,这是 2024 年 8 月的第 1 波干货合集!这一期干货合集当中绝大多数都是 AI 工具,基于 AI 生成交互式信息图和流程图的平台,免费在线图生文的 AI 工具,免费生成 3D 素材的 AI 平台,以及基于 Json 数据生成 UI 界面的 AI 平台,另外还有一个免费便捷的图片包装工具。 当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货: 1、将图表转化为交互式信息图的平台 是一个超强的、基于 AI 的交互式信息图表生成和制作工具,一方面,它可以相当轻松地将手绘的流
8/7/2024 7:55:12 AM
陈子木

Meta 构建分布式 RoCEv2 网络:探索串联数万片 GPU,训练千亿参数级 AI 模型

Meta 公司于 8 月 5 日发布博文,表示为了满足大规模分布式 AI 训练对网络的需求,构建了基于 RoCEv2 协议的大规模 AI 网络。RoCEv2 的全称是 RDMA Over Converged Ethernet version 2,是一种节点间通信传输方式,用于大部分人工智能容量。Meta 公司已成功扩展了 RoCE 网络,从原型发展到部署了众多集群,每个集群可容纳数千个 GPU。这些 RoCE 集群支持广泛的生产型分布式 GPU 训练工作,包括排名、内容推荐、内容理解、自然语言处理和 GenAI 模
8/7/2024 7:35:32 AM
故渊

免费!字节这款AI音乐神器,30秒速成抖音神曲

机器之能报道编辑:杨文抖音神曲制造机。近日,字节酝酿许久的 AI 音乐创作神器 —— 海绵音乐,终于向公众开放啦!只需要输入主题或者几句歌词,短短几十秒钟,它就能一口气创作出 3 首神曲。歌词、旋律、演唱一锅出,看来以后抖音上会蹦出一堆 AI 歌曲。例如,我们输入「不想上班了,想回家种地」,不到 30 秒,三首民谣歌曲就出炉了。试听链接:,第一首竟有点赵雷的味道。-1-206 首精选歌曲,总有一款适合你与 Suno 类似,海绵音乐也推出了精选榜单,涵盖 R&B、摇滚、嘻哈、电子、国风等多种音乐风格。我们耐着性子数了
8/6/2024 6:25:00 PM
机器之能

OpenAI 宣布 10 月起举办第 2 届 DevDay 开发者大会:无新 AI 模型,聚焦 API 和开发工具

OpenAI 公司宣布将于 2024 年 10 月 1 日起,在旧金山、伦敦和新加坡举办 2024 年度 DevDay 活动,遗憾的是本次活动不会发布新的 AI 前沿模型。OpenAI 计划在旧金山、伦敦和新加坡分别举办活动,AI在线附上具体日程如下:旧金山:10 月 1 日伦敦:10 月 30 日新加坡:11 月 21 日OpenAI 公司于 2023 年 11 月举办了首届 DevDay 开发者大会,公布了具有 128K 上下文和更低价格的 GPT-4 Turbo、新的 Assistants API、GPT-4
8/6/2024 2:43:53 PM
故渊

OpenAI人事地震:奥特曼盟友Brockman长期休假,联创Schulman转投Anthropic,产品负责人已离职

OpenAI 的领导层,再次传来三则人事变动的重要消息。首先,OpenAI 总裁、11 位联合创始人之一 Greg Brockman 将长期休假。这位高管在将 OpenAI 突破性成果转化为大规模 AI 模型和产品(如 ChatGPT)方面发挥了至关重要的作用,而且在山姆・奥特曼被董事会罢免后争取重返公司期间,他还是山姆・奥特曼的重要盟友。Greg Brockman 告诉员工的版本是,自己计划在延长假期后重返公司。不过,身居要职的高管进行长期休假,难免让外界产生一些猜测。此外,另一位联合创始人 John Schul
8/6/2024 2:10:00 PM
机器之心

英伟达被曝未经许可抓取 YouTube、Netflix 平台视频用于训练 AI

科技媒体 404Media 披露的文件显示,英伟达收集了大量受版权包含的内容,用于训练人工智能(AI)。该媒体披露的内部邮件、电子邮件、Slack 对话以及相关文件显示,英伟达从 YouTube 等多个来源收集视频素材,用于扩充训练 AI 的数据集。该媒体披露的对话显示参与该项目的员工曾提出质疑,认为擅自使用 YouTube 视频以及研究目的编译的数据集,在法律层面可能会存在问题。不过项目经理的回复是,这种收集模式已经获得了公司最高层的许可,可以使用这些内容训练 AI,并认为“完全符合版权法的文字描述和精神”。一位
8/6/2024 1:53:57 PM
故渊

OpenAI 宣布改变开发者大会举办形式,不会公布 GPT-5

8 月 6 日消息,去年,人工智能初创公司 OpenAI 在旧金山举办了首次开发者大会,声势浩大,并推出了包括最终未能成功的 GPT Store(类似苹果应用商店)在内的多款新产品和工具。然而,今年的活动将相对低调。本周一,OpenAI 宣布,将其 DevDay 开发者大会转型为一系列聚焦开发者的参与式会议。公司还确认,在 DevDay 期间不会发布下一代主旗舰模型,而是将重点放在其 API 和开发者服务的更新上。OpenAI 发言人透露:“我们不打算在开发者大会上宣布我们的下一个模型。我们将更多地专注于向开发者介
8/6/2024 12:15:05 PM
小小

OpenAI 人事巨变:三位核心人物一个休长假,两个离职

感谢据彭博社报道,OpenAI 公司发言人表示,OpenAI 总裁、公司核心人物之一 Greg Brockman 将休长假,以“放松和充电”。另外,研究员 John Schulman 今日离职,将前往竞争对手人工智能 AI 初创公司 Anthropic。Brockman 在 X 上表示,其将休假到年底,他写道,“自 9 年前共同创立 OpenAI 以来,这是第一次放松。任务还远没有完成,我们仍然有一个安全的 AGI 需要构建。”Schulman 也证实了他的离职,“我做出了离开 OpenAI 的艰难决定。这个选择源
8/6/2024 12:06:24 PM
远洋

被索赔 500 万美元,OpenAI 遭 YouTube 主播集体诉讼:擅用其内容训练 AI

感谢一位 YouTube 主播上周五向美国加利福尼亚州北区地方法院递交集体诉讼文件,指控 OpenAI 公司在未告知通知视频所有者或向其提供补偿的情况下,擅自抓取数百万个 YouTube 视频脚本,用于训练 AI 生成模型。该主播名为大卫・米莱特(David Millette),来自美国马萨诸塞州,指控 OpenAI 公司抓取其和其他主播创作者的视频,用于训练 AI 模型,涉及的产品包括 ChatGPT、Sora 等等。集体诉讼文件认为 OpenAI 收集这些数据,并得到了“丰厚的回报”,但这种做法违反了版权法和
8/6/2024 11:29:45 AM
故渊

OpenAI 又一位联创离职,公司动荡仍在持续?

北京时间8月6日早上八点,OpenAI联合创始人John Schulman在twitter发文,宣布从OpenAI离职,加入Anthropic深入研究AI对齐。 在twitter发布的这封离职信中,John Schulman表示从OpenAI离职只是出于个人职业发展需要,希望能够集中精力专注AI对齐研究,重返技术工作,并不是因为OpenAI缺乏对对齐研究的支持。 John Schulman回忆了过去九年在OpenAI的经历,表达了对Sam Altman、Greg Brockman邀请他加入初创团队的感谢,也表示对OpenAI的未来发展充满信心。
8/6/2024 10:08:00 AM
刘洁

OpenAI 联合创始人 John Schulman 离职,加入 AI 创企 Anthropic

感谢OpenAI 联合创始人 John Schulman 今日官宣离职,将加入人工智能初创公司 Anthropic。Schulman 在给 OpenAI 同事的告别信中表示,他选择离开是为了更专注于 AI 对齐研究,并在 Anthropic 展开新的职业篇章。他强调,离职并非因为 OpenAI 在对齐研究方面支持不足,而是个人职业发展选择。近 9 年前,Schulman 研究生毕业后加入 OpenAI,成为创始团队的一员。这是他工作过的第一家也是唯一一家公司。“我相信,即使没有我,OpenAI 和团队也将继续蓬勃发
8/6/2024 9:34:31 AM
汪淼

比 Midjourney 还强的AI绘画模型 Flux 到底有多好用?(附工作流和模型)

好久没更新了,最近发布的 Flux 质量着实惊艳到了我,顺便整理了一下发布了这篇文章。关于 ComfyUI 进阶教程我已经重新拾起来了,后面会继续更新。 往期教程:前言: 前 Stability AI 成员 Robin Rombach 创立了 Black Forest Labs 并发布了三个开源模型:FLUX.1 [pro]、FLUX.1 [dev] 和 FLUX.1 [schnell];[pro] 是最顶级的模型,但是仅可通过 API 调用; [dev] 是由[pro]提炼,开源但非商用,质量和效果与[pro]类
8/6/2024 8:25:52 AM
搞设计的花生仁

马斯克重启对 OpenAI 及其 CEO 阿尔特曼的诉讼

感谢据纽约时报报道,埃隆・马斯克重启对 OpenAI 及其首席执行官萨姆・阿尔特曼(Sam Altman)的诉讼。马斯克指责 OpenAI 将利润和商业利益置于公众利益之上,还违背了免费共享或开源公司技术的承诺,选择向微软提供技术的独家许可。今年 6 月,埃隆・马斯克在加州法院撤回了针对 OpenAI 以及该公司两位联合创始人萨姆・阿尔特曼 (Sam Altman) 和格雷格・布罗克曼 (Greg Brockman) 的诉讼。此前他指控该公司违反合同,并声称其放弃了造福人类的初衷。AI在线注意到,当时马斯克撤诉的决
8/5/2024 8:34:49 PM
浩渺

实测最新文生图神器「FLUX.1」:「手刃」Midjourney?早了点

机器之能报道编辑:杨文FLUX.1强在文字生成上,Midjourney赢在审美和质感上。Stable Diffusion 这个团队,用一句话形容就是:聚是一团火,散是满天星。最近,Stable Diffusion 作者之一 Robin Rombach 官宣创业,成立了新公司「Black Forest Labs」(黑森林实验室),并推出了最新文生图模型「FLUX.1」。这个模型有多牛?看效果:Prompt:a portal into a mythical forest on the wall of my small
8/5/2024 4:50:00 PM
机器之能