应用

国产开源绘画模型 Kolors！可生成中文字符，质量超越 SD3 与 MJ

大家好，这里是和你们一起探索 AI 的花生~ 最近国内科技公司快手在 AI 方面接连发力，推出了类 Sora 视频生成模型「可灵 Kling」、人像动画控制模型「Liveportait」、以及文生图扩散模型「可图 Kolors」，质量均位于同类模型前列，在国外互联网上都引起了广泛的关注和讨论，颇有异军突起之势。其中「可图 Kolors」为开源模型，它不仅在生成质量上超过了前段时间推出的 SD3，与 Midjourney v6 模型不相上下，还支持识别中文提示词和生成中文字符，可谓是国产开源绘画模型之光，今天就为大

7/12/2024 8:01:31 AM

夏花生

ComfyUI 进阶篇！完整梳理 ComfyUI 的核心节点（一）

前言：学习 ComfyUI 是一场持久战。当你掌握了 ComfyUI 的安装和运行之后，会发现大量五花八门的节点。面对各种各样的工作流和复杂的节点种类，可能会让人感到不知所措。在这篇文章中，我们将用通俗易懂的语言对 ComfyUI 的核心节点进行系统梳理，并详细解释每个参数。希望大家在学习过程中培养自我思考的能力，真正掌握和理解各个节点的用法与功能。在实践中不断提升自己的技术水平。只有通过不断的探索和总结，才能在面对复杂的工作流时游刃有余。祝大家学习顺利，早日成为 ComfyUI 的高手！一、Load Check

7/12/2024 1:51:37 AM

AI实战

人形机器人将当上银行“大堂经理”，国内首个场景训练基地在上海浦东启用

据“上海金融官微”公众号，国内首个人形机器人银行大堂经理场景训练基地在建行上海浦东分行正式启用。银行大堂经理场景训练基地是业内首个商业银行场景应用训练基地，其首次采用开放式的创新训练模式，有助于加快提升人形机器人的能力，推动关键技术、重点产品和重点场景应用。据介绍，此次参训的机器人拥有高度仿生的躯干构型和拟人化的运动控制，结合视觉、听觉、语音等人工智能技术，科学家可以通过具身智能的推理和规划等对其进行训练。目前，该银行已对智能人形机器人开展银行大堂业务咨询、业务分流、智慧柜员机个性化操作指南、反欺诈宣传等面向客户的

7/11/2024 6:03:37 PM

清源

三星确认今年将推出 AI 升级版 Bixby，由自研大语言模型提供支持

三星确认 Bixby 将很快获得人工智能升级。在 Galaxy Z Flip 6 和 Galaxy Z Fold 6 发布后，三星移动部门 CEO TM Roh 在接受 CNBC 采访时表示，公司将在今年晚些时候发布升级版 Bixby，并由三星自家的大语言模型（LLM）提供支持。Roh 表示：“我们将通过应用生成式人工智能技术来提升 Bixby 的能力。”几个月前，三星推出过名为“Samsung Gauss”的自研 LLM。此前曾有报道称三星正在研发升级版 Bixby，但这是三星首次确认相关消息，并透露了大致发布时

7/11/2024 3:59:02 PM

远洋

第二波！2024年7月精选实用设计工具合集

大家好，这是 2024 年 7 月的第 2 波干货合集！这一期干货合集有专门生成 SVG 矢量素材的 AI 平台，免费生成 PNG 透明背景的 AI 平台，基于 AI 进行前期产品灵感探索的平台，以及在线生成可编辑 Banner 的 AI 平台，此外还有免费生成渐变背景的工具，以及次世代 3D 可视化设计的平台，都是精选的好东西。当然，在此之前记得看看往期干货中有没有你感兴趣的素材：下面我们具体看看这一期的干货： 1、AI 生成的免费 SVG 矢量素材合集网站 SVGStud.io 的网站，是一个基于 AI 来

7/11/2024 8:31:47 AM

陈子木

保姆级教程！小学生看了都会的AI视频短片制作教程

前言我相信这是一篇针对大朋友、小朋友都通俗易懂的视频剧本构思到视频落地的全流程拆解教程。基于大语言模型和绘图模型的前提，有了一次和小伙伴们探索文生图到图生视频的创作实践。废话不多说，直接上保姆级干货教程！保证你能够轻松学会！学之前，快来看看我们制作的视频短片吧~当视频在手机上无法加载，可前往PC查看。一、前期准备 1. 确定主题针对于现有的 AI 生成能力，央视推出了多组 AI 视频短片，为此我们也决定生成一个符合时代主旋律的 AI 小视频。经过脑暴阶段，有了一带一路背景下丝绸之路这个角度的创作故事。创作方向

7/11/2024 6:40:27 AM

桂大羊

AI文档搜索公司Hebbia完成1.3亿美元融资，a16z领投；奥特曼成立AI健康公司；大模型最强架构TTT问世丨AI情报局

融资快报Hebbia 完成 1.3 亿美元融资：位于纽约的 AI 初创公司 Hebbia 宣布完成新一轮 1.3 亿美元融资，由 a16z 领投，Index Ventures、Google Ventures 以及 Peter Thiel 参投。据悉，Hebbia 目前估值约为 7 亿美元，公司成立于 2020 年，其软件可分析数字化文档和数据源，包括监管文件、PDF 以及音频和视频剪辑，以帮助客户处理比面向消费者的聊天机器人更复杂的查询，类似 Glean。旷视科技MEGVII上交所提交注册：旷视科技MEGVII以自研视觉感知算法引擎为核心，致力于持续打造在各商业领域的 AIoT 操作系统，以及深度构建具备连接百亿物联网设备能力的生态系统，为 200 多个国家和地区的数十万开发者提供智能物联服务及解决方案。

7/10/2024 11:48:00 AM

我在思考中

达摩院跨入 AIGC 深水区，发布一站式 AI 视频创作平台「寻光」

年初，OpenAI 推出文本-视频生成模型 Sora，只需输入提示文本描述，或输入一张图片，Sora 就能生成类似电影大片的逼真场景视频，前所未有的新奇观感，让大众直呼「现实不存在了」。惊叹之余，Sora 所展现出的神奇「魔法」，也让业界意识到 AI 视频生成在高清晰度、高保真度、高质量方面的巨大潜力与价值。此后，AI 视频生成模型摇身一变成为科技圈新的宠儿，并一改之前大语言模型一家独大的格局为两者的分庭抗礼。

7/10/2024 11:06:00 AM

晓楠

标致在欧洲 17 国市场向新一代车型全面推送 ChatGPT 3.5 支持，新车赠送半年订阅

Stellantis 斯泰兰蒂斯旗下品牌标致当地时间 7 月 8 日宣布，以 12 种不同的语言在欧洲 17 国市场向新一代车型全面推送 ChatGPT 3.5 支持。这一支持目前已在德国、奥地利、西班牙、法国、意大利、葡萄牙、英国部署；本月底前覆盖丹麦、爱尔兰、挪威、瑞典、瑞士、比利时、卢森堡、荷兰、波兰和捷克。▲ 图源标致新闻稿标致旗下所有最新一代车型，只要其配备了支持语音指令的 i-Cockpit 智能座舱，都将获得支持 ChatGPT 功能的 OTA 升级。这些车型包括新 208、新 2008、新 308、

7/10/2024 9:38:05 AM

溯波（实习）

新流量风口！7 类 AI 视频玩法超全解析，小白也能轻松上手!

大家好，这里是和你们一起探索 AI 的花生~ 随着 AI 技术的不断发展，AI 视频的生成效果也跨上了新的台阶，在画面质量、动作流畅度、角色一致性、提示词理解等方面均有明显提升，达到了 “以假乱真” 的水平。而工具变强大后，人们的想象力也得到了进一步地释放，各种由 AI 生成或编辑的视频、动图在互联网上疯传，已然成为最新的视频流量密码。今天就带大家了解 7 种最近非常热门的 AI 视频创作思路以及它们的实现方法，看完之后你会发现 AI 视频创作远比想象中简单，即使是普通人也可以轻松抓住这一波流量~ 相关推荐：一、

7/10/2024 2:12:44 AM

夏花生

调查显示，中国生成式人工智能普及率领跑全球

一项最新调查显示，中国在生成式人工智能的普及率方面处于世界领先地位，这表明中国在这项技术领域取得了长足进步。生成式人工智能因美国 OpenAI 公司于 2022 年底推出 ChatGPT 而获得全球关注。图源 Pixabay这项由美国人工智能和数据分析软件公司 SAS 和 Coleman Parkes Research 联合进行的调查，采访了来自全球 16 个国家和地区的 1600 名行业决策者。调查结果显示，83% 的中国受访者表示他们使用了生成式人工智能，这一比例高于美国的 65% 以及所有参与调查的国家和地区

7/9/2024 9:33:59 PM

远洋

小米黑客马拉松落幕，大模型「智能头盔」获一等奖

本届黑客松上，319 位小米人，产出了 63 个新技术作品。

7/9/2024 7:13:00 PM

新闻助手

港大马毅：现在的大模型只有「知识」，没有「智能」

导语：知识与智能是两个概念。访谈 | 陈彩娴撰文丨马蕊蕾编辑丨陈彩娴当多数人将 Scaling Law（规模定律）作为信仰并投身其中时，马毅却选择了一条少有人走的路。「模型无所谓大小，我们说正确的模型，主要看机制是否正确，这才是智能的本质。

7/9/2024 3:31:00 PM

马蕊蕾

开源3D医学大模型SAT，支持497类器官，性能超越72个nnU-Nets，上交大团队发布

作者 | 上海交通大学、上海人工智能实验室编辑 | ScienceAI近日，上海交通大学与上海人工智能实验室联合团队发布3D医学图像分割大模型SAT（Segment Anything in radiology scans, driven by Text prompts），在3D医学图像（CT、MR、PET）上，基于文本提示实现对人体497种器官/病灶的通用分割。所有数据和代码、模型均已开源。论文链接：：：、手术规划和疾病监测等一系列临床任务中都有重要作用。然而，传统的研究针对每个特定的分割任务训练「专用」模型，导致

7/9/2024 1:41:00 PM

ScienceAI

5000字爆肝测评！六月AI资讯及实用测评合集

前言在过去的 30 天里，AI 圈又发生了哪些劲爆大事件？赶紧来看看我们精心整理的一手 AIGC 资讯和深度分析测评，我们的 AIGC 爆肝 30 天测评又和大家见面了。继前两期 AIGC 测评文章发布之后，我们也收到了许多积极的反馈，对于还未阅读过的同学，欢迎通过以下链接直接访问浏览。在本系列的第一章，我们还是会快速给大家概述下国内外 AI 圈领域的重要资讯和动态，第二章，除了既往介绍我们筛选后的重点实测产品以外，我们还将探讨和分析一些感兴趣的 AI 特定领域内容或者工具的对比研究，第二章会给大家详细介绍以下

7/9/2024 6:58:24 AM

团队新浪MDC

北大千问团队推出数学专用版 CriticGPT，“找茬”让大模型进步更快

批评不仅能让人进步，也能让大模型的能力提升。OpenAI 就用这个思路造了个“找茬模型”CriticGPT。非常巧合的是，就在 CriticGPT 放出的前几天，北大联合千问等团队以类似的思路设计出了“数学专用版”CriticGPT。在无需训练的设置下，验证器能够在推理时辅助模型在 GSM8K 上的准确率从 86.6% 提升到 88.2%。在 GSM8K 数据集上，它可以让模型的准确率从 86.6% 提升到 88.2%。CriticGPT 的核心思路是在代码中故意设置 bug 并进行详细标注，然后用得到的数据训练出

7/8/2024 11:30:24 PM

清源

ChatGPT 无法取代人类程序员： IEEE 35 页论文测出困难编码正确率仅为 0.66%

【新智元导读】6 月，IEEE 刊登了一篇对 ChatGPT 代码生成任务进行系统评估的论文，数据集就是程序员们最爱的 LeetCode 题库。研究揭示了 LLM 在代码任务中出现的潜在问题和能力局限，让我们能够对模型做出进一步改进，并逐渐了解使用 ChatGPT 写代码的最佳姿势。有了 ChatGPT，还需要人类程序猿编码吗？上个月，一项发表在 IEEE TSE 期刊（Transactions on Software Engineering）上的研究评估了 ChatGPT 所生成的代码在功能性、复杂性和安全性方面

7/8/2024 4:46:28 PM

清源

主打个性化体验，留住用户全靠AIGC？

今天要购买一件商品，我们都会先在社交媒体上搜索、浏览商品的评价，这使得企业在社交平台上针对产品进行营销变得越来越重要。营销的目的是为了促进产品的销售，树立品牌形象，提高品牌认知度，吸引并留住客户，最终提高企业的盈利能力。我们知道，大模型具备出色的理解和生成能力，可以通过浏览、分析用户数据，为用户提供个性化内容推荐，精准满足用户的需求，而这正是营销的关键所在。那么，AIGC 如何通过个性化提升营销转化率呢？在火山引擎和 NVIDIA 联手AI在线和 CMO CLUB 推出的视频栏目《AIGC 体验派》第四期中，两位嘉

7/8/2024 4:25:00 PM

机器之心

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 AI视频用哪个？6个知名的AI视频工具使用测评报告 OpenAI发布34页智能体实践指南：从网络搜索到代码编写 OpenAI发布GPT-4.1指令提示工程指南别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达人形机器人 Transformer 百度 AI视频苹果深度学习模态 xAI 字节跳动驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成视觉科技亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练