文章列表

分类

标签

字节全新发布豆包AI视频模型：再见了Sora，你的时代过去了

刚刚，字节的火山引擎的发布会基本结束了。我现在有点过于激动。虽然发布会结束了，但是我觉得，一个颠覆行业的全新的起点，在这一刻，正式到来了。字节正式发布了他们全新的两款 AI 视频模型：豆包视频生成-PixelDance 模型和 Seaweed 模型。Seaweed 模型下次我再详细来说。这次，我想说这个豆包 PixelDance 模型，因为太屌了，屌炸了，我真的是全程惊叹着看完的。他们正式宣布这玩意的那一刻，现场掌声雷动，我隔着屏幕都感觉快特么把房顶掀翻了。真的，如果要给这个豆包 PixelDance

9/26/2024 1:49:52 AM

英伟达发布 Llama-3.1-Nemotron-51B AI 模型：创新神经架构搜索等技术让单 H100 GPU 运行 4 倍以上负载

英伟达 9 月 23 日发布博文，宣布推出 Llama-3.1-Nemotron-51B AI 模型，源自 Meta 公司的 Llama-3.1-70B，不过创新使用神经架构搜索（NAS）方法，建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-Nemotron-51B AI 模型基于 Meta 公司 2024 年 7 月发布的 Llama-3.1-70B 模型，共有 510 亿参数。该 AI 模型主要采用了神经架构搜索（NAS）技术微调，平衡性能和效率，在高工作负

9/25/2024 1:40:33 PM

故渊

OpenAI o1 AI 模型 PlanBench 规划能力实测：准确率 97.8%，远超 LLaMA 3.1 405B 创造的 62.6% 纪录

来自亚利桑那州立大学的科研团队利用 PlanBench 基准，测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步，但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年，用于评估人工智能系统的规划能力，包括 600 个来自 Blocksworld 领域的任务，其中积木必须按照特定顺序堆叠。OpenAI o1 模型成绩在 Blocksworld 任务中，OpenAI 的 o1 模型准确率达到 97.8%，大大超过了之前的最佳语言模型 LLaMA

9/25/2024 12:20:21 PM

故渊

谷歌 Gemini 1.5 AI 模型再进化：成本更低、性能更强、响应更快

科技媒体 The Decoder 昨日（9 月 24 日）发布博文，报道谷歌升级旗下 Gemini 1.5 AI 模型，推出了 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002，相比较此前版本成本更低、性能更强、响应更快。成本更低谷歌下调了 token 输入和输出费用，Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%，提高了两种模型的速率限制，并减少了延迟。新定价于 2024 年 10 月 1 日生效。性能更强AI在线援引新闻稿内

9/25/2024 12:08:02 PM

故渊

大众携手谷歌，率先邀请约 12 万名车主免费使用 Gemini AI

大众汽车昨日（9 月 24 日）发布新闻稿，宣布携手谷歌公司，率先邀请约 12 万名大众 Atlas 和 Atlas Cross Sport 车型车主，免费体验和使用 Gemini AI 助手。Gemini AI 助手功能大众汽车在新闻稿中表示，通过与谷歌云（Google Cloud）的战略合作，在 myVW 移动应用中部署生成式人工智能。大众汽车车主可以通过聊天的方式和 Gemini AI 对话，掌控车辆状态或者请求其提供帮助。例如车主可以询问“如何更换备胎”，Gemini 就会自动调用 YouTube 视频，提

9/25/2024 11:16:51 AM

故渊

真能这么简单？我居然 1 分钟就搞定了一个 IP 角色的 3D 建模

大家好，我是花生~ 今年 1 月份的时候，我给大家推荐过 5 款 AI 3D 模型生成工具，可以直接通过文本和图像生成 3D 模型。如今已经过去了半年多的时间，这些工具都有不同程度的发展，尤其 Tripo AI，一直在不断打磨自己的产品，不仅生成质量在提升，还添加了多图生成、骨骼绑定、重新拓扑等功能，给人的使用体验越来越好。前几天 Tripo AI 又推出了新的 2.0 模型，在建模精度、贴图质量上提升了一个新的维度，逼近人工建模的水平，因此具有极大的落地应用价值。下面就为大家详细一下介绍这个新模型的亮点。相

9/25/2024 1:36:02 AM

夏花生

第四波！2024年9月精选实用设计工具合集

大家好，这是 2024 年 9 月的第 4 波干货合集！ AI 对于设计领域的深刻影响正在逐步显现，AI 直接提取文本生成海报、AI 生成高品质视频、AI 生成可迭代升级的数字产品，这是很多创作者和设计师都需要且期待的功能，如今都有平台逐步实现并且落地应用，今天的推荐当中，就包含有这几个类别的工具，虽有瑕疵，但是瑕不掩瑜，都值得关注。此外还有一个在线 PS 的平替，以及一套素质颇为不错的免费开源图标。当然，在继续阅读下去之前，记得看看往期干货中有没有你感兴趣的素材：下面我们具体看看这一期的干货: 1、在线的 AI

9/25/2024 1:26:00 AM

陈子木

上交大、复旦中山团队开发糖尿病专用大语言模型，助力个性化糖尿病管理

编辑 | ScienceAI随着全球糖尿病患病率的逐年攀升，糖尿病已成为全球范围内极具挑战的公共健康问题。据统计，全球约有 10% 的人口受到糖尿病的影响。到 2045 年，全球糖尿病患者人数预计将攀升至惊人的 7.83 亿。然而，由于糖尿病医生短缺、医疗资源分布不均以及患者自我管理能力的不足，糖尿病的管理和治疗仍面临重重困难。如何高效、智能化地管理糖尿病，已成为当前医学界和科技界共同关注的重要课题。为应对这一挑战，上海交通大学清源研究院 MIFA 实验室与复旦大学附属中山医院内分泌科组成的研究团队，联手开发出一款

9/24/2024 2:35:00 PM

ScienceAI

23亿参数，Transformer架构，NASA、IBM发布「天气+气候」通用AI模型Prithvi WxC

编辑 | KX9 月 23 日，IBM 与 NASA 合作发布了一个用于天气和气候的新型通用 AI 模型 Prithvi WxC，该模型可以在台式计算机上运行，且开源。Prithvi WxC 具有 23 亿参数，使用 MERRA-2 数据集的 160 个变量开发而成。Prithvi WxC 采用创新的 Transformer 架构。研究人员在一系列具有挑战性的下游任务上测试了该模型，即：自回归滚动预测、降尺度、重力波通量参数化和极端事件估计。由于其独特的设计和训练机制，Prithvi WxC 可以解决比现有天气 A

9/24/2024 2:35:00 PM

ScienceAI

山姆·奥特曼罕见发长文，力推超级智能，百万人围观

如山姆・奥特曼所言，AI 绝非谷歌搜索或家庭作业助手的偶尔替代品，而是将改变人类的进步——当然，一定是朝着更好的方向。今天凌晨，OpenAI CEO 奥特曼罕见地发表了一篇长文博客，标题为《智能时代》（The Intelligence Age）。推特浏览量已经突破了 100 万。奥特曼对 AI 的发展给出了令人难以置信的预言，并宣传了 AI 改变世界的潜力。他表示：AI 绝对不是谷歌搜索或家庭作业助手的偶然替代品，而将推动人类社会朝着更好的方向发展。奥特曼还做出预测，超级 AI 有可能在未来几千天内完成（PS：这个

9/24/2024 10:27:00 AM

机器之心

OpenAI 阿尔特曼预测“智能时代”即将到来：能独立完成科学发现，影响就业但有助于解决气候变化等重大挑战

OpenAI 首席执行官山姆・阿尔特曼（Sam Altman）昨日（9 月 23 日）在其个人博客上发表博文，预测“智能时代”（Intelligence Age）即将到来，人工智能将在“未来几十年”带来巨大的经济收益。展望 AI 未来阿尔特曼在博文中写道，人类正在进入一个由人工智能驱动的新时代。他预测 AI 系统将很快成为个人助理，提供定制教育，甚至帮助医疗保健，最终 AI 系统甚至可能独立完成科学发现。阿尔特曼在博文中认为“超级智能 AI”（superintelligent AI）可能需要更长的发展周期，但预估会

9/24/2024 7:27:29 AM

故渊

以前一天才能完成的运营图设计，如何用AI一个小时搞定？

前言大家好，我是金玉珏~ 今天这篇文章将向大家展示如何利用 AIGC 技术助力运营图片中的背景和容器设计。首先，请大家来看以下几张图片，它们主要由企业 LOGO、活动文案、活动元素、元素容器、画面背景构成。在日常工作中，这类设计任务十分常见，其中背景和容器部分完全可以借助 AI 来辅助完成。接下来，我们通过具体实例来展示如何利用 AI 技术提升这类设计的效率和质量。满满的设计思路全部奉上，评论区虚位以待，诚邀您分享独到观点~ 假设需求（比例 16:9）：标题：夏日福利暑于你副标题：借记卡支付享 5 重惊喜

9/24/2024 6:21:08 AM

金玉珏

OpenAI 发布“学院”计划：为开发者提供 100 万美元 API 信用额度及技术指导

OpenAI 今天宣布推出“OpenAI 学院”，旨在帮助开发者和组织利用 AI 解决难题，并推动社区经济增长。该平台将确保生成式 AI 的强大功能在全球范围内广泛普及，包括中低收入国家。OpenAI 表示，许多国家的科技行业发展迅速，拥有才华横溢的开发者和创新型组织，但仍然缺乏高级培训和技术资源的支持。通过投资于本地 AI 人才的发展，可以促进包括医疗、农业、教育和金融等行业的经济增长与创新。该项目将提供如下方面的支持：培训与技术指导：OpenAI 专家将为利用 AI 的开发者和使命驱动型组织提供支持。API 使

9/23/2024 11:38:16 PM

清源

一键复刻！10 组超惊艳的 Midjourney 风格代码推荐（四）

大家好我是花生 ~ 今天继续分享 10 组我精选的 Midjourney 风格代码，效果都很好看，肯定有你喜欢的风格~ 上期回顾：一、--sref 3322162017 特点：色彩浓郁柔和的厚涂插画风格，笔触细腻，适合生成头像、装饰画、故事插图。 ① A quiet girl --ar 3:4 --sref 3322162017 --personalize kzilt9y --sw 100 --stylize 1000 --v 6.1 一个安静的女孩。 ② A cute fox, waiting the sunse

9/23/2024 12:31:26 AM

夏花生

OpenAI 首款具备“推理”能力模型 o1 现已向企业 / 教育用户开放，每周最多使用 50 次

OpenAI 公司旗下首款具备“推理”能力的模型 o1 和 o1-mini 现已向企业版（Enterprise）和教育版（Edu）用户开放访问权限，用户每周最多可输入 50 条消息。据介绍，OpenAI o1 系列模型具有更高的理解能力，与传统模型不同，o1 系列模型在回答问题之前会进行深度思考，生成内在的思维链后再给出答案，因此系列模型能够处理比之前模型更复杂的任务，特别擅长解决科学、编程和数学领域的难题。OpenAI 指出，尽管目前 GPT-4o 仍是大多数任务的最佳选择，但 o1 系列在处理复杂、问题解决导向

9/22/2024 3:07:06 PM

漾仔

GPT-4o 能玩《黑神话：悟空》：精英怪胜率超人类，无强化学习纯大模型方案

AI 玩黑神话，第一个精英怪牯护院轻松拿捏啊。有方向感，视角也没有问题。躲闪劈棍很丝滑。甚至在打鸦香客和牯护院时，AI 的胜率已经超过人类。而且是完全使用大模型玩，没有使用强化学习。阿里巴巴的研究人员们提出了一个新型 VARP（视觉动作角色扮演）智能体框架。它能直接将游戏截图作为输入，通过视觉语言模型推理，最终生成 Python 代码形式的动作，以此来操作游戏。以玩《黑神话・悟空》为例，该智能体在 90% 简单和中等水平战斗场景中取胜。GPT-4o、Claude 3.5 都来迎战研究人员以《黑神话・悟空》为研究平台

9/22/2024 3:06:25 PM

汪淼

微软亚洲研究院与上海市精神卫生中心展开联合研究，借助多模态大模型为认知障碍患者带来全新训练方法

据微软亚洲研究院官方披露，该研究院与上海市精神卫生中心携手展开联合研究，基于微软 Azure OpenAI 服务中的多模态大模型，开发了利用多种模态数据（如语音、文字、图片、音乐等信息）的个性化认知训练框架，为认知障碍患者的认知训练带来了新的可能。▲ 图源微软亚洲研究院公众号AI在线从微软亚洲研究院获悉，综合上海市精神卫生中心专家的建议与患者的需求，微软亚洲研究院的研究员们从易用性、界面友好性、功能专业性和入门难易度等多个维度出发，开发了个性化认知训练框架“忆我”（ReMe）。该工具以微软 Azure OpenAI

9/22/2024 1:31:19 PM

浩渺

o1 研发团队完整采访：Ilya早期曾参与，灵感源于AlphaGo

自从 OpenAI 的 o1 问世以来，它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练，它就能直接拿下数学奥赛金牌，甚至可以在博士级别的科学问答环节上超越人类专家。展示 o1 实力的 demo，我们看了不少，评估 o1 表现的评测，全网比比皆是，关于 o1 技术路线的讨论也如火如荼，引发了广泛的关注和深入的思考。不过 o1 背后的故事，还鲜为人知，那些在幕后默默付出的团队成员们，他们的故事同样值得被讲述和铭记。刚刚，OpenAI 发布了 o1 研发团队的完整访谈，为我们揭秘了 o1 的「成长历程」。o

9/22/2024 1:27:00 PM

机器之心

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 OpenAI发布34页智能体实践指南：从网络搜索到代码编写基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统 AI视频用哪个？6个知名的AI视频工具使用测评报告 OpenAI发布GPT-4.1指令提示工程指南别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测人形机器人伟达 Transformer 百度深度学习 AI视频苹果模态 xAI 字节跳动驾驶文本搜索大语言模型具身智能 Claude Copilot 神器推荐 LLaMA 算力安全应用视频生成视觉科技亚马逊干货合集特斯拉 2024 AGI 大型语言模型训练