谷歌计划融合 Gemini 与 Veo 模型，打造全能 AI 助手

2025-04-13 08:53

谷歌DeepMind CEO透露，计划将Gemini AI与Veo视频生成模型融合，提升AI对物理世界的理解能力。Gemini已支持多模态，可生成图像、文本和音频，行业正朝“全能”模型发展。#AI技术##谷歌Gemini#

感谢谷歌 DeepMind 首席执行官 Demis Hassabis 在由领英联合创始人 Reid Hoffman 共同主持的播客节目 Possible 中透露，谷歌计划将旗下的 Gemini AI 模型与 Veo 视频生成模型进行融合，以此提升 Gemini 对物理世界的理解能力。

Hassabis 表示：“我们从一开始就将 Gemini 这一基础模型打造为多模态模型，因为我们有着构建一个通用数字助手的愿景，这个助手能够在现实世界中真正为你提供帮助。”

目前，整个 AI 行业正逐渐朝着“全能”模型的方向发展，这些模型能够理解和整合多种媒体形式。谷歌最新的 Gemini 模型不仅可以生成图像和文本，还能生成音频；而 OpenAI 在 ChatGPT 中的默认模型如今也能创建图像，包括宫崎骏风格的艺术作品。亚马逊也宣布计划在今年晚些时候推出一款“任意到任意”的模型。

据AI在线了解，这些“全能”模型需要大量的训练数据，包括图像、视频、音频、文本等。Hassabis 暗示，Veo 的视频数据主要来源于谷歌旗下的 YouTube 平台。他说道：“通过观看大量的 YouTube 视频，Veo 2 能够了解世界的物理规律。”此前，谷歌曾向 TechCrunch 表示，其模型可能会根据与 YouTube 创作者达成的协议，使用“部分”YouTube 内容进行训练。据报道，该公司去年扩大了服务条款的部分内容，以便获取更多数据来训练其 AI 模型。

谷歌 AI 视频生成模型 Veo 2 使用费用公布：每分钟 30 美元

谷歌近期在其定价页面上低调公布了新一代 AI 视频生成模型 Veo 2 的使用费用。该模型于去年 12 月首次亮相，旨在通过人工智能技术快速生成高质量的视频内容。根据官方信息，使用 Veo 2 的成本为每秒 50 美分（IT之家备注：当前约 3.6 元人民币），换算下来，每分钟的费用为 30 美元（当前约 218 元人民币），每小时则高达 1800 美元（当前约 13060 元人民币）。

2/24/2025 7:59:41 AM

远洋

谷歌 Veo 2 升级可生成更具电影感视频，文本、音频 AI 同步升级

谷歌为视频AI模型Veo 2推出修复、外扩等新功能，可自动移除干扰元素或扩展画面，支持电影技巧预设，提升视频编辑效率。同步更新的还有Imagen 3图像模型及音频AI工具。#谷歌AI# #视频生成技术#

4/10/2025 2:54:59 PM

远洋

剑指 Sora，谷歌推出 Veo 文生视频模型：时长超 1 分钟、最高 1080P，支持电影手法

感谢OpenAI 三个月前推出文本转视频 Sora，引发了网友、媒体以及圈内人士的广泛讨论。谷歌在今天召开的 2024 I / O 开发者大会上，也推出了对标产品-- Veo，可以生成长度超过 1 分钟，分辨率最高 1080P 的“高质量”视频，并具有多种视觉和电影风格。根据谷歌官方新闻稿，Veo 具备对自然语言有先进的理解能力，能够理解“延时摄影”、“航拍风景”等电影术语。用户可以使用文本、图像或视频提示来指导他们所需的输出，谷歌表示，这样产生的视频“更加连贯一致”，在整个镜头中人物、动物和物体的动作也更加逼真。

5/15/2024 2:27:03 AM

故渊

资讯热榜

50组多风格提示词，全面测评Midjourney V7生图效果！斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了斯坦福 AI 指数报告发布：2024年美国 AI 私人投资约为中国的 12 倍、GPT3.5 级别模型推理成本下降 280 倍谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索 OpenAI 启动先锋计划，旨在重塑 AI 模型评分体系 OpenAI史上最硬核技术播客！系统揭秘GPT4.5诞生，已进入数据受限时代！小哥亲述大模型修bug血泪史；还有一个重磅开源消息 OpenAI 宣布 ChatGPT 自 4 月 30 日起停用 GPT-4 模型，全面升级至 4o 版本

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人大语言模型 Copilot 神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

谷歌计划融合 Gemini 与 Veo 模型，打造全能 AI 助手

相关资讯

谷歌 AI 视频生成模型 Veo 2 使用费用公布：每分钟 30 美元

谷歌 Veo 2 升级可生成更具电影感视频，文本、音频 AI 同步升级

剑指 Sora，谷歌推出 Veo 文生视频模型：时长超 1 分钟、最高 1080P，支持电影手法