文章列表

分类

标签

科技巨头被曝未经授权用 YouTube 内容训练 AI，苹果、英伟达在列

据 Wired 报道，包括苹果在内的一些科技巨头未经 YouTube 视频创作者同意，就使用了他们视频的字幕文件来训练人工智能模型。AI在线注意到，此次事件影响到的创作者包括知名科技博主 MKBHD (Marques Brownlee)、MrBeast、PewDiePie、以及脱口秀主持人斯蒂芬・科尔伯特、约翰・奥利弗和吉米・坎摩尔等。这些被用于训练 AI 的字幕文件相当于视频的文本转录内容。调查记者披露，一些世界上最富有的科技公司一直在利用来自成千上万个 YouTube 视频的素材来训练 AI，而这违反了 You

7/16/2024 9:47:50 PM

远洋

微软 CTO 坚信大型语言模型的“规模定律”依然奏效，未来可期

微软首席技术官（CTO）凯文・斯科特（Kevin Scott）上周在接受红杉资本旗下播客采访时，重申了他坚信大型语言模型 (LLM) 的“规模定律”将继续推动人工智能进步的观点，尽管该领域一些人怀疑进步已经停滞。斯科特在推动微软与 OpenAI 达成 130 亿美元的技术共享协议方面发挥了关键作用。斯科特表示：“其他人可能持不同观点，但我认为规模化并未达到边际收益递减的临界点。我想让人们理解这里存在着一个指数级提升的过程，遗憾的是，你只能每隔几年才能看到一次，因为建造超级计算机然后用它们训练模型都需要时间。”202

7/16/2024 5:25:59 PM

远洋

效果超棒！9 款免费好用的老照片修复和上色 AI 神器

大家好，这里是和你们一起探索 AI 的花生~ 最近有关 “老照片动起来” AI 视频在互联网上爆火，制作教程优设网上就有，大家可以点击这里学习。今天则为大家推荐 9 款免费的老照片处理工具，它们都用了 AI 技术，能让我们轻松实现破损照片修复、模糊人脸高清化、黑白照片上色等效果，点开即用非常方便，这样 AI 视频的生成效果也会更好，下面一起来看看吧~ 相关推荐：一、AI 老照片修复网站直达：「AI 老照片修复」是 ModelScope 社区内的一个图片处理小工具，借助 AI 实现画质增强、智能上色等效果，

7/16/2024 8:12:02 AM

夏花生

AI设计必看指南！简析谷歌+微软的AI设计原则

在这个 AI 触手可及的时代，智能技术已经悄无声息地融入了我们的日常生活。但你知道吗？每一个让人惊叹的 AI 产品背后，都有一套精妙的设计原则在支撑。谷歌和微软这样的科技巨头，他们不仅是技术的先锋，更是体验设计的领航者。他们在丰富的产品实践中提炼出这些 AI 设计原则。学习它们，可以让我们用更理性、更科学的方法进行设计，创造出更智能且更有温度的用户体验。下滑，让我们一起了解这些 AI 设计原则吧～一、谷歌AI设计指南《The People AI Guidebook》由 Google 的 PAIR 团队发布，

7/16/2024 6:12:02 AM

团队58UXD

传 4050 亿参数版 Llama3 将在 23 日发布；机械臂公司获 6300 万美元融资丨AI情报局

今日融资快报机械臂公司 Standard Bots 获 6300 万美元融资，亚马逊、三星等参投Standard Bots Inc. 是一家为制造业和物流业开发机械臂的初创公司，该公司已获得 6300 万美元的 B 轮新资金。本轮融资由 General Catalyst 领投，亚马逊工业创新基金、Samsung Next 和几家老投资者也参与了该公司的投资。

7/15/2024 6:09:00 PM

我在思考中

谷歌 Gemini 被曝今日起推出多项新功能：定制 GPT、记忆或个性化回复等

根据反向工程师 @testingcatalog 的发现，谷歌将在近期为其 Gemini 人工智能助手带来几项更新。从该工程师发布的截图来看，这一轮更新原计划在 7 月 11 日、7 月 18 日分批推送，但他又声称 7 月 11 日的更新已经推迟至 7 月 15 日（AI在线注：日期即今日，但以具体时区为准），预计当天将带来 1 项功能。而在 7 月 18 日，谷歌计划发布 4 项 Gemini 新功能。媒体 Testing Catalog 披露了近期即将发布的新功能，但未说明这些功能的具体上线日期。文生图工具 I

7/15/2024 6:02:35 PM

清源

谷歌 Gemini AI 遭质疑：未经用户同意读取 Google Drive 文档

感谢据 X 用户 @Kevin Bankston 的报告，谷歌的人工智能服务 Gemini AI 似乎在未经用户明确许可的情况下读取 Google Drive 中的私人文档。AI在线注意到，Bankston 在其推文中详细描述了这一问题。最初，他发现 Gemini 似乎在阅读他的 Google Drive 文档，但相关设置中找不到禁用该功能的选项。经进一步调查，他发现这是 Google Drive 本身的问题，而非 Google Docs，但两者可能都存在类似的漏洞。而且，根据 Gemini 人工智能的说法，用于控

7/15/2024 5:09:08 PM

远洋

赶时髦的 AIGC 营销人，如何实现「里子」与「面子」的双赢？

过去一年，AI 在各行各业掀起了一场技术变革狂潮。向来「赶时髦」的营销圈，更是率先拥抱 AIGC 技术。相关数据显示，2023年，我国已有近半数广告主企业在线上营销活动中应用 AIGC 技术，其中超过 90% 的应用聚焦于内容创作和创意开发。这种由技术驱动的广告营销新模式正在逐渐成型，为广告主降本增效带来更多可能。然而，AIGC 技术在营销领域大施拳脚的同时，也伴随着诸多挑战。例如，AIGC 技术在生成营销素材时可能会产生内容风险，重金投入的营销活动一不小心为黑产做了嫁衣……那么，AIGC 营销人该如何平衡创作内容

7/15/2024 3:04:00 PM

机器之心

非法阻止员工披露AI安全风险，OpenAI严厉「封口协议」再遭举报

OpenAI 在人工智能领域的领头羊地位家喻户晓。其产品聊天机器人 ChatGPT 系列、文生图 DALL・E 系列、文生视频 Sora 等都被誉为生产力提升的超强助手据透露，OpenAI 内部正在一个代号为「草莓（Strawberry）」的项目中开发一种新的人工智能模型。该项目的细节此前从未被报道过，而 OpenAI 正努力证明其提供的各类模型能够提供高级推理能力。不过 OpenAI 现在似乎正陷在另一场风波当中。据《华盛顿邮报》报道，一位举报人向美国证券交易委员会（SCE，Securities and Exch

7/15/2024 11:52:00 AM

机器之心

OpenAI Lilian Weng万字长文解读LLM幻觉：从理解到克服

Lilian Weng 出品，必是精品。人会有幻觉，大型语言模型也会有幻觉。近日，OpenAI 安全系统团队负责人 Lilian Weng 更新了博客，介绍了近年来在理解、检测和克服 LLM 幻觉方面的诸多研究成果。Lilian Weng，中文名翁丽莲，是 OpenAI 安全系统团队负责人。她 2018 年加入 OpenAI，参与了 GPT-4 项目的预训练、强化学习 & 对齐、模型安全等方面的工作。她的博客深入、细致，具有前瞻性，被很多 AI 研究者视为重要的参考资料（其他博客见文末扩展阅读）。大型语言模型的幻觉

7/15/2024 11:34:00 AM

机器之心

万能模型 ControlNet Union ！10+控制效果一键生成！

大家好，这里是和你们一起探索 AI 的花生~ Controlnet 可以说是目前最重要的一款 AI 绘画控制插件，可以帮我们实现轮廓、深度、动作姿势、颜色等多种控制效果。由于每种控制条件都需要调用不同的控制模型，加上 SD1.5 和 SDXL 的生态并不互通，大家肯定都至少安装了十几种模型文件，给磁盘空间带来了很大的压力。最近一款名为 ControlNet 的模型却改变了这个状况，它将十多种控制功能合为一体，只需要安装一个模型，就能和多种不同的预处理器搭配使用，今天就来看看它的具体用法。相关推荐：一、Con

7/15/2024 12:56:49 AM

夏花生

模型训练成本“平民化”，前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2

GPT-2 是 OpenAI 于 2019 年推出的模型，其训练费用一度为每小时 256 美元，那么 5 年过后的 GPT-4 时代，软硬件和数据的进步，是否意味着训练同一模型所需的时间和成本会随之减少呢？答案是肯定的。据 Tom's Hardware 今日报道，前特斯拉 AI 总监、OpenAI 联合创始人、项目开发者 Andrej Karpathy 使用 llm.c“重现”了 GPT-2，其成本降到了每小时仅 28 美元（AI在线备注：当前约 204 元人民币），在短短 5 年内降低了近 90%。图源 Pixa

7/13/2024 9:58:53 PM

清源

代号“草莓”，OpenAI 被曝研发新项目：将 AI 推理能力提至新高度

感谢路透社今天发布报道，称 OpenAI 公司正在研发代号为“草莓”的全新项目，进一步延伸去年 11 月宣布的 Q* 项目，不断提高 AI 推理能力，让其更接近人类的智力。AI在线援引该媒体报道，“草莓”项目会自主、高效地扫描互联网，并可靠地执行 OpenAI 所描述的“深度研究”，让其能够大规模解决更复杂的现实世界问题。一位内部知情人士透露：“我们希望我们的人工智能模型能够像我们一样看待和理解这个世界。不断研究新的人工智能能力也成为业界共识，我们都相信，这些系统的推理能力会随着时间的推移而不断提高”。“草莓”项目

7/13/2024 12:49:34 PM

故渊

如虎添翼，谷歌探索 AI + 机器人未来：836 平方米复杂场景下指令成功率高达 90%

感谢科技媒体 The Verge 昨日报道，谷歌旗下的 DeepMind 团队正在使用 Gemini 训练其机器人，让其能够完成更复杂的任务，且能在复杂的环境下自由穿梭。DeepMind 团队已经发表了最新的研究论文，利用 Gemini 1.5 Pro 的上下文窗口（达到 200 万个词元），让用户可以更轻松地使用自然语言指令与 RT-2 机器人互动。AI在线注：上下文窗口（context window）是指语言模型在进行预测或生成文本时，所考虑的前一个词元（token）或文本片段的大小范围。其工作原理是拍摄指定区

7/13/2024 9:09:12 AM

故渊

“最强开源 AI 模型”，4050 亿参数版 Meta Llama 3 被曝 7 月 23 日发布

感谢科技媒体 The Information 本周五发布博文，援引内部员工曝料称 Meta 公司计划 7 月 23 日发布开源 AI 模型 Llama 3-405B，在现有 80 亿和 700 亿参数两个版本之外，推出 4050 亿参数版本，号称是最强大的开源大语言模型。Meta 公司今年 4 月发布 Llama 3 AI 模型时，扎克伯格就在采访中透露正在训练 4050 亿像素的密集模型，但当时没有透露太多的信息。AI在线注：上图为机翻字幕，存在错误报道称 Llama 3-405B 是一个多模态 AI 开源模型，

7/13/2024 8:09:19 AM

故渊

机器人大模型新公司！数据规模比同行大1000倍！贝索斯、孙正义等押注

机器之能报道编辑：Sia用 OpenAI 的方式颠覆机器人世界。「GPT-3 时刻正在进入机器人世界。」最近，Sequoia 合伙人 Stephanie Zhan 在投资了一家新机器人初创后说道。无论是在物流、车厂试点的人形机器人，还是四足机器狗，都要有脑子。过去，脑子要定制，「专款专用」，现在，不必了。最近，位于匹兹堡的机器人初创 Skild AI 声称，已经开发出一种通用的智能系统。它就像一个通用的智能模块，可以接入不同机器人，让他们立刻获得一些基本能力，如爬坡、跨过障碍、识别和捡起物品。7 月 9 日，Sk

7/12/2024 3:35:00 PM

机器之能

五年后的今天，训练GPT-2只需不到700刀、24小时，Karpathy又整新活

论老黄卖铲子的技术含量。2019 年 2 月，OpenAI 发布了 GPT-2，因为在文本生成上的优异表现，以及对于预训练 Transformer 架构的充分运用，被认为是如今大预言模型的「始祖」。五年后的今天，训练 GPT-2 这样 15 亿参数的大模型，只需要花费 672 美元，在一个 8XH100 的 GPU 节点上跑 24 个小时就可以搞定了。本周四，前特斯拉 Autopilot 负责人、OpenAI 科学家 Andrej Karpathy 在他纯 C 语言复现 GPT-2 大模型的项目「llm.c」的最新

7/12/2024 3:32:00 PM

机器之心

OpenAI 提出通用人工智能五级标准，自认为接近但未达到第二级

彭博社报道称，OpenAI 提出通用人工智能五级标准，用来确认人工智能的进展。OpenAI 高管告诉员工，公司自认为目前还处于第一级，但即将达到第二级。通用人工智能（AGI、Artificial General Intelligence），是指具有高效的学习和泛化能力、能够根据所处的复杂动态环境自主产生并完成任务的通用人工智能体，具备自主的感知、认知、决策、学习、执行和社会协作等能力，且符合人类情感、伦理与道德观念。AI在线附 OpenAI 提出的等级标准：第一级：聊天机器人，具有会话语言的人工智能第二级：推理者，

7/12/2024 10:35:33 AM

沛霖（实习）

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 AI视频用哪个？6个知名的AI视频工具使用测评报告 OpenAI发布34页智能体实践指南：从网络搜索到代码编写 OpenAI发布GPT-4.1指令提示工程指南别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达人形机器人 Transformer 百度 AI视频苹果深度学习模态 xAI 字节跳动驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成视觉科技亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练