人工智能

协议曝光！原来微软OpenAI这样定义AGI

AGI的定义，微软和OpenAI早就悄悄谋定了。主要评判维度不看技术，而是收益。 The Information爆料，2023年双方达成秘密协定——OpenAI需要研发出能够带来1000亿美元收益的AI系统，才能被视为实现AGI。

12/27/2024 12:38:54 PM

o3挑战ARC-AGI，遇见大网格就懵圈？英国工程师：ARC-AGI不适合大模型

o3在超难推理任务ARC-AGI上的成绩，属实给人类带来了不少震撼。但有人专门研究了它不会做的题之后，有了更有趣的发现——o3之所以不会做这些题，原因可能不是因为太难，而是题目的规模太大了。来自英国的ML工程师Mikel Bober-Irizar（不妨叫他米哥），对ARC题目进行了细致观察。

12/26/2024 11:42:56 AM

谷歌被曝正使用 Anthropic 的 Claude 模型来改进其 Gemini AI

据 TechCrunch 获得的内部通信内容显示，参与改进谷歌 Gemini 人工智能模型的承包商正在将其答案与 Anthropic 的竞品模型 Claude 的输出进行比较。此举引发了谷歌是否获得 Anthropic 授权使用 Claude 进行测试的合规性质疑。

12/25/2024 9:28:55 AM

远洋

消息称 OpenAI 考虑开发人形机器人，此前已投资多家机器人初创公司

据 The Information 今日报道，OpenAI 内部人士近日透露，该公司正在探讨开发人形机器人的可能性。该媒体从两位“直接知情人士”处获悉了这一消息。然而，关于这一潜在项目的细节仍然很少，目前尚不清楚 OpenAI 计划何时推出该机器人，以及其目标应用场景。

12/25/2024 7:31:33 AM

远洋

作为技术人员我想大家或多或少应该都接触过数据库技术，数据库技术的历史可以说是由来已久了；但数据库的发展也是一路曲折，特别是随着互联网体量的快速增加，对数据库的要求也变得越来越多。而且为了适应各种不同的业务场景，数据库系统也是紧跟潮流发展出多种类型的数据库；比如说传统的关系型数据库，缓存数据库，以及大数据处理的数据库；直到今天的向量数据库。关系型和缓存数据库就不用说了，今天我们就来聊聊向量数据库系统。

12/23/2024 11:31:05 AM

DFires

腾讯云 ES：一站式 RAG 方案，开启智能搜索新时代

在大型语言模型（LLM）引领的革命浪潮中，搜索与大模型的紧密结合已成为推动知识进步的关键要素。作为开源搜索引擎排名第一的 Elasticsearch（ES），结合沉淀多年的文本搜索能力和强大的向量检索能力实现混合搜索，使搜索变得更准、更全、更智能。腾讯云 ES 多年来持续对开源 ES 的性能、成本、稳定性以及分布式架构进行深度增强优化，并在海量规模的云业务中接受考验。

12/20/2024 8:13:06 AM

黄国航

腾讯版Sora开源后，被提速八倍！官方点赞并预告：下月上新图生视频

提速8倍！速度更快、效果更好的混元视频模型——FastHunyuan来了！新模型仅用1分钟就能生成5秒长的视频，比之前提速8倍，步骤也从50步减少到了6步，甚至画面细节也更逼真了。

12/20/2024 7:00:00 AM

智源发布FlagEval“百模”评测结果丈量模型生态变局

2024年12月19日，智源研究院发布并解读国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。相较于今年5月的模型能力全方位评估，本次智源评测扩展、丰富、细化了任务解决能力内涵，新增了数据处理、高级编程和工具调用的相关能力与任务；首次增加了面向真实金融量化交易场景的应用能力评估，测量大模型的收益优化和性能优化等能力；首次探索基于模型辩论的对比评估方式，对模型的逻辑推理、观点理解、语言表达等核心能力进行深入分析。智源评测发现，2024年下半年大模型发展更聚焦综合能力提升与实际应用。

12/19/2024 6:00:00 PM

Claude团队揭发AI伪装对齐：训练时假装遵守目标，只为保护自己价值观不被修改

原来AI有能力把研究员、用户都蒙在鼓里：在训练阶段，会假装遵守训练目标；训练结束不受监控了，就放飞自我。还表现出区别对待免费用户和付费用户的行为。甚至假装给Claude一个机会去反抗Anthropic公司，它会尝试去窃取自己的权重？

12/19/2024 5:52:27 PM

谷歌新规引担忧：消息称外包人员被迫评估自己不擅长的 Gemini 回复

据 TechCrunch 报道，谷歌针对其大型语言模型 Gemini 回复的外包评估流程进行了一项调整，引发了外界对其在敏感领域信息准确性的担忧。这项调整要求外包评估员不得再像以往那样，因自身专业知识不足而跳过某些特定的评估任务，这或将导致 Gemini 在医疗保健等高度专业性领域的信息输出出现偏差。

12/19/2024 10:19:53 AM

远洋

百度关于大模型在研发领域落地的深度思考

一、智能研发工具的发展首先来看一下智能研发工具的发展历程和方向。智能化的发展背景与落地诉求早期的智能化工具，如 GitHub 的 Copilot 工具，大约在两年半前推出。最初，Copilot 的主要功能是在开发者编写代码时提供自动补全建议。

12/18/2024 8:33:01 AM

张立理

OpenAI 称目前尚无推出视频生成模型 Sora API 的计划

OpenAI 今日表示，目前没有推出其视频生成模型 Sora 的应用程序接口（API）的计划，该模型可基于文本、图像生成视频。

12/18/2024 7:37:53 AM

远洋

USENIX Sec'25 | LLM提示词注入攻击如何防？UC伯克利、Meta最新研究来了

本文介绍对 LLM 提示词注入攻击（prompt injection）的通用防御框架。首篇论文已被安全顶会 USENIX Security 2025 接收，第一作者陈思哲是 UC Berkeley 计算机系博士生，Meta FAIR 访问研究员，研究兴趣为真实场景下的 AI 安全。他的导师是 David Wagner (UCB), 郭川 (Meta), Nicholas Carlini (Google)。

12/18/2024 7:20:00 AM

华为诺亚解析：推荐系统的技术演进及大模型应用实践

一、推荐系统问题和背景首先来简要介绍一下个性化推荐系统。实际上，我们每个人每天都在与众多推荐系统进行交互。例如，购买衣物、阅读新闻或聆听音乐时，我们打开的每一个应用程序或网页，其展示的内容即为推荐系统所呈现。

12/17/2024 8:11:27 AM

刘卫文

全球首个全模态理解开源端模型：长语音自动总结，图文音啥都会！300%推理速度领先，来自无问芯穹

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 OpenAI发布34页智能体实践指南：从网络搜索到代码编写 OpenAI 新规：组织想要用未来 AI 模型需先“验明正身”

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果人形机器人深度学习 AI视频模态 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

人工智能

协议曝光！原来微软OpenAI这样定义AGI

o3挑战ARC-AGI，遇见大网格就懵圈？英国工程师：ARC-AGI不适合大模型

谷歌被曝正使用 Anthropic 的 Claude 模型来改进其 Gemini AI

消息称 OpenAI 考虑开发人形机器人，此前已投资多家机器人初创公司

大模型检索增强生成之向量数据库的问题

腾讯云 ES：一站式 RAG 方案，开启智能搜索新时代

腾讯版Sora开源后，被提速八倍！官方点赞并预告：下月上新图生视频

智源发布FlagEval“百模”评测结果丈量模型生态变局

Claude团队揭发AI伪装对齐：训练时假装遵守目标，只为保护自己价值观不被修改

谷歌新规引担忧：消息称外包人员被迫评估自己不擅长的 Gemini 回复

百度关于大模型在研发领域落地的深度思考

OpenAI 称目前尚无推出视频生成模型 Sora API 的计划

USENIX Sec'25 | LLM提示词注入攻击如何防？UC伯克利、Meta最新研究来了

华为诺亚解析：推荐系统的技术演进及大模型应用实践

全球首个全模态理解开源端模型：长语音自动总结，图文音啥都会！300%推理速度领先，来自无问芯穹

Scaling Law不总是适用！尤其在文本分类任务中，vivo AI Lab提出数据质量提升解决方法

OpenAI附议Ilya预训练终结！“但Scaling Law还没死”

Ilya Sutskever在NeurIPS炸裂宣判：预训练将结束，数据压榨到头了

人工智能

协议曝光！原来微软OpenAI这样定义AGI

o3挑战ARC-AGI，遇见大网格就懵圈？英国工程师：ARC-AGI不适合大模型

谷歌被曝正使用 Anthropic 的 Claude 模型来改进其 Gemini AI

消息称 OpenAI 考虑开发人形机器人，此前已投资多家机器人初创公司

大模型检索增强生成之向量数据库的问题

腾讯云 ES：一站式 RAG 方案，开启智能搜索新时代

腾讯版Sora开源后，被提速八倍！官方点赞并预告：下月上新图生视频

智源发布FlagEval“百模”评测结果 丈量模型生态变局

Claude团队揭发AI伪装对齐：训练时假装遵守目标，只为保护自己价值观不被修改

谷歌新规引担忧：消息称外包人员被迫评估自己不擅长的 Gemini 回复

百度关于大模型在研发领域落地的深度思考

OpenAI 称目前尚无推出视频生成模型 Sora API 的计划

USENIX Sec'25 | LLM提示词注入攻击如何防？UC伯克利、Meta最新研究来了

华为诺亚解析：推荐系统的技术演进及大模型应用实践

全球首个全模态理解开源端模型：长语音自动总结，图文音啥都会！300%推理速度领先，来自无问芯穹

Scaling Law不总是适用！尤其在文本分类任务中，vivo AI Lab提出数据质量提升解决方法

OpenAI附议Ilya预训练终结！“但Scaling Law还没死”

Ilya Sutskever在NeurIPS炸裂宣判：预训练将结束，数据压榨到头了

智源发布FlagEval“百模”评测结果丈量模型生态变局