文章列表
谷歌逆风翻盘暴击OpenAI,90天王者归来!44页报告押注25年三大技术前沿
逆袭之战开启,谷歌用90天重回巅峰! 短短90天,谷歌就从业内笑柄,逆袭成突破最大、产品最颠覆的科技大公司。 用AI初创创始人Ole Lehmann的话说,「我们正在见证2024年最大的科技转变」。
OpenAI 发布 o1 及开发者新工具:模型升级、实时 API 优化、偏好微调等重磅更新
OpenAI 12天发布会Day9, 今日宣布推出一系列针对开发者的强大模型、全新定制工具以及性能、灵活性和成本效益的升级,旨在助力开发者构建更智能、更强大的 AI 应用。 本次更新涵盖以下关键内容:1. API 中的 OpenAI o1:OpenAI o1 模型正式在 API 中向 5 级使用用户开放。
百度关于大模型在研发领域落地的深度思考
一、智能研发工具的发展首先来看一下智能研发工具的发展历程和方向。 智能化的发展背景与落地诉求早期的智能化工具,如 GitHub 的 Copilot 工具,大约在两年半前推出。 最初,Copilot 的主要功能是在开发者编写代码时提供自动补全建议。
OpenAI 称目前尚无推出视频生成模型 Sora API 的计划
OpenAI 今日表示,目前没有推出其视频生成模型 Sora 的应用程序接口(API)的计划,该模型可基于文本、图像生成视频。
USENIX Sec'25 | LLM提示词注入攻击如何防?UC伯克利、Meta最新研究来了
本文介绍对 LLM 提示词注入攻击(prompt injection)的通用防御框架。 首篇论文已被安全顶会 USENIX Security 2025 接收,第一作者陈思哲是 UC Berkeley 计算机系博士生,Meta FAIR 访问研究员,研究兴趣为真实场景下的 AI 安全。 他的导师是 David Wagner (UCB), 郭川 (Meta), Nicholas Carlini (Google)。
OpenAI o1 推理模型 API 上线,仅面向特定开发者开放
“OpenAI 12 天”活动进入第 9 天,OpenAI 今日宣布,其“推理”人工智能模型 o1 正式通过 API 向部分开发者开放,并同步更新了包括 GPT-4o、实时 API 以及微调 API 等多项开发者工具。
AI大模型时代,人才的需求已经变了
什么是 AI 发展的第一驱动力? 最近,全球科技大厂都在用行动告诉我们:人才。 本月初,谷歌 NotebookLM 的核心团队共同宣布离职创业,他们新公司的网站已经进入了「建设中」的状态。
举报人「自杀」,OpenAI表示震惊!NYU教授发长文悼念:警钟仍在回响
几天前,消息曝出,曾在OpenAI工作四年,指控公司侵犯版权的Suchir Balaji,上月底在旧金山公寓中被发现死亡,年仅26岁。 Suchir Balaji曾参与了ChatGPT后训练、GPT-4预训练,以及o1推理的研发工作。 今年10月,他在自己的一篇博文和「纽约时报」的专访中指出,OpenAI在使用新闻和其他网站的信息训练其AI模型时,违反了「合理使用」原则。
宇树机器人强化学习代码全面开源,还有训练到仿真和实操手把手教学
9.9万元起,还能够大规模量产的国产人形机器人,表现得实在是太6了:而且还走上了开源路线,就在刚刚,宇树机器人开源的强化学习代码又更新了! 更新之后不再是只能训练——不仅能够仿真运行,还能部署到实体机器,整个过程所有代码全部开放。 一开始,宇树开源的是英伟达Issac Gym平台上的训练代码,这次新增了对MuJoCo模拟仿真的支持。
ChatGPT地位不保?科技爱好者更喜欢拥有“情绪智力”的Claude
Claude是AI企业Anthropic开发的聊天机器人,它的名气远不如ChatGPT,目标也不是让用户与逼真的AI伙伴建立关系,但它仍然给OpenAI带来一些威胁。 由于Claude很机智,很敏感,科技爱好者渐渐喜欢上Claude。 一些爱好者甚至每天要与Claude对话十几次,向它询问工作建议、健康问题、人际关系问题。
为多模态LLM引入ControlNet理念,开源插件解决灾难性遗忘
多模态大模型内嵌语言模型总是出现灾难性遗忘怎么办? 像文生图那样有ControlNet即可解决。 这就是由360人工智能研究院提出的IAA的核心思路。
ChatGPT搜索与Her打通了!搜索免费开放,居然还剧透明日直播主题
ChatGPT今天带来的是搜索功能方面的一些迭代升级(更像谷歌了)。 主要有三点,私以为最大亮点是第二:根据用户反馈,优化搜索体验,移动端搜索更快,并能搜索出多模态信息;结合前几日发布的Her功能,可以在实时通话的时候进行语音搜索;免费,接下来逐步向所有ChatGPT用户开放。 官方信息显示,ChatGPT Search背后是微调后的GPT-4o模型,使用新颖的合成数据生成技术进行post-trained(包括从OpenAI o1-preview中提炼输出合成数据)。
华为诺亚解析:推荐系统的技术演进及大模型应用实践
一、推荐系统问题和背景首先来简要介绍一下个性化推荐系统。 实际上,我们每个人每天都在与众多推荐系统进行交互。 例如,购买衣物、阅读新闻或聆听音乐时,我们打开的每一个应用程序或网页,其展示的内容即为推荐系统所呈现。
本地构建Llama 3.2-Vision多模态LLM聊天应用实战
译者 | 朱先忠审校 | 重楼本文将以实战案例探讨如何在类似聊天的模式下从本地构建Llama3.2-Vision模型,并在Colab笔记本上探索其多模态技能。 简介视觉功能与大型语言模型(LLM)的集成正在通过多模态LLM(MLLM)彻底改变计算机视觉领域。 这些模型结合了文本和视觉输入,在图像理解和推理方面表现出令人印象深刻的能力。
OpenAI 为 ChatGPT 增加实时搜索功能,逐步向所有用户免费开放
用户可以获得快速、及时的答案,并附有相关网络来源的链接。ChatGPT 会根据用户的要求进行搜索,或通过点击网络搜索图标手动进行搜索。
谷歌 Gemini 2.0 成“P 图神器”,各种 P 图只需一句话
输入指令“把这辆车改装成敞篷车”,它就能立马将文字指令和图片结合起来,完成一键 P 图。
微软 CEO 纳德拉力挺 OpenAI:在人工智能竞赛中领先两年,几乎“没有竞争对手”
据《商业内幕(Business Insider)》报道,微软首席执行官萨提亚·纳德拉最近表示,OpenAI在人工智能领域拥有两年的领先优势,使其几乎“没有竞争对手”(pretty much uncontested)。
Ilya错了,预训练没结束!LeCun等反击,「小模型时代」让奥特曼预言成真
最近,Ilya在NeurIPS 2024中宣布:预训练结束了! 在他看来,数据如同化石燃料般难以再生,因此训练模型需要的海量数据即将枯竭。 作为前OpenAI首席科学家,Ilya的这番话,有可能影响之后数十年的AI发展方向。