文章列表

阿尔特曼畅想 AI 未来:“魔镜”变革交互、智能体实现速度跃迁、新硬件奏响时代凯歌

科技媒体 The Decoder 昨日(10 月 3 日)发布博文,报道称山姆・阿尔特曼(Sam Altman)在 OpenAI 的 DevDays 活动上,分享了他对人工智能(AI)互动未来的想法。AI在线附上完整演讲视频如下: 构想未来 AI 系统阿尔特曼在活动中描述了一种可以改变我们使用计算机和与世界互动方式的人工智能系统。在他勾勒的未来场景中,用户可以走到一块“镜子”前,说出想要的任何内容。先进的推理模型和代理将为每个请求实时创建自定义界面,用户可以通过对话或导航个性化的视频源进行互动。阿尔特曼表示:“这将

OpenAI 获得 40 亿美元周转信贷,公司流动资金破 100 亿美元

感谢CNBC 昨日(10 月 3 日)发布博文,报道称 OpenAI 公司在完成 66 亿美元新一轮融资之外,还获得 40 亿美元周转信贷,意味着该公司的流动资金超过 100 亿美元(AI在线备注:当前约 703.61 亿元人民币)。OpenAI 获得了 40 亿美元周转信贷,参与融资的金融机构包括摩根大通、花旗、高盛、摩根士丹利、桑坦德集团、富国银行、SMBC、瑞士银行和汇丰银行。报道称 OpenAI 的基础信用额度为 40 亿美元,且可选择额外增加 20 亿美元,该贷款为无担保贷款,可以在三年内使用。OpenA

OpenAI 推出全新写作、编码工具 ChatGPT Canvas,将免费开放

感谢OpenAI 今日宣布推出全新写作、编码工具 Canvas,这是一个与 ChatGPT 合作编写和编码项目的新界面,超越了简单的聊天。AI在线从官方介绍获悉,ChatGPT Canvas 可以更好地了解任务的上下文,用户可以突出显示特定部分,以准确表明希望 ChatGPT 关注的内容。用户也可以直接编辑文本或代码,要求 ChatGPT 调整写入长度、调试代码并快速执行其他操作,并且提供后退按钮来恢复作品的先前版本。写作功能包括:建议编辑:ChatGPT 提供建议和反馈。调整文章长度:将文档长度编辑为更短或更长。

奥特曼赢家通吃!OpenAI再揽66亿美元新融资,还不忘「狙击」一把老同事Ilya

OpenAI的估值在 9 个月内上涨了超过 700 亿美元。闹得满城风雨的 OpenAI 融资传闻终于尘埃落定。10 月 2 日,OpenAI 突然发布公告称,它融了一笔 66 亿美元的巨款,投后估值飙涨到 1570 亿美元,这意味着,其估值在 9 个月内翻了一番。到底是谁这么大手笔?综合各方消息来看,此轮融资由 OpenAI 老股东 Thrive Capital 领投,微软、英伟达、软银等参投。不过,OpenAI 此次融资仍是引发不小的争议。首先是它那不寻常的附加条件。OpenAI 要求投资者不能支持竞争对手的初

OpenAI 雄心:2026 年销售额 256 亿美元,2029 年破 1000 亿美元

科技媒体 The Information 昨日(10 月 2 日)发布博文,披露了一份 OpenAI 公司本次 66 亿美元融资的 PPT 演示文稿,其中提及公司目标 2026 年收入提升至 256 亿美元(当前约 1798.87 亿元人民币)。OpenAI 当前公司年销售额在 40 亿美元(当前约 281.07 亿元人民币),AI在线援引该媒体报道附上 OpenAI 的目标计划如下:2025 年达到 116 亿美元(当前约 815.11 亿元人民币)2026 年达到 256 亿美元(当前约 1798.87 亿元人

安卓平台吃上 AI,谷歌 Gemini Nano 轻量模型面向开发者开启测试

随着 AI 技术不断发展,移动设备上的人工智能功能正愈发重要,谷歌公司现已向安卓开发者开放 Gemini Nano 轻量 AI 模型试用,该模型主要适用于性能较低的手机 / 平板电脑,开发者现在可以使用谷歌提供的 AI Edge SDK 轻松为自家应用整合该模型。Gemini Nano 隶属 Google Gemini 模型家族,号称专为设备端轻量级任务设计,提供灵活且高效的 AI 功能,其推理任务完全在设备端完成,无需连接云端服务器,因此拥有“保障隐私”、“无需联网”、“无需订阅”三大优势。Gemini Nano

谷歌追赶 OpenAI,加速推进会“思考”的 AI 通用推理模型

感谢彭博社昨日(10 月 2 日)报道,谷歌公司正在开发类人推理 AI,希望在进度方面追赶 OpenAI 公司的 o1 模型。OpenAI 最近为 ChatGPT 引入了 o1-preview 和 o1-mini 模型,可以模拟人类的思考模式,实现通用推理,让 AI 实现“思考”。AI在线援引彭博社报道,谷歌公司目前也在积极推进通用推理 AI 模型的落地,该 AI 模型更擅长处理数学和编程,不过消耗更多的处理能力和能源。知情人士称,与 OpenAI 一样,谷歌也在尝试使用一种名为“思维链提示”的技术来接近人类的推理

OpenAI 笑傲 AI 江湖:66 亿美元掀起融资狂潮,9 个月估值接近翻番至 1570 亿美元

感谢路透社今天(10 月 3 日)发布博文,报道 OpenAI 公司于美国当地时间周三宣布成功融资 66 亿美元(AI在线备注:当前约 463.64 亿元人民币),公司估值达到 1570 亿美元(当前约 1.1 万亿元人民币),短短 9 个月时间公司估值接近翻倍,创下硅谷历史最高纪录。AI在线援引 FT 报道,在本次融资过程中,OpenAI 经历了诸多风波,除了内部多名联合创始人出走之外,在本次融资中也出现了诸多情况。据了解情况的三位人士透露,在谈判期间,OpenAI 明确表示希望获得独家融资安排,希望投资者在 A

整合海量公共数据,谷歌开源 AI 统计学专家 DataGemma

准确的统计数据、时效性强的信息,一直是大语言模型产生幻觉的重灾区。知识是现成的,但学是不可能学的。并非此身惰怠,只因现实太多阻碍。对于这个问题,谷歌在近日推出了自己筹划已久的大型数据库 Data Commons,以及在此基础上诞生的大模型 DataGemma。论文地址: Commons 是一个庞大的开源公共统计数据存储库,包含来自联合国(UN)、疾病控制与预防中心(CDC)、人口普查局、卫生部、环境机构、经济部门、非政府组织和学术机构等可信来源的大量统计数据。目前,整个语料库包含超过 2500 亿个数据点和超过 2

OpenAI 联合创始人 Durk Kingma 加盟 Anthropic

感谢Durk Kingma 是 OpenAI 公司不太知名的一位联合创始人,今天他宣布将加入 Anthropic。在 X 上的一系列帖子中,Kingma 透露他将主要在荷兰(他所在的地方)远程工作,但没有说他将加入或领导哪个 Anthropic 部门。“Anthropic 的 AI 开发方法与我自己的信念产生了强烈共鸣,”Kingma 写道。“期待为 Anthropic 的使命 ——“负责任地开发强大 AI 系统”做出贡献。迫不及待地想与他们才华横溢的团队合作,包括来自 OpenAI 和谷歌的一些优秀的前同事,并应

微调 GPT-4o AI 模型新维度,OpenAI 开放图片视觉微调功能

OpenAI 公司昨日(10 月 1 日)发布博文,宣布为 GPT-4o 模型引入视觉微调(vision fine-tuning)功能,除了文本之外还支持微调图像。OpenAI 表示自开放微调 GPT-4o 以来,数十万开发者使用数据集(仅文本)微调了该模型,从而提高了驾驭某些特定任务的能力。OpenAI 在博文中展示了一些合作伙伴的微调案例:Garb :通过视觉微调,提升了交通标志定位准确性 20% 和限速标志定位 13%。Automat:成功率从 16.60% 提升至 61.67%,并在信息提取任务中 F1 分

OpenAI 发布 Realtime API,助力第三方应用集成其语音合成技术

科技媒体 The Decoder 昨日(10 月 1 日)发布博文,报道称 OpenAI 在旧金山开发者大会(DevDay)上,发布了 Realtime API,可以让开发者调用该 API 在第三方应用中集成语音合成技术。OpenAI 表示开发者通过调用新的 Realtime API,可以在其应用中添加 6 种 AI 语音,AI在线注:OpenAI 为了避免法律问题,开发者不能使用第三方语音。OpenAI 还展示了其它应用场景,表示可用于客户支持、语言学习、教育软件等,开发者可以利用语音交互增强用户体验:OpenA

乏善可陈的第二届OpenAI开发者大会,果然没有掀起太大波澜

OpenAI宫斗后的 DevDay 开发者大会,没有什么惊喜。OpenAI 的宫斗大戏刚落下帷幕,今日凌晨就在旧金山召开了第二届 DevDay 开发者大会。不过,与去年盛大的活动相比,今年略显低调,他们没有推出重大产品,而是选择对其现有的 AI 工具和 API 进行增量改进。在这次活动中,OpenAI 发布了四大API新功能:视觉微调(Vision Fine-Tuning)、实时 API(Realtime API)、模型蒸馏(Model Distillation)和提示缓存(Prompt Caching)。这些新工

安卓版谷歌 Gemini Live 上线,助力 AI 开启全民语音聊天时代

谷歌公司昨日(10 月 1 日)在 X 平台发布推文,宣布通过 Gemini 应用,现面向所有安卓用户开放 Gemini Live 功能。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式,采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。需要注意的是,目前仅

给机器人装上「虫脑」?非Transformer液态神经网络终于来了!MIT CSAIL负责人创业成果

在大模型时代,谷歌 2017 年开创性论文《Attention Is All You Need》中提出的 Transformer 已经成为主流架构。然而,刚刚一家由 MIT 计算机科学与人工智能实验室 (CSAIL) 前研究人员共同创立的初创公司 Liquid AI 却走出了不一样的路线。Liquid AI 表示他们的目标是「探索构建超越生成式预训练 Transformer (GPT) 基础模型的方法」。为了实现这一目标,Liquid AI 推出了其首批多模态 AI 模型:Liquid Foundation Mod

谷歌安卓版 Gemini AI 现支持浮动 / 分屏操作,三星 Galaxy Z Fold6 折叠手机限时独享

科技记者 Mishaal Rahman 昨日(9 月 30 日)发布博文,报道称在三星 Galaxy Z Fold6 折叠屏手机上,通过升级最新 Gemini AI 助手应用,可以实现分屏或者浮动窗口操作。用户升级新版 Gemini 应用之后,浮动叠加层顶部有一条小白条,显示用户当前可以像常规安卓应用一样操作 Gemini,不仅支持变为浮动窗口,还支持上下、左右分屏。三星首次在其最新的 Unpacked 活动中展示了这一功能。这表明该功能可能暂时仅限于某些三星设备,Gemini 目前已知仅支持三星 Galaxy Z

软银大手笔,被曝将向 OpenAI 投资 5 亿美元

感谢北京时间今晚,据 The Information 援引知情人士消息称,软银的愿景基金(Vision Fund)已经同意向 OpenAI 的最新一轮融资投资 5 亿美元(AI在线备注:当前约 34.96 亿元人民币)。在投资前,OpenAI 的估值为 1500 亿美元(当前约 1.05 万亿元人民币),这笔交易是软银对其的首次投资。软银加入了领投方 Thrive Capital 的行列,后者在本轮融资中的投资额超过 10 亿美元(当前约 69.92 亿元人民币)。据悉,Tiger Global Managemen

OpenAI 想转成营利性公司,这一操作被指极为复杂

9 月 30 日消息,人工智能研究机构 OpenAI 计划转型为营利性公司,目的是简化公司架构和运营模式。然而,实现这一目标的过程极其复杂。图源 Pexels作为热门聊天机器人 ChatGPT 的开发商,OpenAI 正在筹集 65 亿美元资金,投资者包括微软、英伟达、风险投资机构以及阿联酋的一家国有企业。谈判中的一项重要条款是,目前由非营利组织管理的 OpenAI 必须在两年内转型为公益性公司。这意味着 OpenAI 需要在创造社会效益的同时实现盈利。如果未能转型成功,投资者可以收回资金。为了实现这一目标,Ope