文章列表
OpenAI 联合创始人 Durk Kingma 加盟 Anthropic
感谢Durk Kingma 是 OpenAI 公司不太知名的一位联合创始人,今天他宣布将加入 Anthropic。在 X 上的一系列帖子中,Kingma 透露他将主要在荷兰(他所在的地方)远程工作,但没有说他将加入或领导哪个 Anthropic 部门。“Anthropic 的 AI 开发方法与我自己的信念产生了强烈共鸣,”Kingma 写道。“期待为 Anthropic 的使命 ——“负责任地开发强大 AI 系统”做出贡献。迫不及待地想与他们才华横溢的团队合作,包括来自 OpenAI 和谷歌的一些优秀的前同事,并应
10/2/2024 5:32:11 PM
汪淼
微调 GPT-4o AI 模型新维度,OpenAI 开放图片视觉微调功能
OpenAI 公司昨日(10 月 1 日)发布博文,宣布为 GPT-4o 模型引入视觉微调(vision fine-tuning)功能,除了文本之外还支持微调图像。OpenAI 表示自开放微调 GPT-4o 以来,数十万开发者使用数据集(仅文本)微调了该模型,从而提高了驾驭某些特定任务的能力。OpenAI 在博文中展示了一些合作伙伴的微调案例:Garb :通过视觉微调,提升了交通标志定位准确性 20% 和限速标志定位 13%。Automat:成功率从 16.60% 提升至 61.67%,并在信息提取任务中 F1 分
10/2/2024 2:00:13 PM
故渊
OpenAI 发布 Realtime API,助力第三方应用集成其语音合成技术
科技媒体 The Decoder 昨日(10 月 1 日)发布博文,报道称 OpenAI 在旧金山开发者大会(DevDay)上,发布了 Realtime API,可以让开发者调用该 API 在第三方应用中集成语音合成技术。OpenAI 表示开发者通过调用新的 Realtime API,可以在其应用中添加 6 种 AI 语音,AI在线注:OpenAI 为了避免法律问题,开发者不能使用第三方语音。OpenAI 还展示了其它应用场景,表示可用于客户支持、语言学习、教育软件等,开发者可以利用语音交互增强用户体验:OpenA
10/2/2024 1:41:37 PM
故渊
乏善可陈的第二届OpenAI开发者大会,果然没有掀起太大波澜
OpenAI宫斗后的 DevDay 开发者大会,没有什么惊喜。OpenAI 的宫斗大戏刚落下帷幕,今日凌晨就在旧金山召开了第二届 DevDay 开发者大会。不过,与去年盛大的活动相比,今年略显低调,他们没有推出重大产品,而是选择对其现有的 AI 工具和 API 进行增量改进。在这次活动中,OpenAI 发布了四大API新功能:视觉微调(Vision Fine-Tuning)、实时 API(Realtime API)、模型蒸馏(Model Distillation)和提示缓存(Prompt Caching)。这些新工
10/2/2024 11:37:00 AM
机器之心
安卓版谷歌 Gemini Live 上线,助力 AI 开启全民语音聊天时代
谷歌公司昨日(10 月 1 日)在 X 平台发布推文,宣布通过 Gemini 应用,现面向所有安卓用户开放 Gemini Live 功能。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式,采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。需要注意的是,目前仅
10/2/2024 9:14:09 AM
故渊
给机器人装上「虫脑」?非Transformer液态神经网络终于来了!MIT CSAIL负责人创业成果
在大模型时代,谷歌 2017 年开创性论文《Attention Is All You Need》中提出的 Transformer 已经成为主流架构。然而,刚刚一家由 MIT 计算机科学与人工智能实验室 (CSAIL) 前研究人员共同创立的初创公司 Liquid AI 却走出了不一样的路线。Liquid AI 表示他们的目标是「探索构建超越生成式预训练 Transformer (GPT) 基础模型的方法」。为了实现这一目标,Liquid AI 推出了其首批多模态 AI 模型:Liquid Foundation Mod
10/1/2024 2:20:00 PM
机器之心
谷歌安卓版 Gemini AI 现支持浮动 / 分屏操作,三星 Galaxy Z Fold6 折叠手机限时独享
科技记者 Mishaal Rahman 昨日(9 月 30 日)发布博文,报道称在三星 Galaxy Z Fold6 折叠屏手机上,通过升级最新 Gemini AI 助手应用,可以实现分屏或者浮动窗口操作。用户升级新版 Gemini 应用之后,浮动叠加层顶部有一条小白条,显示用户当前可以像常规安卓应用一样操作 Gemini,不仅支持变为浮动窗口,还支持上下、左右分屏。三星首次在其最新的 Unpacked 活动中展示了这一功能。这表明该功能可能暂时仅限于某些三星设备,Gemini 目前已知仅支持三星 Galaxy Z
10/1/2024 8:04:49 AM
故渊
软银大手笔,被曝将向 OpenAI 投资 5 亿美元
感谢北京时间今晚,据 The Information 援引知情人士消息称,软银的愿景基金(Vision Fund)已经同意向 OpenAI 的最新一轮融资投资 5 亿美元(AI在线备注:当前约 34.96 亿元人民币)。在投资前,OpenAI 的估值为 1500 亿美元(当前约 1.05 万亿元人民币),这笔交易是软银对其的首次投资。软银加入了领投方 Thrive Capital 的行列,后者在本轮融资中的投资额超过 10 亿美元(当前约 69.92 亿元人民币)。据悉,Tiger Global Managemen
9/30/2024 9:52:55 PM
清源
OpenAI 想转成营利性公司,这一操作被指极为复杂
9 月 30 日消息,人工智能研究机构 OpenAI 计划转型为营利性公司,目的是简化公司架构和运营模式。然而,实现这一目标的过程极其复杂。图源 Pexels作为热门聊天机器人 ChatGPT 的开发商,OpenAI 正在筹集 65 亿美元资金,投资者包括微软、英伟达、风险投资机构以及阿联酋的一家国有企业。谈判中的一项重要条款是,目前由非营利组织管理的 OpenAI 必须在两年内转型为公益性公司。这意味着 OpenAI 需要在创造社会效益的同时实现盈利。如果未能转型成功,投资者可以收回资金。为了实现这一目标,Ope
9/30/2024 4:32:42 PM
辰辰
端到端优化所有能力,字节跳动提出强化学习LLM Agent框架AGILE
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]
9/30/2024 2:14:00 PM
机器之心
LeCun批评o1根本不像研究,Noam Brown回怼:已发表的研究都是废话
图灵奖三巨头之一 Yann LeCun 又和别人吵起来了,这次是 Noam Brown。Noam Brown 为 OpenAI o1 模型的核心贡献者之一,此前他是 Meta FAIR 的一员,主导了曾火遍一时的 CICERO 项目,在 2023 年 6 月加入 OpenAI 。这次吵架的内容就是围绕 o1 展开的。众所周知,从 AI 步入新的阶段以来,OpenAI 一直选择了闭源,o1 的发布也不例外。这也引来了广大网友的吐槽,干脆叫 CloseAI 算了,反观 Meta,在开源领域就做的很好,o1 的发布,更
9/30/2024 2:12:00 PM
机器之心
消息称 OpenAI CEO 阿尔特曼遭台积电高管嘲讽:7 万亿美元造芯计划太荒谬了
《纽约时报》上周的一篇报道揭露了 OpenAI 首席执行官萨姆・阿尔特曼在去年访问亚洲期间与多家芯片制造商高层会谈的内幕,报道称,阿尔特曼提出的巨额投资计划遭到了台积电高管的强烈质疑,他们认为这个想法太荒谬了,以至于他们将阿尔特曼戏称为“播客兄弟(podcasting bro)”。图源 Pexels阿尔特曼计划投资 7 万亿美元(AI在线备注:当前约 48.94 万亿元人民币)建设 36 个新的芯片制造工厂和数据中心,以推动人工智能的发展。然而,台积电高管认为这一计划过于激进,且风险极高。再增加几座芯片制造厂都已经
9/30/2024 10:44:37 AM
远洋
神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作
都来玩这套。继 OpenAI“草莓”之后,又有神秘模型蓝莓来“霸榜”。在文生图模型排行榜上,两个“无人认领”的模型 blueberry_0 和 blueberry_1 力压 Flux.1、Ideogram v2、Midjourney v6.1 等知名模型,成为最新榜一榜二大哥。一些生成效果 be like,确实不错。不过这一次,未必是 OpenAI 跨界来搞事,背后公司更可能是打造了 Flux 的黑森林实验室。为啥?来看这组 PK。blueberry_0 生成的大胡子男人,和 Flux Pro 的几乎一模一样。有人
9/30/2024 9:57:17 AM
汪淼
2024 九月工具合集!6 款不容错过的免费 AI 神器
大家好我是花生~
今天我们继续 AI 效率神器的第 11 期,一起来看看吧~
上期回顾:一、抠图神器 Object Cutter
网站直达:
Object Cutter 是一款在线免费的抠图工具,它的特点是可以通过文本以及选框指定需要抠取的内容。这样的好处是即使图像中有多个对象,也可以轻松指定到我们想要的那一个,免去了手动选取的麻烦,非常方便。而且抠图的效果也很精细,很小的缝隙也能处理。
使用时在原图顶部的「By prompt」和「By bounding box」中切换不同模式,然后在文本框内填写需要抠取的内容,
9/30/2024 7:58:48 AM
夏花生
一键出爆款!如何用 Coze 搭建图文生成+排版一体化工作流?
一、完整工作流拆解,一张图看懂
最终会生成的内容:4 张图片(1 张封面页,3 张内容页),如下图:我们要实现上图工作流,需要先搭建「2 个图像流,1 个工作流,1 个卡片,1 个 Bot」,如下所示:二、图像流创建:封面页
通过搭建「图像流」来生成下图这张封面:图像流拆解:1. 图像流:创建输入「名称、描述」,点击「确认」,名称可命名为「xhs_cover_page」,如下图:点击「确认」后,进入图像流编辑页面,默认有 2 个节点:「开始、结束」,如下图:2. 封面页元素拆解配置
「封面页」元素拆解, 共 8 个
9/30/2024 7:48:13 AM
省略号
AMD 推出自家首款小语言 AI 模型“Llama-135m ”,主打“推测解码”能力可减少 RAM 占用
AMD 在 Huggingface 平台公布了自家首款“小语言模型”AMD-Llama-135m,该模型具有推测解码功能,拥有 6700 亿个 token,采用 Apache 2.0 开源许可,AI在线附模型地址如下(点此访问)。据介绍,这款模型主打“推测解码”能力,其基本原理是使用小型草稿模型生成一组候选 token,然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token,而不会影响性能,从而显著减少 RAM 占用,实现效率提升。AMD 表示,这款模型在四个 AMD Instinct MI25
9/29/2024 5:08:32 PM
漾仔
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
近日,中国电信人工智能研究院(TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。这是由中国电信集团 CTO、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙教授带领团队完成的又一项里程碑式的重要科研成果,标志着国产大模型训练真正实现全国产化替代,正式进入全国产自主创新、安全可控的新阶段。TeleChat2-115B 基于中国电信自研的天翼云“息壤
9/29/2024 4:42:00 PM
机器之心
最新测评!美图大模型提前揭秘,这波风格化美到窒息
AI好好用报道编辑:杨文支持1分钟、1080P分辨率的超长视频生成。国产视频大模型再次卷出「新高度」。 前脚快手可灵升级完 1.5 模型,后脚字节就正式进军视频生成。 几乎同一时间,美图公司也突然宣布,自家的奇想大模型(MiracleVision)视频生成能力已完成全面升级。具体而言,它不仅单次文生视频时长、单次图生视频时长均达 5 秒,还支持 1 分钟、帧率 24FPS、分辨率 1080P 的超长视频生成。 而更让人惊喜的,则是它超强的风格化。 比如,写实风格的熊猫,坐在墙根上弹着吉他:视频链接:,戴着墨镜,边走
9/29/2024 3:32:00 PM
AI好好用