应用
谷歌追赶 OpenAI,加速推进会“思考”的 AI 通用推理模型
感谢彭博社昨日(10 月 2 日)报道,谷歌公司正在开发类人推理 AI,希望在进度方面追赶 OpenAI 公司的 o1 模型。OpenAI 最近为 ChatGPT 引入了 o1-preview 和 o1-mini 模型,可以模拟人类的思考模式,实现通用推理,让 AI 实现“思考”。AI在线援引彭博社报道,谷歌公司目前也在积极推进通用推理 AI 模型的落地,该 AI 模型更擅长处理数学和编程,不过消耗更多的处理能力和能源。知情人士称,与 OpenAI 一样,谷歌也在尝试使用一种名为“思维链提示”的技术来接近人类的推理
OpenAI 笑傲 AI 江湖:66 亿美元掀起融资狂潮,9 个月估值接近翻番至 1570 亿美元
感谢路透社今天(10 月 3 日)发布博文,报道 OpenAI 公司于美国当地时间周三宣布成功融资 66 亿美元(AI在线备注:当前约 463.64 亿元人民币),公司估值达到 1570 亿美元(当前约 1.1 万亿元人民币),短短 9 个月时间公司估值接近翻倍,创下硅谷历史最高纪录。AI在线援引 FT 报道,在本次融资过程中,OpenAI 经历了诸多风波,除了内部多名联合创始人出走之外,在本次融资中也出现了诸多情况。据了解情况的三位人士透露,在谈判期间,OpenAI 明确表示希望获得独家融资安排,希望投资者在 A
整合海量公共数据,谷歌开源 AI 统计学专家 DataGemma
准确的统计数据、时效性强的信息,一直是大语言模型产生幻觉的重灾区。知识是现成的,但学是不可能学的。并非此身惰怠,只因现实太多阻碍。对于这个问题,谷歌在近日推出了自己筹划已久的大型数据库 Data Commons,以及在此基础上诞生的大模型 DataGemma。论文地址: Commons 是一个庞大的开源公共统计数据存储库,包含来自联合国(UN)、疾病控制与预防中心(CDC)、人口普查局、卫生部、环境机构、经济部门、非政府组织和学术机构等可信来源的大量统计数据。目前,整个语料库包含超过 2500 亿个数据点和超过 2
OpenAI 联合创始人 Durk Kingma 加盟 Anthropic
感谢Durk Kingma 是 OpenAI 公司不太知名的一位联合创始人,今天他宣布将加入 Anthropic。在 X 上的一系列帖子中,Kingma 透露他将主要在荷兰(他所在的地方)远程工作,但没有说他将加入或领导哪个 Anthropic 部门。“Anthropic 的 AI 开发方法与我自己的信念产生了强烈共鸣,”Kingma 写道。“期待为 Anthropic 的使命 ——“负责任地开发强大 AI 系统”做出贡献。迫不及待地想与他们才华横溢的团队合作,包括来自 OpenAI 和谷歌的一些优秀的前同事,并应
微调 GPT-4o AI 模型新维度,OpenAI 开放图片视觉微调功能
OpenAI 公司昨日(10 月 1 日)发布博文,宣布为 GPT-4o 模型引入视觉微调(vision fine-tuning)功能,除了文本之外还支持微调图像。OpenAI 表示自开放微调 GPT-4o 以来,数十万开发者使用数据集(仅文本)微调了该模型,从而提高了驾驭某些特定任务的能力。OpenAI 在博文中展示了一些合作伙伴的微调案例:Garb :通过视觉微调,提升了交通标志定位准确性 20% 和限速标志定位 13%。Automat:成功率从 16.60% 提升至 61.67%,并在信息提取任务中 F1 分
OpenAI 发布 Realtime API,助力第三方应用集成其语音合成技术
科技媒体 The Decoder 昨日(10 月 1 日)发布博文,报道称 OpenAI 在旧金山开发者大会(DevDay)上,发布了 Realtime API,可以让开发者调用该 API 在第三方应用中集成语音合成技术。OpenAI 表示开发者通过调用新的 Realtime API,可以在其应用中添加 6 种 AI 语音,AI在线注:OpenAI 为了避免法律问题,开发者不能使用第三方语音。OpenAI 还展示了其它应用场景,表示可用于客户支持、语言学习、教育软件等,开发者可以利用语音交互增强用户体验:OpenA
乏善可陈的第二届OpenAI开发者大会,果然没有掀起太大波澜
OpenAI宫斗后的 DevDay 开发者大会,没有什么惊喜。OpenAI 的宫斗大戏刚落下帷幕,今日凌晨就在旧金山召开了第二届 DevDay 开发者大会。不过,与去年盛大的活动相比,今年略显低调,他们没有推出重大产品,而是选择对其现有的 AI 工具和 API 进行增量改进。在这次活动中,OpenAI 发布了四大API新功能:视觉微调(Vision Fine-Tuning)、实时 API(Realtime API)、模型蒸馏(Model Distillation)和提示缓存(Prompt Caching)。这些新工
安卓版谷歌 Gemini Live 上线,助力 AI 开启全民语音聊天时代
谷歌公司昨日(10 月 1 日)在 X 平台发布推文,宣布通过 Gemini 应用,现面向所有安卓用户开放 Gemini Live 功能。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式,采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。需要注意的是,目前仅
谷歌安卓版 Gemini AI 现支持浮动 / 分屏操作,三星 Galaxy Z Fold6 折叠手机限时独享
科技记者 Mishaal Rahman 昨日(9 月 30 日)发布博文,报道称在三星 Galaxy Z Fold6 折叠屏手机上,通过升级最新 Gemini AI 助手应用,可以实现分屏或者浮动窗口操作。用户升级新版 Gemini 应用之后,浮动叠加层顶部有一条小白条,显示用户当前可以像常规安卓应用一样操作 Gemini,不仅支持变为浮动窗口,还支持上下、左右分屏。三星首次在其最新的 Unpacked 活动中展示了这一功能。这表明该功能可能暂时仅限于某些三星设备,Gemini 目前已知仅支持三星 Galaxy Z
软银大手笔,被曝将向 OpenAI 投资 5 亿美元
感谢北京时间今晚,据 The Information 援引知情人士消息称,软银的愿景基金(Vision Fund)已经同意向 OpenAI 的最新一轮融资投资 5 亿美元(AI在线备注:当前约 34.96 亿元人民币)。在投资前,OpenAI 的估值为 1500 亿美元(当前约 1.05 万亿元人民币),这笔交易是软银对其的首次投资。软银加入了领投方 Thrive Capital 的行列,后者在本轮融资中的投资额超过 10 亿美元(当前约 69.92 亿元人民币)。据悉,Tiger Global Managemen
OpenAI 想转成营利性公司,这一操作被指极为复杂
9 月 30 日消息,人工智能研究机构 OpenAI 计划转型为营利性公司,目的是简化公司架构和运营模式。然而,实现这一目标的过程极其复杂。图源 Pexels作为热门聊天机器人 ChatGPT 的开发商,OpenAI 正在筹集 65 亿美元资金,投资者包括微软、英伟达、风险投资机构以及阿联酋的一家国有企业。谈判中的一项重要条款是,目前由非营利组织管理的 OpenAI 必须在两年内转型为公益性公司。这意味着 OpenAI 需要在创造社会效益的同时实现盈利。如果未能转型成功,投资者可以收回资金。为了实现这一目标,Ope
消息称 OpenAI CEO 阿尔特曼遭台积电高管嘲讽:7 万亿美元造芯计划太荒谬了
《纽约时报》上周的一篇报道揭露了 OpenAI 首席执行官萨姆・阿尔特曼在去年访问亚洲期间与多家芯片制造商高层会谈的内幕,报道称,阿尔特曼提出的巨额投资计划遭到了台积电高管的强烈质疑,他们认为这个想法太荒谬了,以至于他们将阿尔特曼戏称为“播客兄弟(podcasting bro)”。图源 Pexels阿尔特曼计划投资 7 万亿美元(AI在线备注:当前约 48.94 万亿元人民币)建设 36 个新的芯片制造工厂和数据中心,以推动人工智能的发展。然而,台积电高管认为这一计划过于激进,且风险极高。再增加几座芯片制造厂都已经
神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作
都来玩这套。继 OpenAI“草莓”之后,又有神秘模型蓝莓来“霸榜”。在文生图模型排行榜上,两个“无人认领”的模型 blueberry_0 和 blueberry_1 力压 Flux.1、Ideogram v2、Midjourney v6.1 等知名模型,成为最新榜一榜二大哥。一些生成效果 be like,确实不错。不过这一次,未必是 OpenAI 跨界来搞事,背后公司更可能是打造了 Flux 的黑森林实验室。为啥?来看这组 PK。blueberry_0 生成的大胡子男人,和 Flux Pro 的几乎一模一样。有人
2024 九月工具合集!6 款不容错过的免费 AI 神器
大家好我是花生~
今天我们继续 AI 效率神器的第 11 期,一起来看看吧~
上期回顾:一、抠图神器 Object Cutter
网站直达:
Object Cutter 是一款在线免费的抠图工具,它的特点是可以通过文本以及选框指定需要抠取的内容。这样的好处是即使图像中有多个对象,也可以轻松指定到我们想要的那一个,免去了手动选取的麻烦,非常方便。而且抠图的效果也很精细,很小的缝隙也能处理。
使用时在原图顶部的「By prompt」和「By bounding box」中切换不同模式,然后在文本框内填写需要抠取的内容,
一键出爆款!如何用 Coze 搭建图文生成+排版一体化工作流?
一、完整工作流拆解,一张图看懂
最终会生成的内容:4 张图片(1 张封面页,3 张内容页),如下图:我们要实现上图工作流,需要先搭建「2 个图像流,1 个工作流,1 个卡片,1 个 Bot」,如下所示:二、图像流创建:封面页
通过搭建「图像流」来生成下图这张封面:图像流拆解:1. 图像流:创建输入「名称、描述」,点击「确认」,名称可命名为「xhs_cover_page」,如下图:点击「确认」后,进入图像流编辑页面,默认有 2 个节点:「开始、结束」,如下图:2. 封面页元素拆解配置
「封面页」元素拆解, 共 8 个
AMD 推出自家首款小语言 AI 模型“Llama-135m ”,主打“推测解码”能力可减少 RAM 占用
AMD 在 Huggingface 平台公布了自家首款“小语言模型”AMD-Llama-135m,该模型具有推测解码功能,拥有 6700 亿个 token,采用 Apache 2.0 开源许可,AI在线附模型地址如下(点此访问)。据介绍,这款模型主打“推测解码”能力,其基本原理是使用小型草稿模型生成一组候选 token,然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个 token,而不会影响性能,从而显著减少 RAM 占用,实现效率提升。AMD 表示,这款模型在四个 AMD Instinct MI25
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
近日,中国电信人工智能研究院(TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。这是由中国电信集团 CTO、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙教授带领团队完成的又一项里程碑式的重要科研成果,标志着国产大模型训练真正实现全国产化替代,正式进入全国产自主创新、安全可控的新阶段。TeleChat2-115B 基于中国电信自研的天翼云“息壤
最新测评!美图大模型提前揭秘,这波风格化美到窒息
AI好好用报道编辑:杨文支持1分钟、1080P分辨率的超长视频生成。国产视频大模型再次卷出「新高度」。 前脚快手可灵升级完 1.5 模型,后脚字节就正式进军视频生成。 几乎同一时间,美图公司也突然宣布,自家的奇想大模型(MiracleVision)视频生成能力已完成全面升级。具体而言,它不仅单次文生视频时长、单次图生视频时长均达 5 秒,还支持 1 分钟、帧率 24FPS、分辨率 1080P 的超长视频生成。 而更让人惊喜的,则是它超强的风格化。 比如,写实风格的熊猫,坐在墙根上弹着吉他:视频链接:,戴着墨镜,边走