文章列表

最强 AI 程序员 Genie 砸饭碗:84 秒跑通代码,像人一样思考,团队仅 5 人

继 Devin 之后,又一个 AI 软件工程师被刷屏了 —— 它叫 Genie,号称目前地表最强,已经可以像人一样思考和行动了!那么这个“地表最强”,到底强到什么程度?先来看下评测分数。在权威榜单 SWE-Bench 中,Genie 以解决了 30.07% 问题的成绩夺得榜首。(SWE-Bench 是一个用来评估大模型解决现实中软件问题的基准。)而这个成绩可谓是遥遥领先第二名 19.27%,解锁了提升 SOTA 的最大增幅 —— 57%!至于 Genie 的实际效果,用团队的话来说就是:它可以做到像人类工程师一样解

AI出图更快、更美、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?

随着大模型的落地按下加速键,文生图无疑是最火热的应用方向之一。自从 Stable Diffusion 诞生以来,海内外的文生图大模型层出不穷,一时有「神仙打架」之感。短短几个月,「最强 AI 画师」的称号几次易主。每一次技术迭代,都不断刷新着AI图像生成质量和速度的上限。于是现在,我们输入几个文字就能得到任何想要的画面。无论是专业级别的商业海报,还是超写实画风的写真照片,AI 制图的逼真程度已经让我们叹为观止。甚至 AI 赢下了 2023 年度的索尼世界摄影奖。在大奖公布之前,这幅「照片」已经在伦敦萨默赛特宫进行展

2024AGI商业趋势大会最新嘉宾议程公布,相约深圳见证AI闪光时刻

2024年,AI的身影已经无处不在。在巨头的大模型竞技场之外,更广泛的创业者、开发者和个人玩家越来越关注用AI来解决具体的商业诉求,改善自己的工作流。作为业界期待的“下一个互联网”,乃至“超越移动互联网的平台式机会”,创业者们正在积极探索智能与营销、设计、硬件、金融、教育、医疗等具体行业和精准场景的结合。从文本到图像、音乐和视频;由知识问答到导购客服、代码辅助、情感陪伴,乃至导诊分诊、法律咨询、科研开发,用AI “重做一遍应用”的预言似乎正在变成现实。超级应用会在何处诞生?大模型凶猛,小而美的产品会有机会吗?那些完

如何设计能让用户自发传播的 AI 应用?完整流程来了!

一、市场的现状与尝试 1. 当前现状 目前在各领域中的人工智能(AI)现状,由于企业级(B 端)和消费者级(C 端)AI 应用在功能和目标用户群体方面存在显著差异,导致其工具属性显得尤为突出。无论在何种场景下,用户在使用 AI 技术时,主要目的是提高效率或解决特定问题。 然而,大多数普通用户难以直接接触到 AI 技术,在使用过程中仍面临一定的门槛。而这些普通用户通常是通过其他应用程序间接地接触到 AI 技术。在面对市场上众多 AI 工具的情况下,我们需要结合自身业务的特性和当前状况,思考如何使钉钉上的更多非专业的普

效率翻倍!6 款不容错过的免费 AI 神器(九)

大家好,这里和你们一起探索 AI 的花生。 今天继续我们的 AI 效率神器推荐第 9 期,一起来看看吧~ 上期回顾:一、FreePik AI 图像处理 网站直达: FreePik 是国外知名的设计素材和图库网站,自 AI 生成式技术兴起后,FreePik 也紧跟潮流上线了 AI 专属版块 Pikaso,目前有图像生成、风格化、高清放大、背景扣除、外绘扩展等多项功能。我测试了它的抠图和外绘功能,处理速度很快,效果也非常不错,拓展后的图像可以与原图完美衔接。 其 AI 功能每天都有 2-3 次的免费使用额度看,适合偶尔

OpenAI 发布 GPT-4o 模型卡:概述 AI 安全和风险缓解措施

OpenAI 公司于 8 月 8 日发布报告,概述了 GPT-4o 模型的系统卡(System Card),介绍了包括外部红队(模拟敌人攻击)、准备框架(Preparedness Framework)在内的诸多细节。OpenAI 表示 GPT-4o 模型的核心就是准备框架(Preparedness Framework),这是一种评估和降低人工智能系统相关风险的系统方法。AI在线从报道中获悉,该框架主要用于识别网络安全、生物威胁、说服和模型自主性等领域的潜在危险。除了针对 GPT-4 和 GPT-4V 进行的安全评估

AI在用 | 我做的AI美甲,卖到了巴黎奥运会(附提示词)

机器之能报道编辑:杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式,但绝大部分人依然不知道该如何使用。因此,我们推出了「AI在用」专栏,通过直观、有趣且简洁的人工智能使用案例,来具体介绍AI使用方法,并激发大家思考。   我们也欢迎读者投稿亲自实践的创新型用例万万没想到,巴黎奥运会,火了美甲片。赛场内,不少奥运选手都晒出了 blingbling 的美甲。中国选手黄雅琼被求婚时顺带展示出来的:美国选手 Sha'Carri Richardson 在塞纳河畔亮出来的,略显夸张:还有摄像大哥「抓

谷歌I/O开发者大会中国站:大模型技术进入全生态

本周三,谷歌在北京召开了中国开发者大会。除 5 月加州山景城的 I/O 大会之外,今年的 I/O Connect 环球之旅从德国柏林开始、到印度班加罗尔,也已来到中国北京。在这次活动中,来自多个不同领域的专家为国内开发者深入分享了谷歌在 AI、Web、移动端、云技术等领域的最新技术进展、开发工具和全球服务平台等内容。「中国是全球最大的开发者市场之一,我们的开发者一直是全球舞台上不可或缺的先锋力量,」谷歌大中华区总裁陈俊廷在开幕演讲中表示。「过去一年,来自中国的 25 个开发团队共有 31 款游戏和应用,在全球不同的

奥特曼「草莓」模型跳票,OpenAI凌晨大新闻,把网友整懵了

GPT-5 大模型?不要太着急。昨晚,很多人彻夜未眠,都在等待 OpenAI 的「大新闻」。因为在本周三,OpenAI 创始人、CEO 山姆・奥特曼突然在 X 上发了一张照片。奥特曼虽然偶尔会发一些心灵鸡汤,但大多数的推文都是在宣传公司的产品,人们看法很快达成了一致——此中必有深意。有人展开解读:四个红草莓,其中还有一个未成熟的青色草莓,这不妥妥地是在说下一代 AI 大模型 GPT-5 要来了吗?奥特曼在回应网友时也在暗示,惊喜马上就来。这激起了人们的好奇心,预测 GPT-5 发布的时间从草莓成熟所需要的 4 到

小米旗舰设备国际版将接入谷歌 Gemini 大模型,OPPO 此前已接入

感谢小米创办人雷军 8 月 7 日宣布,小米旗舰设备国际版将接入谷歌 AI 大模型 Google Gemini。小米目前已在国行机型中推出了自家的 AI 功能,7 月 30 日,小米小爱同学「大模型小爱」宣布全量升级,支持自然问答、图片编辑、车外唤醒防御等,覆盖核心品类设备。8 月 5 日,小米 14、Redmi K70 等机型推澎湃 OS 全 AI 功能,包括小爱输入助手、AI 写真、AI 搜图、实时字幕、端侧小爱同学文生图、端侧相册 AI 编辑等。AI在线查询获悉,2024 Google 开发者大会于 8 月

手机跑大模型提速 4-5 倍:微软亚研院开源新技术 T-MAC,有 CPU 就行

有 CPU 就能跑大模型,性能甚至超过 NPU / GPU!没错,为了优化模型端侧部署,微软亚洲研究院提出了一种新技术 —— T-MAC。这项技术主打性价比,不仅能让端侧模型跑得更快,而且资源消耗量更少。咋做到的??在 CPU 上高效部署低比特大语言模型一般来说,要想在手机、PC、树莓派等端侧设备上使用大语言模型,我们需要解决存储和计算问题。常见的方法是模型量化,即将模型的参数量化到较低的比特数,比如 4 比特、3 比特甚至更低,这样模型所需的存储空间和计算资源就会减少。不过这也意味着,在执行推理时,需要进行混合精

OpenAI 任命卡内基梅隆大学教授 Zico Kolter 为新董事,加强 AI 安全管理

OpenAI 公司昨日(8 月 8 日)发布博文,宣布任命济科・科尔特(Zico Kolter)为 OpenAI 董事会成员。Zico Kolter 简介AI在线从报道中获悉,科尔特此前担任卡内基梅隆大学(Carnegie Mellon University)机器学习系的教授和主任,工作主要集中在人工智能的安全性、对齐和机器学习分类器的鲁棒性(robustness)方面。科尔特是卡内基梅隆大学计算机科学教授和机器学习系主任,他在该校担任要职已有 12 年之久。科尔特于 2010 年在斯坦福大学获得计算机科学博士学位

消息称马斯克 X 平台同意不使用部分欧盟用户数据来训练 AI

感谢路透社今天(8 月 9 日)报道,马斯克旗下的 X 平台同意不使用部分欧盟用户数据,来训练其 AI 聊天机器人。爱尔兰一家法院周四表示,社交媒体平台 X 同意在欧盟用户选择撤销同意之前,暂时不使用从他们那里收集的个人数据来训练其 AI 系统。爱尔兰数据保护委员会本周寻求一项命令,要求暂停或限制 X 公司,不得处理用户数据来开发、训练或改进其人工智能系统。AI在线曾于 7 月报道,X 用户发现他们已“自动选择”将其帖子以及与 xAI 旗下 Grok 聊天机器人的互动用于“训练和微调”xAI 系统,此举是在未事先获

OpenAI 6000 万美元领投网络摄像头公司 Opal;秘塔科技获超 1 亿元人民币融资,蚂蚁集团领投丨AI情报局

今日融资快报主打AI搜索,秘塔科技完成超  1 亿元人民币的新一轮融资,蚂蚁集团领投秘塔科技完成了超  1 亿元人民币的新一轮融资,由蚂蚁集团领投、光速光合跟投,本轮投后估值达 1.5 亿美元。 秘塔之前的老股东有明势资本、猎豹移动和丰元资本等。 据了解,百度、腾讯等大型科技公司也曾在这轮融资期间与秘塔接触,最终蚂蚁与秘塔达成交易。

OpenAI 宣布 DALL-E 3 模型向 ChatGPT 免费用户开放,但每天只能生成两张图片

北京时间今天凌晨,OpenAI 宣布 ChatGPT 免费用户可以每天使用其 DALL-E 3 模型生成图片。AI在线注:DALL-E 3 于去年 9 月推出,起初只面向 ChatGPT Plus 付费订阅用户提供。用户可以直接在 ChatGPT 的输入框中键入生成图片相关指令,但经过实测,这项功能每天只能免费生成两张图片,否则 ChatGPT 会提示“您已达到图片创建上限,升级至 ChatGPT Plus 或于明天 XX:XX 后重试”。▲ AI在线实测生成的图片,下同今年 4 月,OpenAI 宣布 DALL-

ComfyUI 插件教程:帮你完全掌握 ComfyUI Impact 节点(二)

前言: 学习 ComfyUI 是一场持久战,而 ComfyUI Impact 是一个庞大的模块节点库,内置许多非常实用且强大的功能节点 ,例如检测器、细节强化器、预览桥、通配符、Hook、图片发送器、图片接收器等等。通过这些节点的组合运用,我们可以实现的工作有很多,例如自动人脸检测和优化修复、区域增强、局部重绘、控制人群、发型设计、更换模特服饰等。在 ComfyUI 的进阶之路上,ComfyUI Impact 是每个人不可绕过的一条大河,所以本篇文章将带领大家理解并学会使用这些节点。祝大家学习顺利,早日成为 Com

AI 搜索向左,搜索 OG 向右

作为 AI 世界的领头羊,OpenAI 发布的 SearchGPT 再次给 AI 搜索加了一把火。 这把火原本由 Perplexity 引燃,在美国烧及 Google 和微软,在中国引发了百度、360 的追随,又带动一批创业者跟上,已然成为当下最时髦的热词。 如果大模型之争能够被称为百模大战的话,那么 AI 搜索之争,就可以步其后尘,称之为“百搜大战”了。

OpenAI 阿尔特曼秀 5 颗草莓疯狂暗示 GPT-5?匿名新模型神秘现身,数学超强

阿尔特曼又来搞事情了!一张 5 颗草莓照片,让全网掀起热议狂澜。这不是明摆着暗示,神秘 Strawberry 项目真实存在。难道 GPT-5 真的要来了吗?或许,GPT-5 真的不远了。今天,Sam Altman 突然发文「我爱花园里的夏天」,并配图 5 颗草莓,瞬间在全网炸了锅。而就在刚刚,OpenAI 研究员 Trevor Creech 发文 —— 今晚在 OpenAI 吃晚餐。而盘子中间,恰好放着一颗草莓。这一切,究竟是在疯狂暗示什么?一张图,引发全网大猜想网友表示,阿尔特曼的草莓不仅成熟了,而且已经准备好了