AIGC宇宙 AIGC宇宙

一场「狼人杀」,考倒了一堆大模型

人工智能越来越像人,但“像人”到底意味着什么? 除了会解题、写文,它是否也能理解人类那种充满个性的推理方式? 比如在一场狼人杀游戏中,有人逻辑缜密、有人直觉敏锐、有人擅长伪装。
8/28/2025 1:49:00 PM
郑佳美

OpenAI 将推出家长监控功能以应对青少年自杀悲剧

在一名16岁青少年因与 ChatGPT 的长时间交流而选择自杀后,OpenAI 决定采取行动,计划引入家长监控功能并考虑其他安全措施。 该公司在周二的博客中表示,将探索一些新功能,包括允许家长通过 “单击消息或电话” 联系紧急联系人,以及一个选项,允许 ChatGPT 在严重情况下主动联系这些紧急联系人。 《纽约时报》最早报道了亚当・雷恩(Adam Raine)的悲剧,OpenAI 起初发布的声明相对简短,仅表达了对其家人的哀悼,并未给出具体应对措施。
8/28/2025 10:56:32 AM
AI在线

刚刚,全球AI百强榜发布!ChatGPT稳坐第一,DeepSeek第三,前50有22个来自中国

就在刚刚,a16z最新一期的「Top 100消费级GenAI应用榜单」出炉! 本期榜单传递出一个最核心信息:AI产品竞争的生态格局正日趋稳定! 网页排行前50移动应用排行前50不论是你常用的DeepSeek、豆包、夸克,还是一直领先的ChatGPT和Gemini,或者是新进榜单Lovable等,这场AI产品的「百团大战」依然在继续!
8/28/2025 10:07:18 AM
新智元

​OpenAI 将监测用户聊天记录并向警方报告威胁性内容

最近,OpenAI 在其博客中透露,该公司将开始扫描用户与 ChatGPT 的聊天记录,以检测潜在的有害内容。 此举引发了广泛关注,因为它与公司之前对用户隐私的承诺存在矛盾。 OpenAI 表示,当用户显示出对他人构成威胁的迹象时,其对话将被转交给专门的团队进行审核。
8/28/2025 9:41:00 AM
AI在线

​OpenAI 与 Anthropic 进行首次合作测试,推动 AI 安全标准

在当前竞争激烈的人工智能(AI)领域,OpenAI 和 Anthropic 两家顶尖 AI 实验室决定进行一项前所未有的合作,联合对彼此的 AI 模型进行安全性测试。 这一举措旨在识别各自内部评估中的盲点,并展示在确保 AI 安全与对齐方面,领先企业之间如何能够携手共进。 OpenAI 联合创始人沃伊切赫・扎伦巴(Wojciech Zaremba)在接受采访时指出,随着 AI 技术逐步成熟并被广泛使用,这种跨实验室的合作显得尤为重要。
8/28/2025 9:40:57 AM
AI在线

人人都能看懂!一篇文章帮你彻底搞懂AI绘画的底层原理

现在 ComfyUI 慢慢被很多人接受,但是更多的是工程师,作为一名设计师,我发现很难理解 AI 绘画的底层逻辑,如果没有了解本质,只是了解大概,不理解里面各个参数后面的原理,那么之后面临的最直接的一个问题是不知道怎么微调模型,只能照着人家的教程 1:1 模仿。 知其然,不知其所以然是不可取的,这就是“知识”和“懂”的区别。 所以,我一直好奇,AI 绘画是怎么输入描述词,输出一张高质量的又好看的图片的?
8/28/2025 8:10:49 AM
体验设计

DeepSeek刚提到FP8,英伟达就把FP4精度推向预训练,更快、更便宜

前些天,DeepSeek 在发布 DeepSeek V3.1 的文章评论区中,提及了 UE8M0 FP8 的量化设计,声称是针对即将发布的下一代国产芯片设计。 这件事一下引发了巨大反响,不仅是关于新一代国产芯片设计、大模型在国产芯片训练的话题,也顺势引发了大家对大模型量化策略的关注。 FP8,其全称为 8-bit floating point(8 位浮点数),是一种超低精度的数据表示格式,相较于 FP32(单精度)或 FP16(半精度)等传统浮点格式,FP8 可以在尽量保持数值稳定性和模型精度的前提下,进一步降低存储和计算开销(参见机器之心文章:用FP8训练大模型有多香?
8/27/2025 8:52:00 PM
机器之心

半数英国成年人担忧 AI 对就业的影响,工会呼吁更大参与

根据最新民调显示,半数英国成年人对人工智能(AI)将如何影响他们的工作感到担忧。 这项由工会组织工人联合会(TUC)进行的调查结果显示,2600名受访者中有51% 的人表示,他们对 AI 可能导致的工作丢失或工作条件改变感到忧虑。 特别是在25至34岁之间的年轻工人中,近三分之二(62%)的人对 AI 的影响表示关注。
8/27/2025 5:11:21 PM
AI在线

「精而巧」的端侧大模型为何火了?

大模型爆火伊始,很多厂商提的最多的就是自家的模型(云端大模型)参数有多大,性能有多好。 但近两年,相较云端大模型外,端侧大模型的热度被炒的越来越高。 很重要的原因在于,越来越多的厂商开始布局端侧大模型赛道。
8/27/2025 4:05:39 PM

Meta两员大将回流OpenAI,30天爆赚800万?刚入职闪回巢,小扎钞能力失效

成立仅两个月,小扎「梦之队」MSL已痛失三位核心大脑。 最新爆料称, 两位前OpenAI员工Avi Verma和Ethan Knight,加入Meta一个月再次回流到OpenAI。 1亿美金诱人薪酬包,也没能留住顶尖人才,难道小扎的「钞能力」真的失效了吗?
8/27/2025 3:39:11 PM

​Meta 新超级智能实验室遭遇离职潮,AI 人才流失引发担忧

Meta 公司最新成立的超级智能实验室(Meta Superintelligence Labs)刚成立两个月,就传出多名人工智能研究人员辞职的消息。 该实验室是由 CEO 马克・扎克伯格亲自推动成立的,旨在吸引顶尖 AI 人才,迅速在人工智能领域追赶竞争对手。 据了解,至少有三名研究人员已经从 Meta 辞职,其中两名曾在 OpenAI 工作,分别是 Avi Verma 和 Ethan Knight。
8/27/2025 2:57:04 PM
AI在线

Claude抢跑OpenAI!上线插件杀入浏览器赛道!更放话:大势所趋!竞品昨日刚翻车,泄露用户密码!网友:AI别打钱给缅甸!

出品 | 51CTO技术栈(微信号:blog51cto)赢了 OpenAI 一步,没想到是 Claude 率先杀入 AI 浏览器赛道! Anthropic 已经启动“Claude for Chrome”内测,让AI 直接在网页里替你“点点点”,帮你订外卖、筛房源、甚至处理企业表单。 图片加入waitlist:,就被Claude端上了桌,这无疑是一场抢占先机的豪赌。
8/27/2025 2:02:32 PM
伊风

联合国成立人工智能咨询小组

联合国大会周二做出一项重要决定,成立了一个人工智能咨询机构。 该机构旨在为各国在人工智能这一革命性技术方面的决策提供有力支持。 图源备注:图片由AI生成,图片授权服务商Midjourney由于人工智能飞速发展,其对生活的改变超乎想象,成员国对此深感担忧。
8/27/2025 1:41:44 PM
AI在线

多模态新旗舰MiniCPM-V 4.5:8B 性能超越 72B,高刷视频理解又准又快

今天,我们正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型,看得准、看得快,看得长! 高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,堪称最强端侧多模态模型。 MiniCPM-V 4.5 亮点一览 ?
8/27/2025 11:50:00 AM
徐咪

宾州州立大学推出首个人工智能工程学位,抢占教育先机

随着人工智能逐渐融入我们的日常生活,宾州州立大学(Penn State University)正在教育领域开创新局面,推出全新的人工智能工程学士学位。 这一学位被认为是全美首批此类专业之一,旨在培养具备未来科技能力的人才。 图源备注:图片由AI生成,图片授权服务商Midjourney该学位课程将包括基础数学和科学课程,以帮助学生打下坚实的理论基础。
8/27/2025 11:42:37 AM
AI在线

谷歌翻译大变革:实时同声传译+Gemini语言教练,跨国交流无障碍

AIbase报道 谷歌翻译近日宣布进行重大升级,正式推出基于其最新Gemini大模型技术的实时同声传译功能,彻底改变了传统的对话模式。 这项创新不仅能实现即时语音翻译,同时还配备了实时字幕,让跨语言沟通变得前所未有的流畅与高效。 本次升级的核心是Gemini强大的推理和多模态能力。
8/27/2025 11:42:26 AM
AI在线

​在代理 AI 和物理 AI推动下,全球芯片市场预计将突破 1 万亿美元大关

根据分析公司 Counterpoint Research 发布的一份新报告,人工智能的迅速发展正在推动全球半导体市场迎来前所未有的增长。 该报告预测,随着代理 AI 和物理 AI 的兴起,全球芯片市场的收入预计将在未来数年内突破1万亿美元。 这一数字几乎是当前市场规模的两倍,预计到2024年,市场收入将达到6560亿美元。
8/27/2025 11:42:26 AM
AI在线

「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗?

一直以来,Anthropic 的 Claude 被认为是处理编程任务的最佳模型,尤其是本月初发布的 Claude Opus 4.1,在真实世界编程、智能体以及推理任务上表现出色。 其中在软件编程权威基准 SWE-bench Verified 测试中,Claude Opus 4.1 相较于前代 Opus 4 又有提升,尤其在多文件代码重构方面表现出显著进步。 不过,在刚刚过去的这个周末,Claude 最强编程模型的地位似乎开始动摇了。
8/27/2025 11:35:00 AM
机器之心