理论 - AIGC宇宙

在家中完成LLM微调高效指南（上）

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）LLM在生成文本和理解信息方面非常有效，但它们最终受限于训练数据的语料库。例如，如果你让一个通用的预训练模型回答与你的业务特定流程或操作有关的问题，最好的结果是它拒绝，最坏的情况是它会信誓旦旦地给出一个看似合理但错误的答案。当然，你可以通过自己训练一个模型来解决这个问题，但所需的资源往往超出实际可行的范围。

陶哲轩联手60多位数学家出题，世界顶尖模型通过率仅2%！专家级数学基准，让AI再苦战数年

数学为评估复杂推理提供了一个独特而合适的测试平台。它需要一定的创造力和精确的逻辑链条——通常涉及复杂的证明，这些证明必须缜密地筹划和执行。同时，数学还允许对结果进行客观验证。

哈佛推出全新类ChatGPT癌症诊断AI，登上Nature！准确率高达96%

近日，来自哈佛医学院等机构的科学家们开发了一种名为CHIEF（Clinical Histopathology Imaging Evaluation Foundation，临床组织病理学成像评估基础）的多功能AI癌症诊断模型。并于9月4日登上「Nature」。论文地址：，尽管最近出现了其他用于医学诊断的病理图像基础AI模型，但CHIEF是第一个能够预测患者预后并在多个国际患者群体中验证的模型。

OpenAI奥特曼最新对话：将很快进入智能体阶段；OpenAI最初三个目标一个已失效；智慧和能源可解锁AGI；马斯克比我做更多

编辑｜言征出品 | 51CTO技术栈（微信号：blog51cto）2025，OpenAI会有哪些动作？ Sam Altman定下了哪些目标？如何看待自“宫斗”后相创始员工离职潮，以及大模型创业公司的壁垒和未来在哪里？

多模态模型免微调接入互联网，即插即用新框架，效果超闭源商用方案

一个5月份完成训练的大模型，无法对《黑神话·悟空》游戏内容相关问题给出准确回答。这是大模型的老毛病了。因为《黑神话》8月才上市，训练数据里没有它的相关知识。

我为什么离开OpenAI？六年元老发离职长文：AGI将至，我们远没准备好

OpenAI的「员工叛逃」还没有结束。近日，OpenAI又有一位6年元老、研究主管Miles Brundage发表长文官宣离职，并详细解释了自己为何「出走」。作为一家年轻的AI独角兽，成立于2015年的OpenAI如今刚刚9岁，因此在公司待了6年之久的Brundage足以被称为「元老」，见证了OpenAI如何一路起伏、筚路蓝缕地走到今天。

免训练加速DiT！Meta提出自适应缓存新方法，视频生成快2.6倍

现在，视频生成模型无需训练即可加速了？！ Meta提出了一种新方法AdaCache，能够加速DiT模型，而且是无需额外训练的那种（即插即用）。

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LLM进化出复杂推理能力

九月份，OpenAI o1正式登场。作为新一代的老大哥，o1系列专注于复杂的推理任务，一经推出也是直接屠榜了大模型竞技场。图片在下面这些难度较大的数学、编码、科学等任务中，o1不仅比GPT-4o强上一大截，甚至比人类专家还要凶猛。

找不到合适的数据分析报告模板？AIGC帮你定制！

1.思维导图在报告中的多重用途思维导图在数据分析报告中发挥着多种关键作用。业务需求澄清和目标确定：在进行数据分析之前，思维导图可用于清晰展示和澄清各个业务需求之间的联系，以确保在分析过程中不遗漏任何重要方面。同时，借助思维导图，数据分析师能够明晰分析的范围和目标，更有针对性地进行数据收集和分析。

OpenAI的o1是万金油吗？专家为思维链“泼冷水”！研究发现：这三种任务不适合让AI“想太多”，o1准确率直降36.3%！

出品 | 51CTO技术栈（微信号：blog51cto）别想太多！这句劝解有一定道理，在很多问题上过度思考反而会适得其反！ AI是否也会这样呢？

从今天起，ChatGPT入口就是chat.com！

OpenAI大手笔，竟把chat.com买下了。进入这个网址，就直接定向到了ChatGPT主页。这个域名在2023年初，曾被HubSpot创始人兼CEO Dharmesh Shah以1550万美金买下。

借助LLM实现模型选择和试验自动化

译者 | 布加迪审校 | 重楼大语言模型（LLM）已成为一种工具，从回答问题到生成任务列表，它们在许多方面简化了我们的工作。如今个人和企业已经使用LLM来帮助完成工作。代码生成和评估最近已经成为许多商业产品提供的重要功能，以帮助开发人员处理代码。

IBM Granite 3.0模型：为大规模企业AI应用指明方向

IBM在企业AI领域做出了一系列颇为独特的探索。蓝色巨人目前正在推动全栈技术布局，以自2020年来兴起的AI和混合云作为企业战略领域的两大基础性支柱，同时借鉴了自身在其产品组合中积累下的优势。更重要的是，这套方案扭转了主要以AI概念验证为目标的总体趋势，转而专注于解决高度具体的业务用例，且执行效率更高。

大模型重构生命科学！最大基础模型面世，解锁DNA超长序列，参数规模达2100亿

生命科学领域，已经率先进入到基础模型时代！今年，化学诺贝尔奖授予了AlphaFold，AI Science受到空前的关注。人们惊叹于，仅仅是一个蛋白质结构预测模型，就能释放出如此巨大的行业潜力。

轻松搭建AI版“谁是卧底”游戏，muAgent框架让知识图谱秒变编排引擎，支持复杂推理+在线协同

全新Agent框架，将知识图谱从知识获取来源直接升级为Agent编排引擎。蚂蚁集团推出muAgent，兼容现有市面各类Agent框架，同时可实现复杂推理、在线协同、人工交互、知识即用四大核心差异技术功能。这套框架目前在蚂蚁集团内多个复杂DevOps场景落地验证，同时可通过快速搭建的创新AI文本游戏“谁是卧底”游戏快速感受一下。

美国大选日，马斯克忙着审判AI:OpenAI有蹊跷？谷歌不给川普支持者导航？大选中的AI们，哪家最不靠谱，哪家能接到泼天流量？

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）美国大选日，可忙坏了马斯克！毕竟，老马旗下的 X 已经成为了新闻APP里的 Top。图片他本人也在这次大选中格外有存在感，日常疯狂发推，喊话大家抓紧投票。

OpenAI离不开微软，但Anthropic正在成为新宠

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）不久前，OpenAI 和 Microsoft 似乎是不可战胜的。然而，现在，他们的竞争对手正在迎头赶上。巨头支持方面，Anthropic 的 Claude 模型一点都不弱，甚至隐隐有了超越ChatGPT的趋势。

从谷歌、微软、百度，到Perplexity、Kimi、秘塔，大模型真的“搭”上了搜索的快车吗？

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）回到一年前， Perplexity 可能没想到自己押宝的这条赛道如今挤满了人。毕竟，直到今年 4 月，这家 AI 搜索的领头羊才刚刚迈入 10 亿美元俱乐部。然而就在上周，谷歌和 OpenAI 前后脚发布了新的 AI 搜索功能，大有打擂台的硝烟味。