ai-da-mo-xing-shi-dai-ren-cai-de-xu-qiu-yi-jing-bian-le 的搜索结果
陶哲轩联手60多位数学家出题,世界顶尖模型通过率仅2%!专家级数学基准,让AI再苦战数年
数学为评估复杂推理提供了一个独特而合适的测试平台。 它需要一定的创造力和精确的逻辑链条——通常涉及复杂的证明,这些证明必须缜密地筹划和执行。 同时,数学还允许对结果进行客观验证。
AI 内容博弈:OpenAI 在和新闻机构版权纠纷案中赢得首轮胜利
科技媒体 engadget 昨日(11 月 8 日)发布博文,报道称 OpenAI 在与 Raw Story 和 AlterNet 的版权纠纷案件中,赢得首轮胜利。
谷歌、MIT等开发多智能体医疗决策框架MDAgents,医学LLM新用法
编辑 | 白菜叶基础模型正在成为医学领域的宝贵工具。 然而,尽管它们前景广阔,但在复杂的医学任务中如何最好地利用大型语言模型 (LLM) 仍是一个悬而未决的问题。 麻省理工学院、谷歌研究院和首尔国立大学医院的研究人员提出了一种新颖的多智能体框架,称为医疗决策智能体 (MDAgents),它通过自动为 LLM 团队分配协作结构来帮助解决这一差距。
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列,参数规模达2100亿
生命科学领域,已经率先进入到基础模型时代! 今年,化学诺贝尔奖授予了AlphaFold,AI Science受到空前的关注。 人们惊叹于,仅仅是一个蛋白质结构预测模型,就能释放出如此巨大的行业潜力。
美国大选日,马斯克忙着审判AI:OpenAI有蹊跷?谷歌不给川普支持者导航?大选中的AI们,哪家最不靠谱,哪家能接到泼天流量?
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)美国大选日,可忙坏了马斯克! 毕竟,老马旗下的 X 已经成为了新闻APP里的 Top。 图片他本人也在这次大选中格外有存在感,日常疯狂发推,喊话大家抓紧投票。
前 OpenAI “AGI 准备工作”负责人:AI 将很快完成人类在计算机上能做的一切
据《商业内幕(Business Insider)》当地时间 3 日报道,OpenAI 前政策研究与“AGI (AI在线注:通用人工智能)准备工作”负责人 Miles Brundage 表示,未来几年行业可能会开发出“几乎能够远程完成”人类能通过计算机操作的所有任务的系统,包括使用鼠标和键盘,甚至在视频聊天中呈现出“人类形象”。 对于 OpenAI 等公司来说,开发具备 AGI 的机器的时间表是业内广泛关注的热点话题。 一些领域中的重要人物相信,这项技术将在未来数年内到来。
谷歌内部项目:大模型 AI 智能体发现了代码漏洞
开源数据库引擎 SQLite 有 bug,还是智能体检测出来的! 通常,软件开发团队会在软件发布之前发现软件中的漏洞,让攻击者没有破坏的余地。 模糊测试 (Fuzzing)是一种常见的软件测试方法,其核心思想是将自动或半自动生成的随机数据输入到一个程序中,并监视程序异常。
创新能力超越AI Scientist,上海AI Lab「AI 科研团队」VirSci来了
编辑 | ScienceAI由上海人工智能实验室提出的 VirSci(Virtual Scientists)系统是一个基于大语言模型(LLM)的多智能体协作平台,专注于模拟科学家团队的合作过程,从而加速科研创新。 不同于以往的单智能体系统,VirSci 通过使用真实科学家的数据来模拟科学团队的多人协作,不仅可以通过团队成员的合作讨论来生成更具创新性和影响力的科研想法,还展现出作为「科学学」(Scienceof Science)研究工具的巨大潜力。 该研究以「Two Heads Are Better Than One: A Multi-Agent System Has the Potential to Improve Scientific Idea Generation」为题,于 2024 年 10 月 12 日发布在 arXiv 预印平台。
UCLA、MIT数学家推翻39年经典数学猜想!AI证明卡在99.99%,人类最终证伪
又一个看似坚固无比的数学理论,被证伪了! 最近,UCLA和MIT的研究者证伪了概率论中众所周知的假设——「上下铺猜想」。 上下铺猜想(Bunkbed Conjecture)也称为双层床猜想,是渗透理论中的一个陈述,该领域处理的是在图的边随机删除后存在的路径和簇。
OpenAI安全大佬,华人科学家翁荔B站首秀!人类如何培养出下一代聪明且安全的AI技术
出品 | 51CTO技术栈(微信号:blog51cto)B站真的啥也能学到! 11月B站的哔哩哔哩超级科学晚活动,竟然请来了OpenAI的研究副总裁(安全)——翁荔! 她是OpenAI的华人科学家,也是ChatGPT的贡献者之一。
继 ChatGPT 后,Anthropic 旗下 Claude AI 推出桌面平台客户端
继 ChatGPT 后,目前又有一款海外流行的人工智能 Claude AI 获得了桌面版客户端,目前相关客户端处于测试状态,支持 Windows / macOS / iOS 平台。 开发商 Anthropic 在 X 平台官宣了这一消息,同时透露用户可以使用热键快速唤起客户端界面,不过 Claude AI 客户端定位 AI 搜索引擎,与 OpenAI 的 ChatGPT 客户端聊天有所差异。 参考应用详情页,这一 AI 客户端主打语音搜索,不过用户也可以令其写作文章邮件、解决数学问题、判断语法错误、分析文档内容等。
独家丨字节招兵买马,拟在欧洲设立AI研发中心
知情人士透露,字节跳动目前已经开始寻找欧洲的 LLM 和 AI 方面技术大牛,积极招揽人才。 而纵观欧洲各国的 AI 技术水平,瑞士、英国和法国相对靠前。 其中,瑞士和英国都有不少知名院校。
谷歌:Gemini API 用量 6 个月飙升 14 倍,明年将升级 AI 助手
科技媒体 The Decoder 昨日(10 月 30 日)发布博文,报道称谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)在最新季度财报电话会议上,宣布 Gemini API 用量在过去 6 个月内飙升了 14 倍。 皮查伊表示谷歌已经在 Google Maps、Google Search 等核心业务中整合 Gemini,目前已初步覆盖 20 亿用户,此外独立 Gemini 应用和嵌入的 Android Assistant 也见证了强劲的用户增长。 谷歌的云计算部门已经开始受益于人工智能的繁荣,收入增长了 35%,达到 114 亿美元,这包括人工智能和第三方服务,该部门的营业收入从去年的 2.7 亿美元增长到了 19.5 亿美元。
Python 成 GitHub 最受欢迎编程语言,AI 成主要推动力
GitHub 年度报告《Octoverse》显示,Python 首次超越 JavaScript 成为 GitHub 上最受欢迎的编程语言。 这主要是受到人工智能(AI)开发需求激增的推动,Python 还被广泛应用于数据科学和开源项目的开发。 报告指出,与生成式 AI 相关的项目贡献量在过去一年中增长了 59%,AI 相关的公共项目的贡献量几乎比 2023 年翻了一番,印度、德国、日本和新加坡是这些贡献的主要来源。
OpenAI 开源 SimpleQA 新基准,专治大模型“胡言乱语”
当地时间 30 日,OpenAI 宣布,为了衡量语言模型的准确性,将开源一个名为 SimpleQA 的新基准,可衡量语言模型回答简短的事实寻求(fact-seeking)问题的能力。 AI 领域中的一个开放性难题是如何训练模型生成事实正确的回答。 当前的语言模型有时会产生错误输出或未经证实的答案,这一问题被称为“幻觉”。
消息称 OpenAI 正与博通、台积电联手,共同打造自研芯片
感谢北京时间今天凌晨,据路透社援引知情人士消息称,OpenAI 正携手 Broadcom 和台积电开发首款自研 AI 芯片,并在英伟达芯片的基础上增添 AMD 芯片,以应对急剧扩张的基础设施需求。 成长势头正猛的 OpenAI 是 ChatGPT 背后的公司,其正在多方探索多样化芯片供应渠道,降低成本,曾考虑自行生产,并为一项建造“晶圆厂”网络的高昂计划筹资,全面掌控芯片制造。 不过,由于该计划耗资巨大且时间漫长,OpenAI 已暂时搁置建厂计划,转向内部设计芯片。
谷歌 CEO 桑达尔・皮查伊:努力在明年推出具有可视化功能的 AI 助理
北京时间今天凌晨,谷歌 CEO 桑达尔・皮查伊在公司第三季度财报电话会议上透露了“Project Astra”计划的最新进展。 他表示,谷歌正在构建能够识别和推理用户周围环境的 AI 体验,“‘Project Astra’代表了这种未来的初步探索。 我们正力争在 2025 年尽早推出类似体验。
可令 AI 助理同时进行快 / 慢速思考,谷歌 DeepMind 公布具备两种思维模式的 Talker-Reasoner 框架
谷歌 DeepMind 上周公布了一个号称“具备两种思维模式”的 Talker-Reasoner 框架,旨在让 AI 助理能够同时进行快速和慢速思考,目前相关论文已发布于 ArXiv 上(点此访问)。 据介绍,这款框架采用“双系统”设计,能够在与用户进行对话的同时并行多步骤推理任务(一边快速回答用户问题,一边高速思考),其中系统 1 Talker LLM 主要负责快速、直觉和合成的语言回应,用于与用户交谈。 而系统 2 Reasoner LLM 则负责解决复杂问题,涉及从外界获取信息以增强知识,例如调用工具或从外部数据库检索信息,从而提升系统 1 回应内容的准确度及逻辑性。