文章列表
新「AI科学家」?MIT整合多智能体,实现材料科学研究自动化
编辑 | 萝卜皮人工智能(AI)的一个关键挑战是:如何创建能够通过「探索新领域」、「识别复杂模式」和「揭示海量科学数据中隐藏的联系」来自主推进科学理解的系统。在最近的工作中,麻省理工学院(Massachusetts Institute of Technology)原子与分子力学实验室(LAMM)的研究人员提出了 SciAgents,一种可以整合利用三个核心概念的方法:(1)使用大规模本体知识图谱来组织和互连不同的科学概念;(2)一套大型语言模型(LLM)和数据检索工具;(3)具有现场学习能力的多智能体(agent)
OpenAI o1 在医学领域的初步研究,我们离 AI 医生更近了吗?
编辑 | 紫罗大语言模型 (LLM) 在各个领域和任务中都表现出了卓越的能力,突破了我们在学习和认知方面的知识界限。最新模型 OpenAI 的 o1 脱颖而出,成为第一个使用思维链 (CoT) 技术和强化学习的 LLM。虽然 o1 在一般任务中表现良好,但它在医学等专业领域的表现仍然未知。目前医学 LLM 的基准通常集中在一定范围内,例如知识、推理或安全,这使得在复杂的医学任务中对这些模型进行全面评估变得复杂。来自加州大学圣克鲁斯分校、爱丁堡大学和美国国立卫生研究院的研究人员评估了 OpenAI 的 o1 模型在医
OpenAI人事地震24小时,奥特曼盟友Greg休假中发声,网友:你留下吗?
还记得休假到 2024 年底的 OpenAI 总裁 Greg Brockman 吗?在 OpenAI 的又一次人事巨震后,经过一天的沉默,Greg 终于发声了,小作文相比山姆・奥特曼的篇幅长了不少。我对 Barret、Bob 和 Mira 为 OpenAI 所做的贡献深表感激。我们合作多年,我们都是帮助 OpenAI 走到今天的团队成员。他们每个人都为团队做出了贡献。关于他们每个人,我都有一段小故事:Mira 和我最初是在 GPT-3 API 项目上密切合作,这是 OpenAI 创建的第一个产品,也可能是我做过的最
PC 版 ChatGPT 客户端曝“记忆”功能漏洞,黑客可利用恶意文件令 AI 转发对话记录
OpenAI 在今年 2 月宣布为 ChatGPT 推出记忆(Memory)的功能,今年 9 月初这项功能正式向所有用户开放,该功能的主要用途是“设定预设”,从而帮助 AI 向用户更符合需求的答案。不过研究人员 Johann Rehberger 目前披露报告,称这项功能在 PC 版 ChatGPT 客户端上存在漏洞,黑客可借漏洞获取用户对话记录。AI在线获悉,Johann Rehberger 将这项漏洞称为 SpAIware,他表示黑客可通过钓鱼形式让受害者在 PC 版 ChatGPT 客户端中上传特定文件 / 特
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
今天凌晨,大新闻不断。一边是 OpenAI 的高层又又又动荡了,另一边被誉为「真・Open AI」的 Meta 对 Llama 模型来了一波大更新:不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此,Meta 还正式发布了 Llama Stack Distribution,其可将多个 API 提供商打包在一起以便模型方便地调用各种工具或外部模型。此外,他们还发布了最新的安全保障措施。真・Open AI
CTO前脚刚走,OpenAI后训练负责人、首席研究官也走了,网传公司要给奥特曼7%股权
刚刚,就在 OpenAI CTO Mira Murati 官宣辞职后不久,CEO Sam Altman 又投下一枚重磅消息 —— 以另一篇公开信的方式。奥特曼首先写道,「过去六年半,Mira 对 OpenAI 的进步和成长起到了至关重要的作用;她是我们从一个不为人知的研究实验室发展成为一个重要公司的巨大推动力。今天早上,Mira 告诉我她要离开时,我感到非常难过,但我支持她的决定。在过去的一年里,她一直在培养一支强大的领导团队,他们将继续推动我们的进步。」接着,他进一步透露更多高层的离职消息。「我还想告诉大家,B
突发!OpenAI CTO Mira Murati离职,高层动荡继续
OpenAI 又迎来「地震级」高层人员变动。就在几个小时前,OpenAI CTO Mira Murati 在 X 上发帖表示,在 OpenAI 工作了六年多后,她将离开公司进行自己的探索。以下是 Mira Murati 的离职公开信全文(第一人称):「我有件事想和大家分享。经过深思熟虑,我做出了离开 OpenAl 的艰难决定。我已经在 OpenAl 团队工作了六年半,这是我的荣幸。在接下来的几天里,我会向很多人表示感谢,但首先我想感谢 CEO Sam Altman 和总裁 Greg Brockman 对我领导技术组
Snapchat 聊天机器人 My AI 将整合谷歌 Gemini 模型
谷歌 Google Cloud 公司本周二宣布和 Snap 公司合作,在 Snapchat 的 AI 聊天机器人 My AI 中整合 Gemini,为用户带来更强的 AI 聊天体验。AI在线援引新闻稿内容,Snapchat 将使用谷歌 Gemini 聊天机器人的强大多模态功能,理解文本、音频、图像、视频和代码在内的多种输入类型,并理解回答用户的提问。谷歌表示本次合作,为 Snapchat 用户带来了更多创新功能。Snap 首席执行官埃文・斯皮格尔(Evan Spiegel)评论表示:与 Google Cloud 的
端侧最强开源 AI 模型 Llama 3.2 登场:可在手机运行,从 1B 纯文本到 90B 多模态,挑战 OpenAI 4o mini
Meta 公司昨日(9 月 25 日)发布博文,正式推出了 Llama 3.2 AI 模型,其特点是开放和可定制,开发者可以根据其需求定制实现边缘人工智能和视觉革命。Llama 3.2 提供了多模态视觉和轻量级模型,代表了 Meta 在大型语言模型(LLMs)方面的最新进展,在各种使用案例中提供了更强大的功能和更广泛的适用性。其中包括适合边缘和移动设备的中小型视觉 LLMs (11B 和 90B),以及轻量级纯文本模型(1B 和 3B),此外提供预训练和指令微调(instruction-tuned)版本。AI在线附
字节全新发布豆包AI视频模型:再见了Sora,你的时代过去了
刚刚,字节的火山引擎的发布会基本结束了。
我现在有点过于激动。
虽然发布会结束了,但是我觉得,一个颠覆行业的全新的起点,在这一刻,正式到来了。
字节正式发布了他们全新的两款 AI 视频模型:
豆包视频生成-PixelDance 模型和 Seaweed 模型。Seaweed 模型下次我再详细来说。这次,我想说这个豆包 PixelDance 模型,因为太屌了,屌炸了,我真的是全程惊叹着看完的。
他们正式宣布这玩意的那一刻,现场掌声雷动,我隔着屏幕都感觉快特么把房顶掀翻了。
真的,如果要给这个豆包 PixelDance
英伟达发布 Llama-3.1-Nemotron-51B AI 模型:创新神经架构搜索等技术让单 H100 GPU 运行 4 倍以上负载
英伟达 9 月 23 日发布博文,宣布推出 Llama-3.1-Nemotron-51B AI 模型,源自 Meta 公司的 Llama-3.1-70B,不过创新使用神经架构搜索(NAS)方法,建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-Nemotron-51B AI 模型基于 Meta 公司 2024 年 7 月发布的 Llama-3.1-70B 模型,共有 510 亿参数。该 AI 模型主要采用了神经架构搜索(NAS)技术微调,平衡性能和效率,在高工作负
OpenAI o1 AI 模型 PlanBench 规划能力实测:准确率 97.8%,远超 LLaMA 3.1 405B 创造的 62.6% 纪录
来自亚利桑那州立大学的科研团队利用 PlanBench 基准,测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步,但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年,用于评估人工智能系统的规划能力,包括 600 个来自 Blocksworld 领域的任务,其中积木必须按照特定顺序堆叠。OpenAI o1 模型成绩在 Blocksworld 任务中,OpenAI 的 o1 模型准确率达到 97.8%,大大超过了之前的最佳语言模型 LLaMA
谷歌 Gemini 1.5 AI 模型再进化:成本更低、性能更强、响应更快
科技媒体 The Decoder 昨日(9 月 24 日)发布博文,报道谷歌升级旗下 Gemini 1.5 AI 模型,推出了 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002,相比较此前版本成本更低、性能更强、响应更快。成本更低谷歌下调了 token 输入和输出费用,Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%,提高了两种模型的速率限制,并减少了延迟。新定价于 2024 年 10 月 1 日生效。性能更强AI在线援引新闻稿内
大众携手谷歌,率先邀请约 12 万名车主免费使用 Gemini AI
大众汽车昨日(9 月 24 日)发布新闻稿,宣布携手谷歌公司,率先邀请约 12 万名大众 Atlas 和 Atlas Cross Sport 车型车主,免费体验和使用 Gemini AI 助手。Gemini AI 助手功能大众汽车在新闻稿中表示,通过与谷歌云(Google Cloud)的战略合作,在 myVW 移动应用中部署生成式人工智能。大众汽车车主可以通过聊天的方式和 Gemini AI 对话,掌控车辆状态或者请求其提供帮助。例如车主可以询问“如何更换备胎”,Gemini 就会自动调用 YouTube 视频,提
真能这么简单?我居然 1 分钟就搞定了一个 IP 角色的 3D 建模
大家好,我是花生~
今年 1 月份的时候,我给大家推荐过 5 款 AI 3D 模型生成工具,可以直接通过文本和图像生成 3D 模型。如今已经过去了半年多的时间 ,这些工具都有不同程度的发展,尤其 Tripo AI,一直在不断打磨自己的产品,不仅生成质量在提升,还添加了多图生成、骨骼绑定、重新拓扑等功能,给人的使用体验越来越好。
前几天 Tripo AI 又推出了新的 2.0 模型,在建模精度、贴图质量上提升了一个新的维度,逼近人工建模的水平,因此具有极大的落地应用价值。下面就为大家详细一下介绍这个新模型的亮点。
相
第四波!2024年9月精选实用设计工具合集
大家好,这是 2024 年 9 月的第 4 波干货合集!
AI 对于设计领域的深刻影响正在逐步显现,AI 直接提取文本生成海报、AI 生成高品质视频、AI 生成可迭代升级的数字产品,这是很多创作者和设计师都需要且期待的功能,如今都有平台逐步实现并且落地应用,今天的推荐当中,就包含有这几个类别的工具,虽有瑕疵,但是瑕不掩瑜,都值得关注。此外还有一个在线 PS 的平替,以及一套素质颇为不错的免费开源图标。
当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、在线的 AI
上交大、复旦中山团队开发糖尿病专用大语言模型,助力个性化糖尿病管理
编辑 | ScienceAI随着全球糖尿病患病率的逐年攀升,糖尿病已成为全球范围内极具挑战的公共健康问题。据统计,全球约有 10% 的人口受到糖尿病的影响。到 2045 年,全球糖尿病患者人数预计将攀升至惊人的 7.83 亿。然而,由于糖尿病医生短缺、医疗资源分布不均以及患者自我管理能力的不足,糖尿病的管理和治疗仍面临重重困难。如何高效、智能化地管理糖尿病,已成为当前医学界和科技界共同关注的重要课题。为应对这一挑战,上海交通大学清源研究院 MIFA 实验室与复旦大学附属中山医院内分泌科组成的研究团队,联手开发出一款
23亿参数,Transformer架构,NASA、IBM发布「天气+气候」通用AI模型Prithvi WxC
编辑 | KX9 月 23 日,IBM 与 NASA 合作发布了一个用于天气和气候的新型通用 AI 模型 Prithvi WxC,该模型可以在台式计算机上运行,且开源。Prithvi WxC 具有 23 亿参数,使用 MERRA-2 数据集的 160 个变量开发而成。Prithvi WxC 采用创新的 Transformer 架构。研究人员在一系列具有挑战性的下游任务上测试了该模型,即:自回归滚动预测、降尺度、重力波通量参数化和极端事件估计。由于其独特的设计和训练机制,Prithvi WxC 可以解决比现有天气 A