文章列表

图像领域再次与LLM一拍即合!idea撞车OpenAI强化微调,西湖大学发布图像链CoT

OpenAI最近推出了在大语言模型LLM上的强化微调(Reinforcement Finetuning,ReFT),能够让模型利用CoT进行多步推理之后,通过强化学习让最终输出符合人类偏好。 无独有偶,齐国君教授领导的MAPLE实验室在OpenAI发布会一周前公布的工作中也发现了图像生成领域的主打方法扩散模型和流模型中也存在类似的过程:模型从高斯噪声开始的多步去噪过程也类似一个思维链,逐步「思考」怎样生成一张高质量图像,是一种图像生成领域的「图像链CoT」。 与OpenAI不谋而和的是,机器学习与感知(MAPLE)实验室认为强化学习微调方法同样可以用于优化多步去噪的图像生成过程,论文指出利用与人类奖励对齐的强化学习监督训练,能够让扩散模型和流匹配模型自适应地调整推理过程中噪声强度,用更少的步数生成高质量图像内容。

全球首个全模态理解开源端模型:长语音自动总结,图文音啥都会!300%推理速度领先,来自无问芯穹

全球首个端侧全模态理解开源模型来了! 在菜单里帮忙选奶茶,不在话下:还能帮忙轻松提炼长语音,再也不用对着一串几十秒语音头皮发麻(doge)。 就在刚刚,无问芯穹宣布开源目前世界上首个端侧全模态理解的开源模型Megrez-3B-Omni,不仅体积轻巧,速度飞快,更是一个多才多艺的全能选手,能够轻松处理图片、音频、文本三种模态数据。

世界模型进入4D时代!单视角视频构建的自由视角4D世界来了

人工智能技术正以前所未有的速度改变着我们对世界的认知与构建方式。 近期,李飞飞教授团队通过单张图片生成三维物理世界的研究,再次向世界展示了空间智能技术的巨大潜力。 单图生成三维世界,不仅让人们能以交互方式探索静态图像,更标志着 AI 在重建与理解物理场景方面迈入全新阶段。

OpenAI启动ChatGPT Projects,让你可以组织文件、分组聊天

OpenAI最新发布的ChatGPT . Projects,解决了在ChatGPT上整理文件和对话的需求,该功能与谷歌广受欢迎的NotebookLM应用类似。 在“OpenAI 12日”直播活动的第六天,该公司推出了ChatGPT .

Bengio参与的首个《AI安全指数报告》出炉,最高分仅C、国内一家公司上榜

图片安全话题,在人工智能(AI)行业一向备受关注。 尤其是诸如 GPT-4 这样的大语言模型(LLM)出现后,有不少业内专家呼吁「立即暂停训练比 GPT-4 更强大的人工智能模型」,包括马斯克在内的数千人纷纷起身支持,联名签署了一封公开信。 这封公开信便来自生命未来研究所(Future of Life Institute),该机构由麻省理工学院教授、物理学家、人工智能科学家、《生命 3.0》作者 Max Tegmark 等人联合创立,是最早关注人工智能安全问题的机构之一,其使命为 “引导变革性技术造福生活,避免极端的大规模风险”。

细节表现超Sora,网友:真正的国产之光!MiniMax视频模型再上新

3 个月前,MiniMax 发布了首款 AI 高清视频生成模型 Abab-video-1。 只用了 5 周时间,海螺 AI 的网页版访问量便增速超 800%,还登上了 AI 产品榜当月全球增速榜、国内增速榜双榜单 TOP 1。 一时间,不少国内网友直呼其为“国产之光”。

月薪1万4的ChatGPT要来了!OpenAI自曝其达博士级别,网友:我宁可聘请一个博士

博士级别的ChatGPT可能要来了,但价格比每月工资还高? ! 这是真的。

OpenAI官方爆料,长文开怼马斯克:靠打官司实现不了AGI!

OpenAI与马斯克的法律战已经持续了数月之久。 其核心指控围绕着「OpenAI早已背离了原有的非营利使命」,也就是让自己的AI研究成果惠及所有人。 上个月,事态进一步升级,马斯克向法院提出禁令申请,试图阻止OpenAI正在进行的从非营利组织向营利性公司的转型。

王小川当场自曝:为什么百川不做Sora;生命科学是下一个互联网;大模型创业有两大误区;AGI5年后就会到来;如何从投资人拿到融资

编辑 | 言征出品 | 51CTO技术栈(微信号:blog51cto)王小川不止搞大模型,这次真的要在医疗行业搞出大动静来了! 12月14日上午,百川智能王小川在与极客公园创始人张鹏进行了一场圆桌对话。 对话中,王小川公开透露了进入下半年来,有些低调的百川究竟在做什么事情,更是抖出了很多有关百川智能成立前后的趣事,比如百川的“百”是怎么得来的,以及如何跑步入场赢得投资人信任、拿到融资的,并详细阐述了在中美博弈的环境下,自己在大模型和业务场景如何做考量的创始人逻辑,信息密度很大。

万字独家爆光,首揭o1 pro架构!惊人反转,Claude 3.5 Opus没失败?

大模型Scaling Law终结,前段时间曾被吵得沸沸扬扬。 面对诸多的质疑,硅谷巨头们用行动给出了截然不同的答案。 谷歌祭出最强下一代新模型Gemini 2.0 Flash,并带着多个智能体一同亮相;OpenAI「满血版」o1和o1 pro mode向所有人证明了模型的能力还远没有触及到天花板。

26岁OpenAI举报人疑自杀!死前揭ChatGPT训练黑幕

就在刚刚,消息曝出:OpenAI吹哨人,在家中离世。 曾在OpenAI工作四年,指控公司侵犯版权的Suchir Balaji,上月底在旧金山公寓中被发现死亡,年仅26岁。 旧金山警方表示,11月26日下午1时许,他们接到了一通要求查看Balaji安危的电话,但在到达后却发现他已经死亡。

Scaling Law不总是适用!尤其在文本分类任务中,vivo AI Lab提出数据质量提升解决方法

Scaling Law不仅在放缓,而且不一定总是适用! 尤其在文本分类任务中,扩大训练集的数据量可能会带来更严重的数据冲突和数据冗余。 要是类别界限不够清晰,数据冲突现象就更明显了。

OpenAI附议Ilya预训练终结!“但Scaling Law还没死”

在Ilya探讨完「预训练即将终结」之后,关于Scaling Law的讨论再次引发热议。 这届NeurIPS将被铭记成预训练终结的一届会议。 在最新研讨会上,OpenAI大神,o1核心成员Noam Brown表示,o1代表的是一种全新的,以推理计算为代表的Scaling。

Ilya Sutskever在NeurIPS炸裂宣判:预训练将结束,数据压榨到头了

「推理是不可预测的,所以我们必须从令人难以置信的,不可预测的 AI 系统开始。 」Ilya 终于现身了,而且一上来就有惊人之语。 本周五,OpenAI 的前首席科学家 Ilya Sutskever 在全球 AI 顶会上表示:「我们能获得的数据已经到头,不会再有更多了。

专治大模型“套壳”!上海AI实验室等给LLM做“指纹识别”,剪枝合并也无所遁形

大模型“套壳”事件防不胜防,有没有方法可以检测套壳行为呢? 来自上海AI实验室、中科院、人大和上交大的学者们,提出了一种大模型的“指纹识别”方法——REEF(Representation Encoding Fingerprints)。 在不改变模型性能的前提下,利用REEF就可以精准识别未经授权的后续开发行为。

ChatGPT终于也推出Projects功能,却故意露出一个“AGI”的项目

就在刚刚,在OpenAI“双十二”的第七天,一种全新的对话交互模式诞生——Projects。 它“长”在这儿,主页的左侧导航栏中:如其名,Projects的功能就是按照项目来组织和管理文件,正如官方介绍的那样:Projects将聊天记录、文件和自定义指令集中在一个地方。 你可以用它们进行持续性的工作,或者仅仅是让它们变得井然有序(看着干净、整洁)。

使用 Llama 3.2-Vision 多模态 LLM 和图像“聊天”

一、引言将视觉能力与大型语言模型(LLMs)结合,正在通过多模态 LLM(MLLM)彻底改变计算机视觉领域。 这些模型结合了文本和视觉输入,展示了在图像理解和推理方面的卓越能力。 虽然这些模型以前只能通过 API 访问,但最近的开放源代码选项现在允许本地执行,使其在生产环境中更具吸引力。

Claude 3.5 编程收入暴增 10 倍,抢走 Cursor 反杀 OpenAI

成立仅三年,估值 180 亿美金 Anthropic 正义迅雷不及掩耳之势,一步步蚕食 OpenAI 市场份额。在过去 3 个月,他们编程收入暴增 10 倍,还抢走了最火的 Cursor,OpenAI 的高管们彻底坐不住了!