大模型

英伟达迷你超算遭友商嘲讽:宣传FP4算力,实际“不如买个游戏电脑”

老黄在CES上发布的迷你超算Project DIGITS,开启了AI超算的PC时刻。 但随即也引发了不小争议,还遭到了大佬的贴脸嘲讽。 在AMD和英特尔都工作过的芯片设计专家Raja Koduri实名吐槽道:FLOPs除以4,价格翻倍,这就是在CES上stay grounded的秘诀。

AMD把o1炼成了实验室助手,自动科研经费节省84%

芯片强者AMD最新推出科研AI,o1-preview竟成天选打工人? 注意看,只需将科研idea和相关笔记一股脑丢给AI,研究报告甚至是代码就能立马出炉了。 这个AI系统代号“Agent Laboratory”,全程由LLM(大语言模型)驱动完成文献综述、实验,以及报告,一站式搞定科学研究。

企业软件是否已告别“太贵”时代?

在不太遥远的未来,GenAI将使企业软件领域以往无法实现或成本过高的功能成为可能。 GenAI,尤其是大型语言模型(LLM),正在改变公司开发和交付软件的方式。 从聊天机器人和简单自动化工具开始的这一进程,正在发展成为功能更为强大的AI系统——这些系统与软件架构深度融合,并影响从后端流程到用户界面的方方面面。

让Qwen2.5 7B超越o1,微软干的!MSRA推出小模型数学推理自我进化新方法

7B参数的Qwen2.5数学推理表现超过o1-preview,这是怎么做到的? ! 靠的就是MSRA最新的创新算法,rStar-Math。

个人跑大模型,英伟达「皮衣刀客」新出的Project DIGITS与M4 Mac Mini到底哪个好?

前些天,英伟达发布了一大堆东西,其中包括一款 AI 超级计算机 Project DIGITS,机器之心也在第一时间进行了报道,参阅《RTX5090 震撼发布,国行 16499 元起,黄仁勋「美国队长」pose 亮翻全场》。 在这篇文章的评论区,一位读者的问题引发了不少争议。 虽然该问题的最高赞回复表示这是「英伟达被黑得最惨的一次」,但实际上使用 Mac Mini 作为个人的大模型运行平台并不是什么罕见操作。

Anthropic新研究:用统计思维评估大模型

目前,评估大模型的方法就是比在基准测试中的数值,在于突出SOTA结果,并未充分考虑统计显著性。 例如,在对不同模型进行评估时,若仅依据表面的得分高低判断优劣,而不考虑数据的不确定性和变异性,可能会得出不准确的结论。 所以,Anthropic提出了将严谨的统计思维引入大模型评估领域。

真机数据白采了?银河通用具身VLA大模型已充分泛化,预训练基于仿真合成大数据!

近日,英伟达CEO黄仁勋在今年CES的演讲无疑让整个科技圈为之沸腾。 他先是向全世界展示了搭载Blackwell新架构的新一代卡皇RTX 5090,然后介绍了英伟达对于人形机器人发展的期盼和投入,并以令人印象深刻的画面结尾——「来自银河通用的全场唯一一台轮式具身大模型机器人Galbot G1将RTX 5090缓缓托起。 」发布会结束后,黄仁勋更是第一时间亲自来到银河通用所在的展区,与Galbot机器人进行真机互动。

我们一起聊聊如何给AI大模型喂数据?

大家好呀,我是飞鱼。 如果我想要大模型学习我的知识,怎么给他数据呢? 数据是大模型的食物,只有喂对了,模型才能更好地学习和成长。

有把握收入从1亿做到数亿!李开复最新回应25年调整:大厂才烧得起超大模型;第一年的打法已不再适用,AI应用爆发前夜公司要提前卡位

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)在零一万物深陷“收购风波”时,李开复第一时间在朋友圈进行了澄清。 与此同时,他一口气接受了多个采访,通过披露更多信息来攻破谣言。 图片关于零一万物预训练团队和Infra团队的去向已经明晰:愿意继续训练超大参数模型的成员,可以加入零一和阿里云合作成立的“产业大模型联合实验室”。

今天起,汉字也能AI视频生成了!《滕王阁序》直接拿捏到位了

“汉字”这个难关,今天终于被AI视频生成给拿下了! 话不多说,我们直接先来看效果:这个“福”字,就这样被AI水灵灵地一笔一划滴了出来。 再如下面这个例子,我们的Prompt是:有汉字“量子位”,古风。

具身智能新高度!智元机器人推出全球首个4D世界模型EnerVerse

如何让机器人在任务指引和实时观测的基础上规划未来动作,一直是具身智能领域的核心科学问题。 然而,这一目标的实现受两大关键挑战制约:模态对齐:需在语言、视觉和动作等多模态空间中建立精确的对齐机制。 数据稀缺:缺乏规模化、多模态且具备动作标签的数据集。

如何证明一个数是无理数?他们找到了欧拉和黎曼错过的证明,华人数学家唐云清参与

我们都知道,实数分为有理数和无理数,它们的定义也都很明确。 但令人惊讶的是,其实很难证明一个数究竟能否写成分数形式。 而现在,这个古老的问题有了一种广泛适用的新方法。

讯飞商业生态平台2.0来了!构建大模型应用服务新体系

AI时代的聚光灯已经由“模型参数”转移到“应用价值”,引领千行百业发掘大模型刚需场景,构建新质生产力。 据智能超参数发布的《中国大模型中标项目监测报告(2024)》显示,2024年有披露的大模型中标项目达到1520个,相比去年增长了15.5倍。 1月8日,科大讯飞AI服务市场行业伙伴生态大会在北京中关村国际会议中心成功举办。

OpenAI智能体曝本月诞生!比谷歌Anthropic慢,竟是担心prompt攻击

2025年,智能体将是AI领域最激烈的战场。 然而,一直在AI领域「独占鳌头」的OpenAI,却迟迟没有出手。 不过,外媒最近曝出了一条好消息——OpenAI可能在本月就会发布自家的「计算机操作智能体」!

【LLM&Agent】PPTAgent:PPT自动生成Agent框架

来看一个PPT生成思路:PPTAgent。 传统的PPT生成方法通常使用端到端的文本生成范式,这种方法仅关注文本内容,忽略了布局设计和PPT结构。 PPTAgent 采用了一种基于编辑的生成范式,解决处理空间关系和设计风格方面的挑战。

纯视觉方案,精准操控电脑和手机!港大Aria-UI登顶,超越Claude 3.5

在当今数字时代,智能助手已成为处理跨平台任务的不可或缺工具。 然而,如何将用户的自然语言指令精准映射(grounding)到界面元素一直是该领域的核心挑战。 传统解决方案主要依赖调用无障碍API、解析HTML源码或提取后台数据,这些方法普遍存在效率低下、信息不完整、兼容性差等显著痛点,严重制约了自动化技术的广泛应用。

AAAI 2025 | 大模型推理加速新范式:加速比高达3.51倍、成本降至1/3

近日,中国电信翼支付针对大模型推理加速的最新研究成果《Falcon: Faster and Parallel Inference of Large Language Models through Enhanced Semi-Autoregressive Drafting and Custom-Designed Decoding Tree》已被 AAAI 2025 接收。 论文中提出的 Falcon 方法是一种增强半自回归投机解码框架,旨在增强 draft model 的并行性和输出质量,以有效提升大模型的推理速度。 Falcon 可以实现约 2.91-3.51 倍的加速比,在多种数据集上获得了很好的结果,并已应用到翼支付多个实际业务中。

黄仁勋圈重点的世界模型平台是个啥?技术报告全解析,华人贡献中坚力量

AI 的下一个前沿是物理。 在昨天的 CES 发布会上,英伟达 CEO 黄仁勋通过一个名为「Cosmos」的平台点明了这一主题。 简单来说,Cosmos 是一个世界模型平台,上面有一系列开源、开放权重的视频世界模型,参数量从 4B 到 14B 不等。