AIGC宇宙 AIGC宇宙

文章列表

中国团队首次夺魁!无问芯穹FlightVGM获FPGA'25最佳论文,峰值算力超GPU21倍

国际可重构计算领域顶级会议 ——FPGA 2025 在落幕之时传来消息,今年的最佳论文颁发给了无问芯穹和上交、清华共同提出的视频生成大模型推理 IP 工作 FlightVGM,这是 FPGA 会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作,同时也是亚太国家团队首次获此殊荣。 这项工作首次在 FPGA 上实现了视频生成模型(Video Generation Models, VGMs)的高效推理,也是该团队继去年在 FPGA 上加速大语言模型 FlightLLM(FPGA’24)后的最新系列工作。 与 NVIDIA 3090 GPU 相比,FlightVGM 在 AMD V80 FPGA 上实现了 1.30 倍的性能提升与 4.49 倍的能效提升(峰值算力差距超过 21 倍)。
3/3/2025 12:16:48 PM
机器之心

微软削减数据中心计划并提高价格,用户需承担 AI 成本

随着大规模生成性人工智能技术的快速发展,微软近期在其产品和服务中采取了一系列引人注目的措施,以弥补巨额的运营成本。 公司不仅提高了旗下微软365软件的订阅价格,涨幅最高可达45%,还推出了带广告的产品版本,并取消了一些数据中心的租赁计划。 图源备注:图片由AI生成,图片授权服务商Midjourney微软首席执行官萨蒂亚・纳德拉最近表示,尽管公司在 AI 技术上投入了巨资,但目前为止,这些技术所带来的价值并不显著。
3/3/2025 11:42:00 AM
AI在线

消息称软银计划融资 160 亿美元加码人工智能投资

据《路透社》报道,有消息人士透露,软银集团首席执行官孙正义(Masayoshi Son)计划借款160亿美元用于人工智能(AI)投资。 此消息源于《信息》技术新闻网站,报道中提到公司高管在上周与银行的会谈中确认了这一意向。 孙正义的这一决策标志着软银在 AI 领域的持续扩展,尤其是在全球科技竞争日益激烈的背景下。
3/3/2025 11:34:00 AM
AI在线

字节跳动AI编程产品Trae国内版发布 配置豆包1.5pro、满血版DeepSeek模型

2025年3月3日,中国首款AI原生集成开发环境(AI IDE)Trae国内版正式上线。 该产品由字节跳动技术团队推出,旨在为开发者提供更高效、智能化的编程体验。 Trae国内版配置了Doubao-1.5-pro,并支持切换满血版DeepSeek R1、V3模型,能够显著提升编程速度,助力开发者应对复杂技术挑战。
3/3/2025 11:19:00 AM
AI在线

GPT-4.5成本激增,性能提升却有限,OpenAI面临性价比困境

近日,科技媒体 The Decoder 发布了一篇有关 OpenAI 最新模型 GPT-4.5的报道,内容引发了业界对该模型的性价比质疑。 根据官方数据显示,尽管 GPT-4.5在性能上有所提升,但相较于前一版本 GPT-4o,其成本却大幅增加。 具体而言,GPT-4.5在多个方面的表现优于 GPT-4o 的比例分别为:专业查询63.2%、日常查询57% 以及创意任务56.8%。
3/3/2025 11:05:00 AM
AI在线

超越DeepSeek-R1!阿里万相大模型登上全球开源榜首

今日,阿里巴巴股价在盘初阶段出现拉升,一度上涨超过4%,报价达到133.1港元。 这一市场表现与近期阿里巴巴在人工智能领域取得的显著进展密切相关。 据开源社区Hugging Face最新发布的榜单显示,阿里巴巴推出的万相大模型在开源仅6天后,便成功超越了DeepSeek-R1,一举登上了模型热榜和模型空间榜两大重要榜单的榜首。
3/3/2025 10:32:00 AM
AI在线

大型视觉模型何时会有ChatGPT时刻?

2022年11月推出的ChatGPT是自然语言处理(NLP)的一个分水岭,因为它展示了转换器(Transformer)架构在理解和生成文本数据方面的惊人有效性,也被称为人工智能的ChatGPT时刻。 现在,随着预训练大型视觉模型(LVM)的兴起,我们在计算机视觉领域看到了类似的情况。 但是,这些模型何时才能将视觉数据广泛应用呢?
3/3/2025 10:13:09 AM
AI情报室

智谱华章完成超10亿元融资 计划开源新一代大模型

近日,北京智谱华章科技有限公司宣布其最新一轮战略融资金额超过10亿元人民币。 这轮融资的参与方包括杭州城投产业基金和上城资本等,显示了市场对智谱的强大信心与支持。 作为国内最早开源大模型的 AI 公司之一,智谱的目标是在2025年成为其开源发展的关键年份。
3/3/2025 10:04:00 AM
AI在线

小白也能轻松理解的大模型入门锦囊!

一、何为大模型? 大模型,英文名叫Large Model,也被称为基础模型(Foundation Model)。 我们通常说的大模型,主要指的是其中最常用的一类——大语言模型(Large Language Model,简称LLM)。
3/3/2025 10:00:00 AM
小喵学AI

DeepSeek开源周第六天:极致推理优化系统,提高GPU计算效率

在人工智能(AI)技术快速发展的今天,DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。 这一系统旨在通过更高的吞吐量和更低的延迟,推动 AGI(通用人工智能)的高效发展。 为了实现这一目标,DeepSeek 采用了跨节点专家并行(Expert Parallelism,EP)技术,显著提高了 GPU 的计算效率,并在降低延迟的同时,扩展了批处理规模。
3/3/2025 9:45:00 AM
AI在线

智谱AI宣布完成新一笔金额超10亿元战略融资

近日,国内领先的人工智能企业智谱宣布完成了一笔金额超过10亿元人民币的战略融资。 此次融资由杭州城投产业基金、上城资本等多家投资机构共同参与,为智谱的进一步发展和技术创新注入了强劲动力。 据悉,这笔融资将主要用于推动国产基座GLM大模型的技术创新和生态发展。
3/3/2025 9:09:00 AM
AI在线

官方详解 DeepSeek-V3 / R1 推理系统:理论利润率达 545%

3 月 1 日消息,DeepSeek 官方今日在知乎发布《DeepSeek-V3 / R1 . 推理系统概览》一文,详细介绍如何使用大规模跨节点专家并行(Expert Parallelism / EP)来增大 batch . size,如何隐藏传输的耗时,如何进行负载均衡。
3/3/2025 9:00:00 AM
清源

DeepSeek突袭公布成本利润率:545%

五连开源后,DeepSeek还有One More Thing! 就在刚刚,DeepSeek官方亲自揭秘了DeepSeek-V3/R1推理系统。 重点包括,优化吞吐量和延迟的方法:跨节点EP驱动的批量扩展计算与通信重叠负载均衡还公布了DeepSeek的在线服务数据统计:每个H800节点每秒有73.7k/14.8k个输入/输出token成本利润率545%更多细节,一起来看官方原文↓更大的吞吐,更低的延迟DeepSeek-V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。
3/3/2025 8:21:00 AM
量子位

DeepSeek全面开源V3/R1推理系统!成本利润率高达545%

就在刚刚,当大家以为开源周已经结束的时候,真「Open AI」DeepSeek带来了压轴大戏——DeepSeek-V3/R1推理系统,全面揭秘! 吞吐量和延迟优化:跨节点高效并行(EP)驱动的批处理扩展计算与通信并行处理智能负载均衡在线服务性能数据:每个H800节点每秒处理73,700/14,800输入/输出token成本利润率高达545�epSeek表示,希望本周分享的技术见解能为开源社区带来价值,共同推进通用人工智能的发展目标。 看到这里,网友都惊了!
3/3/2025 8:17:00 AM
新智元

分享五个在微信中使用 DeepSeek 的方法,建议收藏!

前言今天大姚将为大家分享5种在微信中使用DeepSeek的方法,帮助大家更好地利用这一工具,提升工作和学习效率。 无论是处理文档、管理知识,还是进行深度搜索和思考,这些方法都将为你带来全新的体验。 让我们一起探索DeepSeek在微信中的无限可能吧!
3/3/2025 8:06:39 AM
大姚

5分钟顶人类8小时!OpenAI Deep Research订阅全推送,端到端强化微调是关键

Deep Research(深度研究)是继「Operator」之后,OpenAI推出的第二个智能体,利用模型的推理能力,综合分析浩瀚的互联网信息,从而完成复杂的研究任务。 月初,OpenAI首先向ChatGPT Pro用户开放了Deep Research功能。 最近,进一步开放给了更多等级的订阅用户。
3/3/2025 8:02:00 AM
新智元

GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河

自从OpenAI发布GPT-4.5之后,Ilya这张图又开始火了。 GPT-4.5令人失望的表现,再次印证了Ilya这句话的含金量:预训练已经达到极限,推理Scaling才是未来有希望的范式。 GPT-4.5在基准测试上并没有提升,推理没有增强,只是变成了一个更易于合作、更有创造性、幻觉更少的模型。
3/3/2025 8:00:00 AM
新智元

DeepSeek+Xmind一键生成思维导图

大家好,我是岳哥。 我们工作和生活中,有时候遇到一本好书或者是别人写的一些比较有深度的文章,认真看完要花不少时间。 但是如果我们让DeepSeek帮我们看完,提取书籍或文章中的重点内容并生成思维导图,那就效率多了。
3/3/2025 3:35:00 AM
丶平凡世界