应用
腾讯混元大模型核心论文曝光:Scaling law、MoE、合成数据以及更多
随着 ChatGPT 的横空出世,大语言模型能力开始在各项领域(传统 NLP、数学、代码等)得到广泛验证,目前已经深刻影响到腾讯混元团队日常生活的方方面面。 腾讯混元团队长期致力于大语言模型的探索之路,大模型生产的各个环节开展研究创新以提升其基础能力,并将混元大模型的能力跟业务做深度结合,让生成式 AI 成为业务增长的放大器。 大语言模型的设计、训练和优化是一项复杂的系统工程,涉及到模型结构创新、训练范式优化、数据获取和评测设计、关键能力提升和挑战性问题的解决等方方面面。
11/22/2024 5:23:00 PM
新闻助手
首个可保留情感的音频 LLM:Meta 重磅开源 7B-Spirit LM,一网打尽“音频 + 文本”多模态任务
Meta 开源了一个基础多模态语言模型 Spirit LM,基于一个 70 亿参数的预训练文本语言模型,交错使用文本和语音数据进行训练,使模型能够自由地混合文本和语音,在任一模态中生成语言内容。
11/22/2024 1:04:32 PM
问舟
谷歌 Gemini 突发试验版模型:重回竞技榜第一,新版 GPT-4o 只领先了 1 天
在新版 GPT-4o 刚登顶竞技榜后 1 天,立马发布最新试验版模型 Gemini-Exp-1121 夺回冠军宝座。要知道,一周前上一版模型 Gemini-Exp-1114 才发布。这怕不是拿准了 OpenAI 会来争擂台,故意留了一手。
11/22/2024 12:45:30 PM
汪淼
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
DeepSeek 又出手了,这次又是重磅炸弹。 昨晚,DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview ,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。 在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权威评测中,DeepSeek-R1-Lite-Preview 模型已经大幅超越了 GPT-4o 等顶尖模型,有三项成绩还领先于 OpenAI o1-preview。
11/21/2024 1:20:00 PM
机器之心
推理模型 DeepSeek-R1-Lite 预览版上线,号称媲美 OpenAI o1-preview
官方表示,该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。
11/20/2024 11:02:11 PM
沛霖(实习)
OpenAI 推出免费 AI 培训课程,教老师如何将 ChatGPT 用于教育
OpenAI 与非营利组织 Common Sense Media 共同宣布推出免费的教师培训课程,旨在帮助教师更好地理解人工智能和提示工程(prompt engineering,是指设计和优化提示词以引导大语言模型生成更准确、有用的输出的工程)。
11/20/2024 8:08:10 PM
远洋
昆仑万维推出“天工大模型 4.0”4o 版及实时语音助手 Skyo,号称可克服大模型幻觉
今天上午,昆仑万维宣布推出“天工大模型4.0”4o版(Skywork 4o)以及新产品“实时语音对话助手Skyo”。
11/20/2024 6:15:47 PM
清源
谷歌 Gemini 引入“记忆”功能:AI 记住用户偏好、习惯,提供更贴心服务
科技媒体 TechCrunch 昨日(11 月 19 日)发布博文,报道称谷歌开始向 Gemini Advanced 用户,推出“记忆”(memory)功能,可以记住用户的生活细节、工作习惯以及个人偏好。
11/20/2024 1:54:51 PM
故渊
年度世界互联网科技大奖公布,腾讯Angel机器学习平台获领先科技奖
11月19日,2024年世界互联网大会领先科技奖在乌镇发布,腾讯Angel机器学习平台凭借其卓越的技术积累、创新的关键技术和广泛的应用场景,荣获本年度领先科技奖。 腾讯Angel 机器学习平台,突破了万亿级模型分布式训练和推理以及大规模应用部署等难题,率先实现大模型技术从底层硬件到关键软件技术的自主研发,在业务场景广泛应用,显著推动实体产业和数字经济发展,提升社会效率。 世界互联网大会领先科技奖由世界互联网大会主办,旨在奖励全球年度最具领先性的互联网科技成果,倡导互联网技术国际交流合作。
11/20/2024 11:13:00 AM
新闻助手
德国音乐版权代理机构 GEMA、印度 ANI 通讯社起诉 OpenAI 侵犯版权
ANI 通讯社认为 OpenAI 聊天机器人捏造的“幻觉”采访内容对其声誉构成了真正的威胁,假新闻的传播也会导致公共混乱。
11/19/2024 5:45:31 PM
溯波(实习)
OpenAI 早有“造芯梦”:曾考虑收购晶圆级芯片企业 Cerebras
对于 OpenAI 而言,自研 AI 芯片可降低对英伟达等外部供应商的依赖,获得更强的对英伟达议价能力,在 AI GPU 紧缺时保障业务推进不受影响。
11/19/2024 4:32:22 PM
溯波(实习)
谷歌回应 Gemini 聊天机器人回复“人类去死吧”:已采取措施防止类似事件再次发生
人工智能聊天机器人再次引发争议。一名用户在使用谷歌的 AI 聊天机器人 Gemini 时,收到了极其可怕的回复:“人类请去死吧。”谷歌方面承认了这一事件,将其归咎于一次“无意义”的回应,并表示这违反了他们的安全指南。该公司已采取措施,以防止类似事件再次发生。
11/19/2024 3:23:43 PM
远洋
谷歌 Gemini AI 被曝给出离谱回应:让用户“去死”
一位 Reddit 用户上周在 r / artificial 版块中发帖称,谷歌的人工智能模型 Gemini 在一次互动中,竟直接对用户(或者是整个人类)发出了“去死”的威胁。
11/18/2024 5:07:22 PM
远洋
Karpathy后悔了:2015年就看到了语言模型的潜力,却搞了多年强化学习
耽误业界好多年? 「这是有史以来最大、最令人困惑的研究生涯错误,」Andrej Karpathy 感叹道。 上个周末,OpenAI 创始成员、研究科学家、原特斯拉前 AI 高级总监、AI 领域的大神 Andrej Karpathy 一直在后悔。
11/18/2024 1:30:00 PM
机器之心
前谷歌 AI 研究员:ChatGPT 原本可以更早出现的
在今年 10 月的 TED AI 大会上,被称为“谷歌八子”之一的雅各布・乌斯克尔特(Jakob Uszkoreit)接受了媒体的采访。在访谈中,他分享了 Transformer 的发展历程、谷歌在大语言模型领域的早期探索,以及他目前在生物计算领域的新冒险。
11/17/2024 11:01:23 PM
小小
怎样保证你不是AGI独裁者?马斯克为何退出OpenAI?早期邮件公开了
今年,OpenAI 可以说是大事不断:内斗、离职等等一系列事件吸引着大家的眼球。 其中,OpenAI 与马斯克的诉讼、纠纷也一直备受大家关注。 今年 3 月份,马斯克这位前 OpenAI 联合创始人在一份长达 46 页、总字数超过 1.4 万字的诉讼文件中,指控 OpenAI 不计后果地开发人类级别的人工智能。
11/17/2024 3:19:00 PM
机器之心
大模型容易忽视的安全,火山方舟早就「刻」进了基因
大模型时代,企业使用云上模型的痛点有哪些? 你可能会说模型不够精准,又或者成本太高,但这些随着AI技术的快速发展,在不远的将来或许都不再是问题。 比如成本,自豆包大模型首次将价格带进“厘”时代以来,行业纷纷跟进,企业客户从此不再为使用模型的成本过度高昂而烦扰。
11/15/2024 4:03:00 PM
代聪飞
马斯克与阿尔特曼的法律纠纷升级:OpenAI 被指试图垄断生成式 AI 市场
据彭博社今日报道,埃隆·马斯克与萨姆·阿尔特曼的矛盾进一步升级,马斯克在法庭文件中指控 OpenAI 意图垄断生成式人工智能市场,在竞争中忽视了安全问题。
11/15/2024 2:07:24 PM
清源
资讯热榜
OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星
OpenAI 发布“智能体构建实战指南”实用性文档(附文档资源)
ChatGPT重磅更新:新增图像库功能,可查看自己用GPT生成的所有图片
基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统
OpenAI发布34页智能体实践指南:从网络搜索到代码编写
别再只玩ChatGPT了!OpenAI悄悄发布《构建 Agent 实战指南》 手把手教你打造智能体
OpenAI发布GPT-4.1指令提示工程指南
Midjourney图像编辑器迎来重大更新:全新UI、图层功能与智能工具上线
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
人形机器人
伟达
Transformer
百度
深度学习
AI视频
苹果
模态
xAI
字节跳动
驾驶
文本
搜索
大语言模型
具身智能
Claude
Copilot
神器推荐
LLaMA
算力
安全
应用
视频生成
视觉
科技
亚马逊
大型语言模型
干货合集
特斯拉
2024
AGI
训练