大模型

端侧ChatGPT时刻！这家清华系大模型公司赶在OpenAI、苹果之前

下周苹果即将召开发布会了！但最令笔者期待的不是 iphone16，而是苹果今年提出的 Apple Intelligence 的进展，这是苹果今年进军端侧 AI 的一大杀手锏。其实早在今年年初，国内就有一家当时还名不见经传的大模型公司率先喊出 “端侧AI是未来大趋势”的口号，当时还没有太多玩家意识到端侧AI的重要性。

9/9/2024 3:54:00 PM

我在思考中

全球最大商业图库 Getty Images 推出免费高画质照片 AI 训练集：含 3750 张照片、分 15 项类别

以提供新闻、体育和娱乐照片授权闻名的全球最大的商业图库 Getty Images 上周宣布推出高画质照片样本训练数据集，供开发者开发和训练 AI 模型使用。AI在线获悉，该样本数据集包含 3,750 张照片，分为商业、教育、医疗健康、运动与健身、物品与物体、插图、图标等 15 个类别。数据集提供多种主题的高质量视觉内容，可用于训练机器学习和 AI 模型，开发多种应用场景。▲ 相关图片选集目前，这一数据集已在 Hugging Face 上线（点此访问），不过用户需同意服务条款并提供联系方式，才能免费访问该数据集。Ge

9/9/2024 2:03:16 PM

漾仔

谷歌升级 Gemini 1.5 Flash 模型，AI 聊天响应速度最高提 50%

谷歌公司于今年推出 Gemini 1.5 Flash AI 模型，官方承诺提供更快的响应速度、能应对更复杂的用户查询。在最新版本更新中，谷歌宣布采用 Gemini 1.5 Flash 的 Gemini 大幅提升响应速度，增幅最高可以达到 50%。AI在线附上谷歌官方支持文档内容如下：Gemini 给出回答的速度大幅提升更新内容：过去几周以来，我们在改善延迟方面取得了重大进步，采用 1.5 Flash 模型的 Gemini 给出回答的速度现在大幅提升，升幅最高达 50%。更新原因：通过让 Gemini 快速给出回答，

9/4/2024 11:41:51 AM

故渊

Meta 公布 Llama AI 模型家族下载量数据：全球超 3.5 亿、3.1-405B 模型最受欢迎

Meta 公司昨日发布新闻稿披露了旗下 Llama 开源 AI 模型家族在 Hugging Face 的下载量情况，仅在上个月（8 月 1 日- 8 月 31 日），相关模型的下载次数就超过了 2000 万次，截至 9 月 1 日，Llama 模型家族全球下载量已突破 3.5 亿次。参考AI在线报道，Meta 公司在今年 4 月发布了 LLM Llama 3，于今年 7 月推出了 Llama 3.1，将上下文长度扩展至 128K，新增支持 8 种语言，并首次提供了 405B 参数版本，Meta 提到，目前“Llam

9/3/2024 9:50:06 PM

漾仔

迈向「多面手」医疗大模型，上交大团队发布大规模指令微调数据、开源模型与全面基准测试

编辑 | ScienceAI近日，上海交通大学、上海 AI Lab、中国移动等机构的联合研究团队，在 arXiv 预印平台发布文章《Towards Evaluating and Building Versatile Large Language Models for Medicine》，从数据、测评、模型多个角度全面分析讨论了临床医学大语言模型应用。文中所涉及的所有数据和代码、模型均已开源。GitHub: Link: : ，大型语言模型（LLM）取得了显著的进展，并在医疗领域取得了一定成果。这些模型在医学多

9/3/2024 7:09:00 PM

ScienceAI

阶跃星辰开放平台迎来多项更新，上线 Step-1X 图像生成大模型

近日，大模型创业公司阶跃星辰在其开放平台体验中心，正式上线了图像生成大模型 Step-1X，注册即可体验。（指路链接：）事实上，这款大模型之前已经备受期待。在 7 月份举行的 2024 世界人工智能大会上，阶跃星辰一口气发布了万亿参数语言大模型 Step-2、多模态大模型 Step-1.5V 和图像生成大模型 Step-1X 三款大模型，并且跟上海电影梦幻联动，基于经典 IP《大闹天宫》开发了 H5 互动体验“测测你是哪路神仙”。

9/3/2024 2:01:00 PM

我在思考中

谷歌打磨 Gemini AI 技能：扩充支持文件类型、提高文档洞察力

谷歌于 8 月 27 日发布博文，宣布旗下 Gemini AI 支持更多类型的文件，通过分析、摘录、洞察文档内容，为用户提供更优质的 AI 服务。谷歌表示拥有 Gemini Business、Enterprise、Education 或 Education Premium 许可证的 Google Workspace 用户，现在可从 Google Drive 或本地设备上传各种文件到 Gemini（gemini.google.com）：电子表格：Gemini AI 现在可以处理 CSV、XLSX 和 ODS 等格式的

8/31/2024 11:24:33 AM

故渊

一年翻番，OpenAI 称 ChatGPT AI 聊天机器人全球周活跃用户数量破 2 亿

科技媒体 Axios 今天（8 月 30 日）发布博文，报道称 OpenAI 的 AI 聊天机器人目前周活跃用户数量已经超过 2 亿，短短 1 年时间实现翻倍。OpenAI 还表示在全球财富 500 强企业中，92% 正在使用其产品；自 7 月份发布 GPT-4o mini 以来，其自动 API 的使用量已翻了一番。首席执行官山姆・阿尔特曼（Sam Altman）在给该媒体的一份声明中表示：人们正在使用我们的工具，将其融入到日常生活中，在医疗保健和教育等领域发挥着真正的作用，可以帮助完成日常任务、解决棘手问题，还是

8/30/2024 6:22:49 AM

故渊

谷歌将重新开放 Gemini 生成人物图像功能，此前因“种族描述不当”引争议

感谢北京时间 29（今）日，据彭博社报道，谷歌宣布将恢复 AI 模型 Gemini 生成人物图像的功能，部分消费者将可以重新使用。谷歌表示，将开始向订阅 Gemini Advanced 套餐的英语用户推出生成人物图像功能。企业也将能够使用该工具，该功能将在未来几天内上线。谷歌产品管理高级总监戴夫・西特伦（Dave Citron）表示，该公司在通过 Imagen 3 生成人物描写方面取得了“重大进展”。“我们一直在努力对产品进行技术改进，并改进了评估集、红队练习和明确的产品原则。当然，Gemini 创建的每张图像都不

8/29/2024 10:26:42 AM

清源

美国加州通过人工智能训练数据透明度法案，要求企业披露 AI 模型数据来源

今日，美国加州立法机构通过了一项颇具争议的法案 —— 人工智能训练数据透明度法案，该法案将提交给州长加文・纽瑟姆，但其尚未对此法案表态。图源 Pexels该法案旨在要求人工智能公司在开发和训练模型时，对其使用的数据集进行更加透明的披露。AI在线注意到，这项由议员雅克・欧文提出的法案（AB 2013）原本适用范围更广，但在 8 月 20 日范围缩小至仅适用于生成式人工智能，即能生成文本、图像和类似内容的人工智能，例如 Open AI 的 ChatGPT 这类。该法案要求人工智能公司公开其训练模型的关键信息，如数据来源

8/28/2024 2:35:06 PM

远洋

谷歌发布 3 款 Gemini 实验 AI 模型：1.5 Pro 冲榜第二、1.5 Flash 从第 23 蹿升至第 6

谷歌 AI Studio 产品总监洛根・基尔帕特里克（Logan Kilpatrick）今天（8 月 28 日）在 X 平台发布推文，宣布推出 3 款 Gemini 实验性模型。AI在线附上谷歌本次推出的 3 款实验性 Gemini AI 模型如下：Gemini 1.5 Flash-8BGemini 1.5 Flash-8B 是 Gemini 1.5 Flash 的更小尺寸模型，拥有 80 亿参数，专为多模态任务而设计，包括大容量任务和长文本摘要任务。Gemini 1.5 Pro Exp-0827主要增强编程、复杂

8/28/2024 11:02:41 AM

故渊

分子大模型升级，Uni-Mol+加速量子化学属性预测，深势科技、北大研究登Nature子刊

编辑 | KXUni-Mol 是深势科技于 2022 年发布的一款基于分子三维结构的通用大模型，其性能优越、模型泛化能力强，在小分子性质预测、蛋白靶点预测、量子化学性质预测、MOF 材料吸附性能预测等任务上都超越了现有的解决方案。今年 3 月，深势科技与清华大学等合作，提出基于 Uni-Mol 的领域专属模型 Uni-MOF，用于预测各类工况下纳米多孔材料对各类气体的吸附性能，预测精度高达 0.98。近日，深势科技与北京大学合作，推出新一代模型 Uni-Mol ，迭代升级后的模型拥有更大的参数量，更多的预训练数据量

8/27/2024 3:13:00 PM

ScienceAI

程序员为何容易爱上 AI？MIT 学者研究：「智性恋」浓度过高

OpenAI 警告说，跟人工智能语音聊天可能会产生「情感依赖」。这种情感依赖是怎么产生的呢？MIT 的一项研究指出，这可能是「求仁得仁」的结果，无怪乎连软件工程师也会对 AI 着迷。「请不要爱上我们的人工智能聊天机器人。」这个月，OpenAI 在发布的官方报告中，特意提到，不希望用户与 ChatGPT-4o 建立情感联系。OpenAI 的这种担心并不是多余的，对一百万个 ChatGPT 交互日志的分析表明，AI 的第二大流行用途居然是性角色扮演。论文地址： AI 伴侣上瘾的不仅包括对技术不甚了解的普通用户，连软件工

8/24/2024 1:34:53 PM

清源

摩尔线程开源音频理解大模型 MooER：基于国产全功能 GPU 训练和推理

摩尔线程开源了音频理解大模型 —MooER（摩耳），是业界首个基于国产全功能 GPU 进行训练和推理的大型开源语音模型。基于摩尔线程夸娥（KUAE）智算平台，MooER 大模型用 38 小时完成了 5000 小时音频数据和伪标签的训练。MooER 不仅支持中文和英文的语音识别，还具备中译英的语音翻译能力。在 Covost2 中译英测试集中，MooER-5K 取得了 25.2 的 BLEU 分数，接近工业级效果。摩尔线程 AI 团队在该工作中开源了推理代码和 5000 小时数据训练的模型，并计划进一步开源训练代码和基

8/23/2024 6:21:35 PM

沛霖（实习）

讲座预约丨四位专家大论道：大模型时代的强化学习丨GAIR live

站在科技创新的浪潮之巅，我们见证了人工智能领域的巨大飞跃，尤其是大模型技术与强化学习中的结合和突破性应用，正在引领我们进入一个全新的智能时代。在过去几年中，强化学习作为人工智能的一个重要分支，已经从理论研究的深奥殿堂走向了实践应用的广阔天地，从实验室的封闭空间走向了我们日常生活的各个角落。在自动驾驶、游戏AI、机器人控制等领域，强化学习的身影无处不在，它们正逐步成为我们生活中不可分割的一部分。

8/23/2024 11:43:00 AM

岑大师

明确了：文本数据中加点代码，训练出的大模型更强、更通用

代码知识原来这么重要。如今说起大语言模型（LLM），写代码能力恐怕是「君子六艺」必不可少的一项。在预训练数据集中包含代码，即使对于并非专门为代码设计的大模型来说，也已是必不可少的事。虽然从业者们普遍认为代码数据在通用 LLM 的性能中起着至关重要的作用，但分析代码对非代码任务的精确影响的工作却非常有限。在最近由 Cohere 等机构提交的一项工作中，研究者系统地研究了代码数据对通用大模型性能的影响。论文链接：「预训练中使用的代码数据对代码生成以外的各种下游任务有何影响」。作者对范围广泛的自然语言推理任务、世界知识任

8/22/2024 6:20:00 PM

机器之心

发布三个月，豆包大模型综合能力提升20.3%，应用落地再提速

8月21日，火山引擎AI创新巡展在来到上海。此次巡展会，火山引擎发布了豆包大模型的一系列产品升级，并携手多点 DMALL 成立零售大模型生态联盟。火山引擎总裁谭待表示，较3个月前，最新版豆包大语言模型的综合能力提升了20.3%，在智源、上海AI Lab等权威机构的多项评测中位列榜首。

8/21/2024 11:15:00 PM

代聪飞

Meta 部署新网络爬虫机器人，为其 AI 模型收集大量数据

北京时间 8 月 21 日，近日，Meta 悄悄地发布了一款新的网络爬虫，用于搜索互联网并收集大量数据，为其人工智能模型提供支持。据三家追踪网络抓取器的公司称，Meta 新网络爬虫机器人 Meta External Agent 于上月推出，类似于 OpenAI 的 GPTBot，可以抓取网络上的人工智能训练数据，例如新闻文章中的文本或在线讨论组中的对话。根据使用档案历史记录显示，Meta 确实在 7 月底更新了一个面向开发者的公司网站，其中一个标签显示了新爬虫的存在，但 Meta 至今还没有公开宣布其新爬虫机器人。

8/21/2024 1:10:05 PM

余青

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 AI视频用哪个？6个知名的AI视频工具使用测评报告

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

大模型