AIGC宇宙 AIGC宇宙

大模型

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前

下周苹果即将召开发布会了! 但最令笔者期待的不是 iphone16,而是苹果今年提出的 Apple Intelligence 的进展,这是苹果今年进军端侧 AI 的一大杀手锏。 其实早在今年年初,国内就有一家当时还名不见经传的大模型公司率先喊出 “端侧AI是未来大趋势”的口号,当时还没有太多玩家意识到端侧AI的重要性。
9/9/2024 3:54:00 PM
我在思考中

全球最大商业图库 Getty Images 推出免费高画质照片 AI 训练集:含 3750 张照片、分 15 项类别

以提供新闻、体育和娱乐照片授权闻名的全球最大的商业图库 Getty Images 上周宣布推出高画质照片样本训练数据集,供开发者开发和训练 AI 模型使用。AI在线获悉,该样本数据集包含 3,750 张照片,分为商业、教育、医疗健康、运动与健身、物品与物体、插图、图标等 15 个类别。数据集提供多种主题的高质量视觉内容,可用于训练机器学习和 AI 模型,开发多种应用场景。▲ 相关图片选集目前,这一数据集已在 Hugging Face 上线(点此访问),不过用户需同意服务条款并提供联系方式,才能免费访问该数据集。Ge
9/9/2024 2:03:16 PM
漾仔

谷歌升级 Gemini 1.5 Flash 模型,AI 聊天响应速度最高提 50%

谷歌公司于今年推出 Gemini 1.5 Flash AI 模型,官方承诺提供更快的响应速度、能应对更复杂的用户查询。在最新版本更新中,谷歌宣布采用 Gemini 1.5 Flash 的 Gemini 大幅提升响应速度,增幅最高可以达到 50%。AI在线附上谷歌官方支持文档内容如下:Gemini 给出回答的速度大幅提升更新内容:过去几周以来,我们在改善延迟方面取得了重大进步,采用 1.5 Flash 模型的 Gemini 给出回答的速度现在大幅提升,升幅最高达 50%。更新原因:通过让 Gemini 快速给出回答,
9/4/2024 11:41:51 AM
故渊

Meta 公布 Llama AI 模型家族下载量数据:全球超 3.5 亿、3.1-405B 模型最受欢迎

Meta 公司昨日发布新闻稿披露了旗下 Llama 开源 AI 模型家族在 Hugging Face 的下载量情况,仅在上个月(8 月 1 日- 8 月 31 日),相关模型的下载次数就超过了 2000 万次,截至 9 月 1 日,Llama 模型家族全球下载量已突破 3.5 亿次。参考AI在线报道,Meta 公司在今年 4 月发布了 LLM Llama 3,于今年 7 月推出了 Llama 3.1,将上下文长度扩展至 128K,新增支持 8 种语言,并首次提供了 405B 参数版本,Meta 提到,目前“Llam
9/3/2024 9:50:06 PM
漾仔

迈向「多面手」医疗大模型,上交大团队发布大规模指令微调数据、开源模型与全面基准测试

编辑 | ScienceAI近日,上海交通大学、上海 AI Lab、中国移动等机构的联合研究团队,在 arXiv 预印平台发布文章《Towards Evaluating and Building Versatile Large Language Models for Medicine》,从数据、测评、模型多个角度全面分析讨论了临床医学大语言模型应用。文中所涉及的所有数据和代码、模型均已开源。GitHub:   Link:  :  ,大型语言模型(LLM)取得了显著的进展,并在医疗领域取得了一定成果。这些模型在医学多
9/3/2024 7:09:00 PM
ScienceAI

阶跃星辰开放平台迎来多项更新,上线 Step-1X 图像生成大模型

近日,大模型创业公司阶跃星辰在其开放平台体验中心,正式上线了图像生成大模型 Step-1X,注册即可体验。 (指路链接:)事实上,这款大模型之前已经备受期待。 在 7 月份举行的 2024 世界人工智能大会上,阶跃星辰一口气发布了万亿参数语言大模型 Step-2、多模态大模型 Step-1.5V 和图像生成大模型 Step-1X 三款大模型,并且跟上海电影梦幻联动,基于经典 IP《大闹天宫》开发了 H5 互动体验“测测你是哪路神仙”。
9/3/2024 2:01:00 PM
我在思考中

谷歌打磨 Gemini AI 技能:扩充支持文件类型、提高文档洞察力

谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持更多类型的文件,通过分析、摘录、洞察文档内容,为用户提供更优质的 AI 服务。谷歌表示拥有 Gemini Business、Enterprise、Education 或 Education Premium 许可证的 Google Workspace 用户,现在可从 Google Drive 或本地设备上传各种文件到 Gemini(gemini.google.com):电子表格:Gemini AI 现在可以处理 CSV、XLSX 和 ODS 等格式的
8/31/2024 11:24:33 AM
故渊

一年翻番,OpenAI 称 ChatGPT AI 聊天机器人全球周活跃用户数量破 2 亿

科技媒体 Axios 今天(8 月 30 日)发布博文,报道称 OpenAI 的 AI 聊天机器人目前周活跃用户数量已经超过 2 亿,短短 1 年时间实现翻倍。OpenAI 还表示在全球财富 500 强企业中,92% 正在使用其产品;自 7 月份发布 GPT-4o mini 以来,其自动 API 的使用量已翻了一番。首席执行官山姆・阿尔特曼(Sam Altman)在给该媒体的一份声明中表示:人们正在使用我们的工具,将其融入到日常生活中,在医疗保健和教育等领域发挥着真正的作用,可以帮助完成日常任务、解决棘手问题,还是
8/30/2024 6:22:49 AM
故渊

谷歌将重新开放 Gemini 生成人物图像功能,此前因“种族描述不当”引争议

感谢北京时间 29(今)日,据彭博社报道,谷歌宣布将恢复 AI 模型 Gemini 生成人物图像的功能,部分消费者将可以重新使用。谷歌表示,将开始向订阅 Gemini Advanced 套餐的英语用户推出生成人物图像功能。企业也将能够使用该工具,该功能将在未来几天内上线。谷歌产品管理高级总监戴夫・西特伦(Dave Citron)表示,该公司在通过 Imagen 3 生成人物描写方面取得了“重大进展”。“我们一直在努力对产品进行技术改进,并改进了评估集、红队练习和明确的产品原则。当然,Gemini 创建的每张图像都不
8/29/2024 10:26:42 AM
清源

美国加州通过人工智能训练数据透明度法案,要求企业披露 AI 模型数据来源

今日,美国加州立法机构通过了一项颇具争议的法案 —— 人工智能训练数据透明度法案,该法案将提交给州长加文・纽瑟姆,但其尚未对此法案表态。图源 Pexels该法案旨在要求人工智能公司在开发和训练模型时,对其使用的数据集进行更加透明的披露。AI在线注意到,这项由议员雅克・欧文提出的法案(AB 2013)原本适用范围更广,但在 8 月 20 日范围缩小至仅适用于生成式人工智能,即能生成文本、图像和类似内容的人工智能,例如 Open AI 的 ChatGPT 这类。该法案要求人工智能公司公开其训练模型的关键信息,如数据来源
8/28/2024 2:35:06 PM
远洋

谷歌发布 3 款 Gemini 实验 AI 模型:1.5 Pro 冲榜第二、1.5 Flash 从第 23 蹿升至第 6

谷歌 AI Studio 产品总监洛根・基尔帕特里克(Logan Kilpatrick)今天(8 月 28 日)在 X 平台发布推文,宣布推出 3 款 Gemini 实验性模型。AI在线附上谷歌本次推出的 3 款实验性 Gemini AI 模型如下:Gemini 1.5 Flash-8BGemini 1.5 Flash-8B 是 Gemini 1.5 Flash 的更小尺寸模型,拥有 80 亿参数,专为多模态任务而设计,包括大容量任务和长文本摘要任务。Gemini 1.5 Pro Exp-0827主要增强编程、复杂
8/28/2024 11:02:41 AM
故渊

分子大模型升级,Uni-Mol+加速量子化学属性预测,深势科技、北大研究登Nature子刊

编辑 | KXUni-Mol 是深势科技于 2022 年发布的一款基于分子三维结构的通用大模型,其性能优越、模型泛化能力强,在小分子性质预测、蛋白靶点预测、量子化学性质预测、MOF 材料吸附性能预测等任务上都超越了现有的解决方案。今年 3 月,深势科技与清华大学等合作,提出基于 Uni-Mol 的领域专属模型 Uni-MOF,用于预测各类工况下纳米多孔材料对各类气体的吸附性能,预测精度高达 0.98。近日,深势科技与北京大学合作,推出新一代模型 Uni-Mol ,迭代升级后的模型拥有更大的参数量,更多的预训练数据量
8/27/2024 3:13:00 PM
ScienceAI

程序员为何容易爱上 AI?MIT 学者研究:「智性恋」浓度过高

OpenAI 警告说,跟人工智能语音聊天可能会产生「情感依赖」。这种情感依赖是怎么产生的呢?MIT 的一项研究指出,这可能是「求仁得仁」的结果,无怪乎连软件工程师也会对 AI 着迷。「请不要爱上我们的人工智能聊天机器人。」这个月,OpenAI 在发布的官方报告中,特意提到,不希望用户与 ChatGPT-4o 建立情感联系。OpenAI 的这种担心并不是多余的,对一百万个 ChatGPT 交互日志的分析表明,AI 的第二大流行用途居然是性角色扮演。论文地址: AI 伴侣上瘾的不仅包括对技术不甚了解的普通用户,连软件工
8/24/2024 1:34:53 PM
清源

摩尔线程开源音频理解大模型 MooER:基于国产全功能 GPU 训练和推理

摩尔线程开源了音频理解大模型 —MooER(摩耳),是业界首个基于国产全功能 GPU 进行训练和推理的大型开源语音模型。基于摩尔线程夸娥(KUAE)智算平台,MooER 大模型用 38 小时完成了 5000 小时音频数据和伪标签的训练。MooER 不仅支持中文和英文的语音识别,还具备中译英的语音翻译能力。在 Covost2 中译英测试集中,MooER-5K 取得了 25.2 的 BLEU 分数,接近工业级效果。摩尔线程 AI 团队在该工作中开源了推理代码和 5000 小时数据训练的模型,并计划进一步开源训练代码和基
8/23/2024 6:21:35 PM
沛霖(实习)

讲座预约丨四位专家大论道 :大模型时代的强化学习丨GAIR live

站在科技创新的浪潮之巅,我们见证了人工智能领域的巨大飞跃,尤其是大模型技术与强化学习中的结合和突破性应用,正在引领我们进入一个全新的智能时代。 在过去几年中,强化学习作为人工智能的一个重要分支,已经从理论研究的深奥殿堂走向了实践应用的广阔天地,从实验室的封闭空间走向了我们日常生活的各个角落。 在自动驾驶、游戏AI、机器人控制等领域,强化学习的身影无处不在,它们正逐步成为我们生活中不可分割的一部分。
8/23/2024 11:43:00 AM
岑大师

明确了:文本数据中加点代码,训练出的大模型更强、更通用

代码知识原来这么重要。如今说起大语言模型(LLM),写代码能力恐怕是「君子六艺」必不可少的一项。在预训练数据集中包含代码,即使对于并非专门为代码设计的大模型来说,也已是必不可少的事。虽然从业者们普遍认为代码数据在通用 LLM 的性能中起着至关重要的作用,但分析代码对非代码任务的精确影响的工作却非常有限。在最近由 Cohere 等机构提交的一项工作中,研究者系统地研究了代码数据对通用大模型性能的影响。论文链接:「预训练中使用的代码数据对代码生成以外的各种下游任务有何影响」。作者对范围广泛的自然语言推理任务、世界知识任
8/22/2024 6:20:00 PM
机器之心

发布三个月,豆包大模型综合能力提升20.3%,应用落地再提速

8月21日,火山引擎AI创新巡展在来到上海。 此次巡展会,火山引擎发布了豆包大模型的一系列产品升级,并携手多点 DMALL 成立零售大模型生态联盟。 火山引擎总裁谭待表示,较3个月前,最新版豆包大语言模型的综合能力提升了20.3%,在智源、上海AI Lab等权威机构的多项评测中位列榜首。
8/21/2024 11:15:00 PM
代聪飞

Meta 部署新网络爬虫机器人,为其 AI 模型收集大量数据

北京时间 8 月 21 日,近日,Meta 悄悄地发布了一款新的网络爬虫,用于搜索互联网并收集大量数据,为其人工智能模型提供支持。据三家追踪网络抓取器的公司称,Meta 新网络爬虫机器人 Meta External Agent 于上月推出,类似于 OpenAI 的 GPTBot,可以抓取网络上的人工智能训练数据,例如新闻文章中的文本或在线讨论组中的对话。根据使用档案历史记录显示,Meta 确实在 7 月底更新了一个面向开发者的公司网站,其中一个标签显示了新爬虫的存在,但 Meta 至今还没有公开宣布其新爬虫机器人。
8/21/2024 1:10:05 PM
余青