文章列表
字节全新发布豆包AI视频模型:再见了Sora,你的时代过去了
刚刚,字节的火山引擎的发布会基本结束了。
我现在有点过于激动。
虽然发布会结束了,但是我觉得,一个颠覆行业的全新的起点,在这一刻,正式到来了。
字节正式发布了他们全新的两款 AI 视频模型:
豆包视频生成-PixelDance 模型和 Seaweed 模型。Seaweed 模型下次我再详细来说。这次,我想说这个豆包 PixelDance 模型,因为太屌了,屌炸了,我真的是全程惊叹着看完的。
他们正式宣布这玩意的那一刻,现场掌声雷动,我隔着屏幕都感觉快特么把房顶掀翻了。
真的,如果要给这个豆包 PixelDance
9/26/2024 1:49:52 AM
英伟达发布 Llama-3.1-Nemotron-51B AI 模型:创新神经架构搜索等技术让单 H100 GPU 运行 4 倍以上负载
英伟达 9 月 23 日发布博文,宣布推出 Llama-3.1-Nemotron-51B AI 模型,源自 Meta 公司的 Llama-3.1-70B,不过创新使用神经架构搜索(NAS)方法,建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51B 简介Llama-3.1-Nemotron-51B AI 模型基于 Meta 公司 2024 年 7 月发布的 Llama-3.1-70B 模型,共有 510 亿参数。该 AI 模型主要采用了神经架构搜索(NAS)技术微调,平衡性能和效率,在高工作负
9/25/2024 1:40:33 PM
故渊
OpenAI o1 AI 模型 PlanBench 规划能力实测:准确率 97.8%,远超 LLaMA 3.1 405B 创造的 62.6% 纪录
来自亚利桑那州立大学的科研团队利用 PlanBench 基准,测试了 OpenAI o1 模型的规划能力。研究结果表明 o1 模型取得了长足的进步,但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年,用于评估人工智能系统的规划能力,包括 600 个来自 Blocksworld 领域的任务,其中积木必须按照特定顺序堆叠。OpenAI o1 模型成绩在 Blocksworld 任务中,OpenAI 的 o1 模型准确率达到 97.8%,大大超过了之前的最佳语言模型 LLaMA
9/25/2024 12:20:21 PM
故渊
谷歌 Gemini 1.5 AI 模型再进化:成本更低、性能更强、响应更快
科技媒体 The Decoder 昨日(9 月 24 日)发布博文,报道谷歌升级旗下 Gemini 1.5 AI 模型,推出了 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002,相比较此前版本成本更低、性能更强、响应更快。成本更低谷歌下调了 token 输入和输出费用,Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%,提高了两种模型的速率限制,并减少了延迟。新定价于 2024 年 10 月 1 日生效。性能更强AI在线援引新闻稿内
9/25/2024 12:08:02 PM
故渊
大众携手谷歌,率先邀请约 12 万名车主免费使用 Gemini AI
大众汽车昨日(9 月 24 日)发布新闻稿,宣布携手谷歌公司,率先邀请约 12 万名大众 Atlas 和 Atlas Cross Sport 车型车主,免费体验和使用 Gemini AI 助手。Gemini AI 助手功能大众汽车在新闻稿中表示,通过与谷歌云(Google Cloud)的战略合作,在 myVW 移动应用中部署生成式人工智能。大众汽车车主可以通过聊天的方式和 Gemini AI 对话,掌控车辆状态或者请求其提供帮助。例如车主可以询问“如何更换备胎”,Gemini 就会自动调用 YouTube 视频,提
9/25/2024 11:16:51 AM
故渊
真能这么简单?我居然 1 分钟就搞定了一个 IP 角色的 3D 建模
大家好,我是花生~
今年 1 月份的时候,我给大家推荐过 5 款 AI 3D 模型生成工具,可以直接通过文本和图像生成 3D 模型。如今已经过去了半年多的时间 ,这些工具都有不同程度的发展,尤其 Tripo AI,一直在不断打磨自己的产品,不仅生成质量在提升,还添加了多图生成、骨骼绑定、重新拓扑等功能,给人的使用体验越来越好。
前几天 Tripo AI 又推出了新的 2.0 模型,在建模精度、贴图质量上提升了一个新的维度,逼近人工建模的水平,因此具有极大的落地应用价值。下面就为大家详细一下介绍这个新模型的亮点。
相
9/25/2024 1:36:02 AM
夏花生
第四波!2024年9月精选实用设计工具合集
大家好,这是 2024 年 9 月的第 4 波干货合集!
AI 对于设计领域的深刻影响正在逐步显现,AI 直接提取文本生成海报、AI 生成高品质视频、AI 生成可迭代升级的数字产品,这是很多创作者和设计师都需要且期待的功能,如今都有平台逐步实现并且落地应用,今天的推荐当中,就包含有这几个类别的工具,虽有瑕疵,但是瑕不掩瑜,都值得关注。此外还有一个在线 PS 的平替,以及一套素质颇为不错的免费开源图标。
当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、在线的 AI
9/25/2024 1:26:00 AM
陈子木
上交大、复旦中山团队开发糖尿病专用大语言模型,助力个性化糖尿病管理
编辑 | ScienceAI随着全球糖尿病患病率的逐年攀升,糖尿病已成为全球范围内极具挑战的公共健康问题。据统计,全球约有 10% 的人口受到糖尿病的影响。到 2045 年,全球糖尿病患者人数预计将攀升至惊人的 7.83 亿。然而,由于糖尿病医生短缺、医疗资源分布不均以及患者自我管理能力的不足,糖尿病的管理和治疗仍面临重重困难。如何高效、智能化地管理糖尿病,已成为当前医学界和科技界共同关注的重要课题。为应对这一挑战,上海交通大学清源研究院 MIFA 实验室与复旦大学附属中山医院内分泌科组成的研究团队,联手开发出一款
9/24/2024 2:35:00 PM
ScienceAI
23亿参数,Transformer架构,NASA、IBM发布「天气+气候」通用AI模型Prithvi WxC
编辑 | KX9 月 23 日,IBM 与 NASA 合作发布了一个用于天气和气候的新型通用 AI 模型 Prithvi WxC,该模型可以在台式计算机上运行,且开源。Prithvi WxC 具有 23 亿参数,使用 MERRA-2 数据集的 160 个变量开发而成。Prithvi WxC 采用创新的 Transformer 架构。研究人员在一系列具有挑战性的下游任务上测试了该模型,即:自回归滚动预测、降尺度、重力波通量参数化和极端事件估计。由于其独特的设计和训练机制,Prithvi WxC 可以解决比现有天气 A
9/24/2024 2:35:00 PM
ScienceAI
山姆·奥特曼罕见发长文,力推超级智能,百万人围观
如山姆・奥特曼所言,AI 绝非谷歌搜索或家庭作业助手的偶尔替代品,而是将改变人类的进步——当然,一定是朝着更好的方向。今天凌晨,OpenAI CEO 奥特曼罕见地发表了一篇长文博客,标题为《智能时代》(The Intelligence Age)。推特浏览量已经突破了 100 万。奥特曼对 AI 的发展给出了令人难以置信的预言,并宣传了 AI 改变世界的潜力。他表示:AI 绝对不是谷歌搜索或家庭作业助手的偶然替代品,而将推动人类社会朝着更好的方向发展。奥特曼还做出预测,超级 AI 有可能在未来几千天内完成(PS:这个
9/24/2024 10:27:00 AM
机器之心
OpenAI 阿尔特曼预测“智能时代”即将到来:能独立完成科学发现,影响就业但有助于解决气候变化等重大挑战
OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)昨日(9 月 23 日)在其个人博客上发表博文,预测“智能时代”(Intelligence Age)即将到来,人工智能将在“未来几十年”带来巨大的经济收益。展望 AI 未来阿尔特曼在博文中写道,人类正在进入一个由人工智能驱动的新时代。他预测 AI 系统将很快成为个人助理,提供定制教育,甚至帮助医疗保健,最终 AI 系统甚至可能独立完成科学发现。阿尔特曼在博文中认为“超级智能 AI”(superintelligent AI)可能需要更长的发展周期,但预估会
9/24/2024 7:27:29 AM
故渊
以前一天才能完成的运营图设计,如何用AI一个小时搞定?
前言
大家好,我是金玉珏~
今天这篇文章将向大家展示如何利用 AIGC 技术助力运营图片中的背景和容器设计。
首先,请大家来看以下几张图片,它们主要由企业 LOGO、活动文案、活动元素、元素容器、画面背景构成。在日常工作中,这类设计任务十分常见,其中背景和容器部分完全可以借助 AI 来辅助完成。接下来,我们通过具体实例来展示如何利用 AI 技术提升这类设计的效率和质量。
满满的设计思路全部奉上,评论区虚位以待,诚邀您分享独到观点~
假设需求(比例 16:9):
标题:夏日福利暑于你
副标题:借记卡支付享 5 重惊喜
9/24/2024 6:21:08 AM
金玉珏
OpenAI 发布“学院”计划:为开发者提供 100 万美元 API 信用额度及技术指导
OpenAI 今天宣布推出“OpenAI 学院”,旨在帮助开发者和组织利用 AI 解决难题,并推动社区经济增长。该平台将确保生成式 AI 的强大功能在全球范围内广泛普及,包括中低收入国家。OpenAI 表示,许多国家的科技行业发展迅速,拥有才华横溢的开发者和创新型组织,但仍然缺乏高级培训和技术资源的支持。通过投资于本地 AI 人才的发展,可以促进包括医疗、农业、教育和金融等行业的经济增长与创新。该项目将提供如下方面的支持:培训与技术指导:OpenAI 专家将为利用 AI 的开发者和使命驱动型组织提供支持。API 使
9/23/2024 11:38:16 PM
清源
一键复刻!10 组超惊艳的 Midjourney 风格代码推荐(四)
大家好我是花生 ~
今天继续分享 10 组我精选的 Midjourney 风格代码,效果都很好看,肯定有你喜欢的风格~
上期回顾:一、--sref 3322162017
特点:色彩浓郁柔和的厚涂插画风格,笔触细腻,适合生成头像、装饰画、故事插图。
① A quiet girl --ar 3:4 --sref 3322162017 --personalize kzilt9y --sw 100 --stylize 1000 --v 6.1
一个安静的女孩。
② A cute fox, waiting the sunse
9/23/2024 12:31:26 AM
夏花生
OpenAI 首款具备“推理”能力模型 o1 现已向企业 / 教育用户开放,每周最多使用 50 次
OpenAI 公司旗下首款具备“推理”能力的模型 o1 和 o1-mini 现已向企业版(Enterprise)和教育版(Edu)用户开放访问权限,用户每周最多可输入 50 条消息。据介绍,OpenAI o1 系列模型具有更高的理解能力,与传统模型不同,o1 系列模型在回答问题之前会进行深度思考,生成内在的思维链后再给出答案,因此系列模型能够处理比之前模型更复杂的任务,特别擅长解决科学、编程和数学领域的难题。OpenAI 指出,尽管目前 GPT-4o 仍是大多数任务的最佳选择,但 o1 系列在处理复杂、问题解决导向
9/22/2024 3:07:06 PM
漾仔
GPT-4o 能玩《黑神话:悟空》:精英怪胜率超人类,无强化学习纯大模型方案
AI 玩黑神话,第一个精英怪牯护院轻松拿捏啊。有方向感,视角也没有问题。躲闪劈棍很丝滑。甚至在打鸦香客和牯护院时,AI 的胜率已经超过人类。而且是完全使用大模型玩,没有使用强化学习。阿里巴巴的研究人员们提出了一个新型 VARP(视觉动作角色扮演)智能体框架。它能直接将游戏截图作为输入,通过视觉语言模型推理,最终生成 Python 代码形式的动作,以此来操作游戏。以玩《黑神话・悟空》为例,该智能体在 90% 简单和中等水平战斗场景中取胜。GPT-4o、Claude 3.5 都来迎战研究人员以《黑神话・悟空》为研究平台
9/22/2024 3:06:25 PM
汪淼
微软亚洲研究院与上海市精神卫生中心展开联合研究,借助多模态大模型为认知障碍患者带来全新训练方法
据微软亚洲研究院官方披露,该研究院与上海市精神卫生中心携手展开联合研究,基于微软 Azure OpenAI 服务中的多模态大模型,开发了利用多种模态数据(如语音、文字、图片、音乐等信息)的个性化认知训练框架,为认知障碍患者的认知训练带来了新的可能。▲ 图源微软亚洲研究院公众号AI在线从微软亚洲研究院获悉,综合上海市精神卫生中心专家的建议与患者的需求,微软亚洲研究院的研究员们从易用性、界面友好性、功能专业性和入门难易度等多个维度出发,开发了个性化认知训练框架“忆我”(ReMe)。该工具以微软 Azure OpenAI
9/22/2024 1:31:19 PM
浩渺
o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo
自从 OpenAI 的 o1 问世以来,它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练,它就能直接拿下数学奥赛金牌,甚至可以在博士级别的科学问答环节上超越人类专家。展示 o1 实力的 demo,我们看了不少,评估 o1 表现的评测,全网比比皆是,关于 o1 技术路线的讨论也如火如荼,引发了广泛的关注和深入的思考。不过 o1 背后的故事,还鲜为人知,那些在幕后默默付出的团队成员们,他们的故事同样值得被讲述和铭记。刚刚,OpenAI 发布了 o1 研发团队的完整访谈,为我们揭秘了 o1 的「成长历程」。o
9/22/2024 1:27:00 PM
机器之心