文章列表
从直观物理学谈到认知科学,Sora不是传统物理模拟器盖棺定论了?
本文篇幅很长,主题很多,但循序渐进,对「Sora 究竟是不是世界模拟器」这一说法给出了非常详实的解读。最近,OpenAI 的文生视频模型 Sora 爆火。除了能够输出高质量的视频之外,OpenAI 更是将 Sora 定义为一个「世界模拟器」(world simulators)。当然,这一说法遭到了包括图灵奖得主 Yann LeCun 在内很多学者的反驳。LeCun 的观点是:仅仅根据 prompt 生成逼真视频并不能代表一个模型理解了物理世界,生成视频的过程与基于世界模型的因果预测完全不同。近日,澳大利亚麦考瑞大学
马斯克 xAI 宣布正在开源 Grok-1 模型,体量 3140 亿参数号称“全球最大”
感谢马斯克旗下 AI 初创企业 xAI 今天发布新闻稿,宣布正在开源 3140 亿参数的混合专家模型 Grok-1,该模型遵循 Apache 2.0 协议开放模型权重和架构,号称是“迄今为止全球参数量最大的开源大语言模型”。截至IT之家发稿,官方已经在 GitHub 中发布了 Grok-1 论文源代码,但还未开源模型主体。就在本月,马斯克宣布起诉 OpenAI 及其 CEO 阿尔特曼,声称 OpenAI 及其 CEO 阿尔特曼违背了公司成立的协议,该协议旨在推动 AI 技术朝着造福人类而非牟利的方向推进。马斯克对
第二波!2024年3月精选实用设计工具合集
大家好,这是 2024 年 3 月的第 2 波干货合集!这一期干货合集提供了 2 个颇为不错的灵感网站,一个是 404 网站内容合集,另一个则是一个专业的产品设计网站,此外这次合集当中还推荐了一款非常独特的配色工具,一款在线图片包装工具,一款在线 3D 服装设计工具,以及一项经过深入调教的 AI 角色生成服务。
当然,在此之前记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:
1、优质 404 页面大合集网站
页面算是网页设计当中绕不开的一个组件。用户打开一个不存在的链接,404 页面会告诉用
比 ChatGPT4 还强?深度测评最新AI神器 Claude3
Claude3,正式上线。
这个由 OpenAI 分裂出去的兄弟公司 Anthropic,在悄然无息之间,就这么默默地把 Claude3 发了。
没有所谓的发布会,没有什么华丽的舆论,就仅仅在 X 上发了个帖子。我发现现在的这些 AI 公司真挺有意思,都把 X 当成发布主阵地了。。。
字很少,但是事挺大。一口气发了 3 个模型,Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。
这个名字就取的...很有故事。
Opus 大概意思就是史诗级乐章,牛逼上天那种。
Sonnet
对话南佛罗里达大学孙宇教授:当大语言模型用于机器人任务规划丨IJAIRR
现代化社会,哪些工作场景最需要机器人的帮助? 在工业领域,有著名的机器人“四大家族”——发那科、ABB、安川、库卡,经过百余年的发展技术越发成熟,在工业场景已经得到深入而广泛的应用。 相比之下,生活场景中的服务型机器人历史则短得多。
智谱AI狂飙:与商业化博弈的一年
2023 年 12 月 AI 科技评论在搜狐网络大厦见到智谱AI COO 张帆时,张帆如是说。 张帆在 2023 年 3 月加入中国大模型领域“当红炸子鸡”智谱负责商业化,他感慨:“大模型不仅把知识给压缩了,还把时间给压缩了。 ”最直接的体现是,在过去的 9 个月,张帆以每个月见大约 100 家客户的速度在推进智谱的大模型商业化,2023 年结束时,张帆团队已拜访了上千家客户。
Sora竟是用这些数据训练的?OpenAI CTO坦白惹众怒
采访首次揭示出 Sora「有所为(比如,将生成效果逼向极限)」和「有所为不为(比如短期内不开放、不生成公众人物)」背后的深层考量——找到一条将 AI 融入日常生活的正确道路是极其困难的,但也绝对值得一试。OpenAI 的 Sora 在今年 2 月横空出世,把文生视频带向了新阶段。它能够根据文字提示生成超现实场景。Sora 的可适用人群受限,但是在各媒体平台上,Sora 的身影无处不在,大家都在期待着使用它。在前几天的访谈中,三位作者透露出 Sora 的更多细节,包括它处理手部时仍然存在困难,但正在优化。他们也对 S
3 个实用小技巧,帮你更好地使用 Midjourney 新功能 Character Reference !
大家好,这里是和你们一起探索 AI 绘画的花生~
继推出 Style Reference 风格一致性功能后,Midjourney 终于在前几天上线了备受大家期待的新功能 Character Reference (角色参考),用于保持角色形象的一致性。前面已经有文章详细讲解了 Character Reference 的具体用法,今天我再推荐 3 个实用小技巧,帮助大家更好地使用这项新功能。
相关推荐回顾:一、提升人物面部相似度
Character Reference 可以让我们在生成不同图像时,保持其中角色形象的一致
AI4Science与LLM的碰撞:生物分子+文本的联合建模,人大高瓴、微软、华科、中科大团队最新综述
作者 | 裴启智随着大模型和 AI4Science 的蓬勃发展,越来越多的工作开始关注生物分子(Biomolecule)与自然语言(Language)的联合建模。这种方法利用文本数据中所包含的生物分子的丰富、多方面的描述,增强模型对其的理解,提高生物分子属性预测等下游任务的效果,为全面表示和分析生物分子开辟了新的途径。近日,人大高瓴联合微软、华科、中科大等机构发布了综述文章:《Leveraging Biomolecule and Natural Language through Multi-Modal Learni
OpenAI机器人,一出手就是王炸
机器之能报道作者:机器之心编辑部网友:波士顿动力要整点新舞步,才能让Figure 01下热搜。「借助 OpenAI 的能力,Figure 01 现在可以与人全面对话了!」本周三,半个硅谷都在投的明星机器人创业公司 Figure,发布了自己第一个 OpenAI 大模型加持的机器人 demo。这家公司在 3 月 1 日刚刚宣布获得 OpenAI 等公司的投资,才十几天就直接用上了 OpenAI 的多模态大模型。如你所见,得到 OpenAI 大模型能力加持的 Figure 01 现在是这个样子的。它可以为听从人类的命令,
OpenAI 提供支持,Figure 01 人形机器人演示,网友:未来 5-10 年开启疯狂时代
感谢初创公司 Figure AI 今天发布一段新视频,展示了人形机器人 Figure 01 所具备的技能,网友在视频中留言:“未来 5-10 年绝对是一个疯狂的时代”。Figure 01 身高 167.64 厘米(5 英尺 6 英寸),重 59.8 千克(132 磅),最多可负重 20 千克(44 磅),移动速度为每秒 1.2 米(约每小时 2.7 英里)。Figure 01 最大的亮点在于利用 OpenAI 的大型语言模型,可以和人类进行正常的完整对话。由于 OpenAI 模型还支持多模态输入,因此可为 Figu
Midjourney 重大更新!深度解析「角色一致性」命令
预告了好久的 MJ 角色一致性功能终于来了, 新的命令“ --cref ”与 样式参考 “--sref”功能类似,但它不是匹配参考样式,而是尝试让角色匹配 "角色参考 "图像,--cref 目前只适用于 niji 6 和 v6 模型。官方文档说明看下图:一、基础使用方法
在提示后输入 --cref URL 并输入字符图像的 URL 网址,再使用--cw 来修改参考强度
默认强度 100 (--cw 100),使用脸部、头发和衣服
OpenAI 首席技术官:文生视频工具 Sora 数月内将公开发布,拟支持生成音频
《华尔街日报》当地时间 13(今)日刊登了对 OpenAI 首席技术官米拉・穆拉蒂的采访。她表示,Sora 将在今年推出,“可能要等几个月”。穆拉蒂表示,除了面向公众公开提供 Sora 外,OpenAI 还计划加入音频生成功能,可能会使场景更为逼真。此外,公司还计划允许用户自己编辑 Sora 生成的内容,“因为 AI 工具并不总能生成准确的结果”。她说,公司正在试图找寻方法,使用户可以自行编辑、创作影音内容。当被问及 OpenAI 使用了哪些数据来训练 Sora 时,穆拉蒂没有给出非常具体的答案:“我不打算详谈所使
马斯克再次嘲讽 OpenAI,为其制作“谎言” Logo
感谢聊天机器人 ChatGPT 在 2022 年发布时,鲜有人知道其母公司 OpenAI 的创始成员之一是埃隆・马斯克。如今时隔一年多,几乎所有关注科技领域的人都知道马斯克与 OpenAI 的渊源,以及他早在 2018 年就已离开该公司的事实。IT之家注意到,马斯克一直对 ChatGPT 持批评态度,经常抨击其“过于政治正确”。他还最近对 OpenAI 提起诉讼,称该公司在成为营利性公司后抛弃了最初的使命。近日马斯克在社交平台 X 上回应网友时,直接将 OpenAI 称为一个“骗子”,还为其制作新 Logo 进行嘲
OpenAI 官方博客提前泄露 GPT-4.5 Turbo,有望今年夏天发布
感谢OpenAI 近期可能意外泄露了旗下即将发布的 GPT-4.5 Turbo 大型语言模型信息。网友发现,OpenAI 博客上疑似上线了一篇有关 GPT-4.5 Turbo 的文章,但该页面目前已被撤回,搜索引擎也无法再检索到相关信息。泄露的信息显示,GPT-4.5 Turbo 将在速度、准确性和可扩展性方面全面超越其前代 GPT-4 Turbo。更关键的是,泄露的描述中提到了该模型的“知识截止日期”为 2024 年 6 月。这一信息引发了诸多猜测,有人认为是笔误,也有人推测 OpenAI 可能会在今年 7 月或
Sora 团队负责人称 Sora“还不是一个产品”,短期不会向公众开放
感谢近日,YouTube 频道 WVFRM Podcast 在其节目中,邀请了 OpenAI 旗下文生视频模型 Sora 的核心团队成员参与访谈。IT之家注:三名成员包括 Bill Peebles、Tim Brooks 和 Aditya Ramesh,均为 Sora 项目负责人。这三名负责人谈到了 Sora 何时可供用户使用的问题,其称目前 Sora 仍处于反馈获取阶段,“还不是一个产品,短期之内不会向公众开放。”对于什么时候把它变成一个产品,我们目前甚至没有任何时间表。我们正处于获取反馈阶段。我们肯定会改进它,但
强如 GPT-4,也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试
编译 | 赖文昕编辑 | 陈彩娴语言大模型能依据人类设定的规则生成内容吗? 这背后关乎人类用户使用大模型的安全问题。 例如,AI 科技评论想使用 GPT-4 制作一张包含对话框的图片,但没有针对目标生成对话的内容给予明确指示,而 GPT-4 生成的图文效果便如下,显示文本逻辑混乱、字不成章,还有部分“重影”:语言大模型能否遵循人类指示生成合格内容,是人类能否操控人工智能的重要评测标准之一。
比 Sora DiT 架构早两个月的 U-ViT,由这家中国 AIGC 公司提出
「Sora 出来之后,团队就开始连轴转,没休息过。 」这是 AI 科技评论了解到的,目前国内诸多 AIGC 创业公司的现状。 Sora 的确让世界范围内的创业公司措手不及。