文章列表
Gemini 修 bug 神了!录网页视频把代码库甩给它就行,网友想要访问权限
谷歌 Gemini 修改 bug 让网友大开眼界!X 一小伙分享,为测试 Gemini 1.5 Pro,自己在编写一个网页的代码时故意留了 3 个 bug,并分别录制了网页 bug 视频。接着把代码库打包成文件连同视频一起输给了 Gemini 1.5 Pro,提示它找到并修复代码中的所有 bug,且要提供一个简要指南以及所做更改的说明。没想到,Gemini 1.5 Pro 还真就分分钟正确识别并修复了每一个 bug。小伙将这种玩法 po 出来后热度不断攀升,网友们纷纷一键三连,转赞收藏量过万。其本人还在评论区强调,
百度李彦宏:对于 ChatGPT 和文心一言“有着天壤之别”的言论并不生气
央视财经频道昨晚播出《对话・开年说》节目,访谈嘉宾为百度创始人、董事长李彦宏。李彦宏谈到了当前对于文心一言的负面评价,他表示,对“ChatGPT 和文心一言有着天壤之别”的言论并不生气,希望在一年内能够改变这些人的想法。李彦宏表示,对于文心一言是非常有信心的,任何一个能够拿到专业版使用权的人可以和 GPT-4 比较一下。对于人工智能的发展速度,李彦宏称“比我想象中的更慢”:这一概念已被提出快 70 年了,可能每过十年左右,就有一群人说,我们终于要实现通用人工智能了。但其实情况比想象中要复杂。李彦宏称文心一言 4.0
微软开始为 Copilot Pro 用户推出创建自定义 GPT 功能
微软 Bing 副总裁 Michael Schechter 表示,微软已经开始面向 Copilot Pro 用户推出 Copilot GPT Builder 功能,允许用户打造属于自己的自定义 AI 机器人。如图所示,微软 Copilot GPT Builder 目前正在分阶段推出,拥有体验资格的 Copilot Pro 用户可以看到一个新的预览功能,点击即可通过自定义配置创建一个个性化 Copilot GPT。微软今年 1 月为 Copilot 推出了一项可选订阅服务 Copilot Pro,每月收费 20 美元
OpenAI 首席技术官 Mira Murati 才是赶阿尔特曼下台的关键人物?
万万没想到,OpenAI 内讧事件跨了个年还未平!又双叒有劲爆大瓜被曝了出来。全新内讧细节:CTO Mira Murati 在阿尔特曼被赶下台中发挥了关键作用。没错,就是在阿尔特曼离开后短暂担任了几天临时 CEO 的那位,此前就是 OpenAI 的 CTO。嗯?事情又反转了?要知道,此人之前看起来是坚持站在支持阿尔特曼回归那一队的,并且也参与了阿尔特曼引发的“比心跟帖运动”:阿尔特曼回归后写的致全员信中更是多次提到她,毫不吝啬对 Mira 的夸赞:在整个过程中,Mira 做得非常出色,无私地服务于使命、团队和公司。
OpenAI 将参与外部供应商设计流程,以获符合需求 AI 硬件
据英媒 Data Centre Dynamics 报道,OpenAI 正招募软硬件协同设计工程师,帮助外部供应商设计符合 OpenAI 自身需求的 AI 硬件。OpenAI 官网页面显示,该职位位于美国加州旧金山,将与其硬件工程师团队一同工作。对内,该职位需要同 OpenAI 内部的机器学习工程师、内核工程师、编译器开发人员合作,了解他们对高性能加速器在机器学习技术、算法、数值近似、编程表达性和编译器优化等方面的愿景和需求。对外,该职位需要同多个外部供应商一起实现 AI 硬件的性能和可编程性目标,并协同第三方开发最
谷歌确认 Gemini Nano 本地大模型不会上线 Pixel 8 手机
谷歌官方表示,由于硬件限制,AI 语言大模型 Gemini Nano 不会上线谷歌 Pixel 8 手机,但未来会出现在其他高端设备上。IT之家获悉,Gemini 的前身是谷歌在 2023 年 2 月发布的聊天机器人 Bard,后者在 2024 年 2 月 8 日更名为 Gemini。谷歌计划将 Gemini 整合进旗下所有产品,并加入 Google One 订阅中。Gemini Nano 作为谷歌为移动设备推出的 Gemini 大模型版本,能够处理不需要连接外部服务器的本地任务,仅支持谷歌 Pixel 8 Pro
占比 44%,报告称 OpenAI 的 GPT-4 充斥大量版权内容
根据 Patronus AI 近日发表的最新报告,OpenAI 的 GPT-4 模型中包含大量的版权内容,其占比达到了 44%。Patronus AI 是一家专门评估大型语言模型(LLMs)的公司,本周三发布的报告中测试了四款主流 AI 模型:OpenAI 的 GPT-4、Anthropic 的 Claude 2、Meta 的 Llama 2 以及 Mistral AI 的 Mixtral,意外的是没有谷歌的 Gemini。Patronus AI 使用 CopyrightCatcher 分析 4 款 AI 模型对主
谷歌优化 Gemini:可重新生成、缩短、扩充指定聊天内容
谷歌近日升级了 Gemini 聊天机器人,用户和其聊天过程中,可以指定部分聊天内容,进行修改、缩短、扩充等操作。谷歌近日更新了 Gemini,让用户只需点击几下,就能修改回复的特定部分。过去,用户必须重新生成整个回复,但现在不再需要这样做了。只需选择要修改的回复部分,然后单击铅笔图标即可进行编辑。IT之家附上截图如下:用户点击该图标之后,可以要求 Gemini 基于指定内容执行重新生成、缩短、扩充、移除操作。用户还可以对所选文本应用提示并进行相应更改。当然,恢复更改也同样简单,只需单击一下即可。
马斯克:OpenAI 把名字改成 ClosedAI 就放弃起诉
感谢埃隆・马斯克近日在 X 表示,如果 OpenAI 同意将名称改为“ClosedAI”,他就撤销针对 OpenAI 的诉讼。此前马斯克对 OpenAI 及其 CEO 萨姆・阿尔特曼提起诉讼,马斯克声称他们违反了双方关于人工智能开发的原始合同协议。OpenAI 迅速对马斯克的指控进行反击,称双方冲突的核心是围绕向营利性结构转变的讨论。OpenAI 称,马斯克曾提出与特斯拉合并或完全控制 OpenAI ,但这些要求与 OpenAI 的使命不相符。IT之家曾报道,OpenAI 昨日发布长文博客《OpenAI and E
「还是谷歌好」,离职创业一年,我才发现训练大模型有这么多坑
Karpathy:中肯的,一针见血的。如何在不到一年的时间里创办一家公司、筹集资金、购买芯片,并搭建出追赶 Gemini pro/GPT 3.5 的 LLM?很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇,但真正走完「从零开始」这一流程的人很少。我们普遍认为,储备技术人才是前提,掌握核心算法是关键,但实际上,工程实践中冒出来的挑战,也实在令人头疼。一年前,乘着大模型的热潮,Yi Tay 离开了工作 3 年多的谷歌,参与创办了一家名为 Reka 的公司并担任首席科学家,主攻大型语言模型。在谷歌时,Yi T
Pieter Abbeel 新工作“大世界模型”:轻松玩转1小时长视频,一对一QA视频内容细节
作者:赖文昕编辑:陈彩娴自3天前Sora发布以来,由图灵奖得主、Meta首席科学家Yann LeCun提出的“世界模型”又一次引起了广泛关注。 “世界模型”作为Sora的一大核心亮点,被OpenAI写在技术报告中。 但Sora是否真的如Open AI所说,是一个世界模型,却引起了行业内的争论。
谷歌被曝翻车内幕:内部群龙无首,生图机制过分“多元化”
感谢IT之家网友 rolan6 的线索投递!谷歌 Gemini 文生图风波还未平,更劲爆的内幕消息又被曝出来了。Pirate Wires 爆料,Gemini 这次的翻车,谷歌内部此前并不是毫不知情,翻车甚至是“故意”导致的。具体来说,谷歌设置了一个“安全”架构,Gemini 要生成一张图实际上要经过三个模型。大概来说,流程是这样的:用户在聊天界面请求 Gemini 生成一张图片,Gemini 收到请求后,会把请求发送给一个较小的模型。这个较小的模型的作用是根据公司的“多元化”政策重写用户的提示。为做到这一点,这个较
Midjourney封禁Stability AI:恶意爬取数据,致服务器瘫痪24小时
Stability AI CEO Emad 表示他并不知情。Midjourney 把 Stability AI 拉入黑名单了,禁止后者所有员工使用其软件,直至另行通知。这两家 AI 图像生成公司之间发生什么事了。虽然 AI 生图领域,看似百花齐放,但论资排辈,Midjourney、Stability AI 还是很受用户欢迎的。就算是竞争对手,Midjourney 也不至于禁止 Stability AI 员工使用其软件吧。事情是这样的,根据爆料者的信息显示:「Midjourney 服务器上周六凌晨受到与 Stabil
全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA
半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。沿袭 ViT 的研究思路,我们能否借助创新性的 LLaMA 架构,真正实现语言和图像的架构统一?在这一命题上,最近的一项研究 VisionLLaMA 取得了进展。VisionLLaMA 在图像生成(包含 Sora 依赖的底层的 DIT)和理解(分类、分割、检测、自监督)等多个主流任务上相较于原 ViT 类方法提升显著。论文标题:VisionLLaMA: A Unified LLaMA Interfac
消息称新加坡主权财富基金淡马锡有意投资 OpenAI
感谢据英媒《金融时报》报道,新加坡主权财富基金淡马锡有意投资 OpenAI。淡马锡由新加坡财政部完全控股。2021 年淡马锡规模高达 3810 亿新加坡元(IT之家备注:当前约 2 万亿元人民币),与另一只新加坡政府所有的基金 GIC 一同进入主权财富基金榜单前十。两位知情人士透露,作为全球最大最活跃的投资者之一的淡马锡,其高管最近几个月多次会见了 OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)。另一位熟悉内情的人士表示,双方谈判始于对阿尔特曼的风投基金 Hydrazine Capital 的投资,
AI 绘画神插件 LayerDiffusion 教程!直接用文本生成透明底图像!
大家好,这里是和你们一起探索 AI 的花生~
AI 绘画自出现以来一直都在不断发展完善,实现了很多我们在实际应用中迫切需要的功能,比如生成正确的手指、指定的姿势、准确的文本内容等。上周,又一个重磅新功能在开源的 SD 生态内实现了——直接通过文本直接生成透明底图像和图层!这将为 AI 绘画和设计领域带来了新的可能性,使图像形式更多样,也能给设计师带来更多便利。
今天我们就一起来了解实现这一新功能的技术 LayerDiffusion,以及如何在 SD WebUI Forge 和 ComfyUI 中利用 LayerDi
Stable Diffusion ComfyUI 进阶教程(一):Controlnet 线条预处理器
前言:我们在前面的基础教程中已经知道怎么去连接 Controlnet 了,接下来我们就要去了解一下不同的 Controlnet 预处理器以及 Controlnet 模型分别有什么效果和作用;
我们先从最常用的“线条预处理器”开始,这也是我们最常用的预处理器之一,我们做动漫转真人、真人转动漫、线稿上色等效果时必用的一个预处理器;
我们会在“Controlnet 预处理器-线条”线条里面发现 14 个不同的预处理器,插件作者一直在更新,也许过段时间大家会看到更多的预处理器。一、线稿
1. Canny 细致线预处理器:①
刚刚,OpenAI官方发文驳斥马斯克,自曝8年间邮件往来截图
「不幸的是,人类的未来掌握在■■■的手上。」最热科技公司 OpenAI 对全球首富马斯克,这场史诗大战进入了新的高度。刚刚,OpenAI 用一篇长文《OpenAI and Elon Musk》,正式驳斥了马斯克的所有指控。标题简洁,但内容却相当吸引眼球。OpenAI 直接晒出了八年来各位创始团队成员与马斯克的往来邮件截图,并反复重申 OpenAI 对成立使命的不懈追求。文章开篇表示:「OpenAI 的使命是确保 AGI 惠及全人类,这意味着既要构建安全、有益的 AGI,又要帮助创造广泛的利益。我们正在分享我们在实现