文章列表
起猛了,看见 AI 教人画画了…
大家好,我是花生~
无论是图片、文章、视频还是 3D 模型,我们现在可以用 AI 生成,它们会返回一个或多个最终结果,质量高的内容可以直接使用,非常方便。
但最近我看到了一个很有意思 AI 的绘画模型,它追求的不是一步生成好看的图像,而是反其道而行,将绘画的过程一步步地展现出来,就如同我们都见过的那种幼儿简笔画教程一样,因此这个 flux lora 也有一个很贴切的名字:How 2 Draw(如何画)。
它可以一步步教你画一朵向日葵、一只猫头鹰,甚至一副蒙娜丽莎的肖像画,并且效果也很“有模有样”,虽然很难做到 10
10/8/2024 6:45:24 AM
夏花生
Sebastian Raschka最新博客:从头开始,用Llama 2构建Llama 3.2
十天前的 Meta Connect 2024 大会上,开源领域迎来了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。两个版本都是纯文本模型,但也具备多语言文本生成和工具调用能力。Meta 表示,这些模型可让开发者构建个性化的、在设备本地上运行的通用应用 —— 这类应用将具备很强的隐私性,因为数据无需离开设备。近日,机器学习研究员 Sebastian Raschka 光速发布长篇教程《Converting Llama 2 to Llama 3.2 From Scratch》。博文链接:《
10/6/2024 7:00:00 PM
机器之心
安卓版谷歌 Gemini Live 将支持 40 多种语言,提供 AI 语音聊天功能
谷歌公司于 10 月 1 日在 X 平台发布推文,宣布 Gemini 应用现面向所有安卓用户开放 Gemini Live 功能。谷歌官方称,Gemini Live 将支持 40 多种语言,首先推出法语、德语、葡萄牙语、印地语和西班牙语,之后还会推出更多语言。谷歌 Gemini Live 将支持在同一设备上使用最多两种语言进行对话,用户如要使用 Gemini Live,设置中的第一语言必须是以下受支持的语言之一:德语(比利时)德语(德国)德语(瑞士)德语(奥地利)英语(澳大利亚)英语(印度)英语(英国)英语(美国)西
10/6/2024 6:18:28 PM
归泷(实习)
软银 CEO 孙正义:将重视开发可读取大量学习数据的高性能大型 AI
据共同社报道,软银集团董事长兼 CEO 孙正义于 3 日在公司活动中发表演讲,就生成式 AI 提出了“在竞争中,只有最优秀的才有价值”的观点。孙正义表示,将重视开发能够读取大量学习数据的高性能大型 AI。软银将 AI 作为业务战略的核心,通过旗下的“软银愿景基金”等向相关企业投资。他还提到了日本本土企业正在研发的轻量型生成式 AI(可用于抑制数据和电力消费量),将其评价为“美丽日本式的努力,但仅是小成功”。孙正义提到了 OpenAI 于 9 月发布的最新模型(AI在线注:OpenAI 首款具备“推理”能力的模型 o
10/6/2024 8:12:48 AM
清源
谷歌最便宜 AI 模型 Gemini 1.5 Flash 8B 将商用:腰斩击穿价 0.15 美元买百万 tokens 输出
科技媒体 NeoWin 昨日(10 月 4 日)发布博文,报道称谷歌公司即将商用 Gemini 1.5 Flash 8B 模型,成为谷歌公司最便宜的 AI 模型。AI在线曾于今年 8 月报道,谷歌公司推出 3 款 Gemini 实验性模型,其中 Gemini 1.5 Flash 8B 是 Gemini 1.5 Flash 的更小尺寸模型,拥有 80 亿参数,专为多模态任务而设计,包括大容量任务和长文本摘要任务。相比较原版 Gemini 1.5 Flash,Gemini 1.5 Flash 8B 延迟更低,特别适合聊
10/5/2024 12:40:26 PM
故渊
AI 赋能游戏开发:Valve 工程师借助 ChatGPT 改进《Deadlock》匹配算法
感谢Valve 工程师 Fletcher Dunn 昨日在社交媒体上分享了他使用 ChatGPT 改进《Deadlock》匹配算法的经历。他表示,ChatGPT 就像一个高级搜索引擎,能够帮助他找到所需的解决方案。Dunn 在《Deadlock》的测试阶段向 ChatGPT 提出了改进匹配算法的需求,ChatGPT 建议他使用匈牙利算法。Dunn 采纳了这个建议,并表示他对 ChatGPT 的强大功能感到惊讶。Dunn 认为,ChatGPT 的强大之处在于能够理解自然语言并提供相关信息。即使在专业领域如游戏开发,C
10/4/2024 6:40:36 PM
远洋
突发!Sora负责人Tim Brooks离职,还是被谷歌抢走的
最近这些天,OpenAI 很好地诠释了什么是福祸相依。一方面,该公司的高层动荡不停,重要成员纷纷离职;另一方面,它又成功赢得了投资者的青睐,在 1570 亿美元估值的基础上融了一笔 66 亿美元的巨款。今天的情况同样如此,OpenAI 刚刚发布 canvas 后不久,又痛失一员大将:Sora 团队负责人 Tim Brooks 跑了,还加入了竞争对手谷歌 DeepMind。消息公布后,DeepMind 联合创始人 Demis Hassabis 第一时间出来迎接,并称很期待与他一起「将久未实现的创造世界模拟器的梦想变成
10/4/2024 4:06:00 PM
机器之心
刚刚,OpenAI重磅发布交互界面canvas,让ChatGPT成为写作和编程利器
OpenAI 刚刚融资,就迫不及待开始证明自己了。今日凌晨,OpenAI 宣布推出类似 Anthropic 的 Artifacts 的应用 canvas,并称「这是一种使用 ChatGPT 写作和编程的新方式」。在 Claude 中试过 Artifacts 的朋友都知道,这能极大提升 LLM 输出结果的表现力,其支持输出文本文件、代码、网页、SVG 等等。此前风靡一时的「汉语新解」便是基于 Claude 的 Artifacts 功能。但让 ChatGPT 用户感到遗憾的是,Artifacts 上线三个多月了,Ope
10/4/2024 4:04:00 PM
机器之心
Noam Brown早已预示o1强大推理能力,演讲深度解析AI推理研究脉络
不久之前,OpenAI 发布了 o1 系列模型,其强大的推理能力让我们看见了 AI 发展的新可能。近日,OpenAI 著名研究科学家 Noam Brown 一份 5 月的演讲上线网络,或可揭示 o1 背后的研究发展脉络。在这个题为「关于 AI 规划力量的寓言:从扑克到外交」的演讲中, Brown 介绍了扑克、围棋和外交等游戏领域的研究突破,并尤其强调了搜索/规划算法在这些成就中的关键作用。之后,他也指出了搜索/规划研究在改进机器学习模型方面的潜在未来。Noam Brown,如果你还不熟悉这个名字:他是 OpenAI
10/4/2024 4:00:00 PM
机器之心
阿尔特曼畅想 AI 未来:“魔镜”变革交互、智能体实现速度跃迁、新硬件奏响时代凯歌
科技媒体 The Decoder 昨日(10 月 3 日)发布博文,报道称山姆・阿尔特曼(Sam Altman)在 OpenAI 的 DevDays 活动上,分享了他对人工智能(AI)互动未来的想法。AI在线附上完整演讲视频如下: 构想未来 AI 系统阿尔特曼在活动中描述了一种可以改变我们使用计算机和与世界互动方式的人工智能系统。在他勾勒的未来场景中,用户可以走到一块“镜子”前,说出想要的任何内容。先进的推理模型和代理将为每个请求实时创建自定义界面,用户可以通过对话或导航个性化的视频源进行互动。阿尔特曼表示:“这将
10/4/2024 11:43:48 AM
故渊
OpenAI 获得 40 亿美元周转信贷,公司流动资金破 100 亿美元
感谢CNBC 昨日(10 月 3 日)发布博文,报道称 OpenAI 公司在完成 66 亿美元新一轮融资之外,还获得 40 亿美元周转信贷,意味着该公司的流动资金超过 100 亿美元(AI在线备注:当前约 703.61 亿元人民币)。OpenAI 获得了 40 亿美元周转信贷,参与融资的金融机构包括摩根大通、花旗、高盛、摩根士丹利、桑坦德集团、富国银行、SMBC、瑞士银行和汇丰银行。报道称 OpenAI 的基础信用额度为 40 亿美元,且可选择额外增加 20 亿美元,该贷款为无担保贷款,可以在三年内使用。OpenA
10/4/2024 11:04:06 AM
故渊
OpenAI 推出全新写作、编码工具 ChatGPT Canvas,将免费开放
感谢OpenAI 今日宣布推出全新写作、编码工具 Canvas,这是一个与 ChatGPT 合作编写和编码项目的新界面,超越了简单的聊天。AI在线从官方介绍获悉,ChatGPT Canvas 可以更好地了解任务的上下文,用户可以突出显示特定部分,以准确表明希望 ChatGPT 关注的内容。用户也可以直接编辑文本或代码,要求 ChatGPT 调整写入长度、调试代码并快速执行其他操作,并且提供后退按钮来恢复作品的先前版本。写作功能包括:建议编辑:ChatGPT 提供建议和反馈。调整文章长度:将文档长度编辑为更短或更长。
10/4/2024 10:05:56 AM
浩渺
奥特曼赢家通吃!OpenAI再揽66亿美元新融资,还不忘「狙击」一把老同事Ilya
OpenAI的估值在 9 个月内上涨了超过 700 亿美元。闹得满城风雨的 OpenAI 融资传闻终于尘埃落定。10 月 2 日,OpenAI 突然发布公告称,它融了一笔 66 亿美元的巨款,投后估值飙涨到 1570 亿美元,这意味着,其估值在 9 个月内翻了一番。到底是谁这么大手笔?综合各方消息来看,此轮融资由 OpenAI 老股东 Thrive Capital 领投,微软、英伟达、软银等参投。不过,OpenAI 此次融资仍是引发不小的争议。首先是它那不寻常的附加条件。OpenAI 要求投资者不能支持竞争对手的初
10/3/2024 2:42:00 PM
机器之心
OpenAI 雄心:2026 年销售额 256 亿美元,2029 年破 1000 亿美元
科技媒体 The Information 昨日(10 月 2 日)发布博文,披露了一份 OpenAI 公司本次 66 亿美元融资的 PPT 演示文稿,其中提及公司目标 2026 年收入提升至 256 亿美元(当前约 1798.87 亿元人民币)。OpenAI 当前公司年销售额在 40 亿美元(当前约 281.07 亿元人民币),AI在线援引该媒体报道附上 OpenAI 的目标计划如下:2025 年达到 116 亿美元(当前约 815.11 亿元人民币)2026 年达到 256 亿美元(当前约 1798.87 亿元人
10/3/2024 11:29:57 AM
故渊
安卓平台吃上 AI,谷歌 Gemini Nano 轻量模型面向开发者开启测试
随着 AI 技术不断发展,移动设备上的人工智能功能正愈发重要,谷歌公司现已向安卓开发者开放 Gemini Nano 轻量 AI 模型试用,该模型主要适用于性能较低的手机 / 平板电脑,开发者现在可以使用谷歌提供的 AI Edge SDK 轻松为自家应用整合该模型。Gemini Nano 隶属 Google Gemini 模型家族,号称专为设备端轻量级任务设计,提供灵活且高效的 AI 功能,其推理任务完全在设备端完成,无需连接云端服务器,因此拥有“保障隐私”、“无需联网”、“无需订阅”三大优势。Gemini Nano
10/3/2024 9:15:31 AM
漾仔
谷歌追赶 OpenAI,加速推进会“思考”的 AI 通用推理模型
感谢彭博社昨日(10 月 2 日)报道,谷歌公司正在开发类人推理 AI,希望在进度方面追赶 OpenAI 公司的 o1 模型。OpenAI 最近为 ChatGPT 引入了 o1-preview 和 o1-mini 模型,可以模拟人类的思考模式,实现通用推理,让 AI 实现“思考”。AI在线援引彭博社报道,谷歌公司目前也在积极推进通用推理 AI 模型的落地,该 AI 模型更擅长处理数学和编程,不过消耗更多的处理能力和能源。知情人士称,与 OpenAI 一样,谷歌也在尝试使用一种名为“思维链提示”的技术来接近人类的推理
10/3/2024 7:45:54 AM
故渊
OpenAI 笑傲 AI 江湖:66 亿美元掀起融资狂潮,9 个月估值接近翻番至 1570 亿美元
感谢路透社今天(10 月 3 日)发布博文,报道 OpenAI 公司于美国当地时间周三宣布成功融资 66 亿美元(AI在线备注:当前约 463.64 亿元人民币),公司估值达到 1570 亿美元(当前约 1.1 万亿元人民币),短短 9 个月时间公司估值接近翻倍,创下硅谷历史最高纪录。AI在线援引 FT 报道,在本次融资过程中,OpenAI 经历了诸多风波,除了内部多名联合创始人出走之外,在本次融资中也出现了诸多情况。据了解情况的三位人士透露,在谈判期间,OpenAI 明确表示希望获得独家融资安排,希望投资者在 A
10/3/2024 6:37:12 AM
故渊
整合海量公共数据,谷歌开源 AI 统计学专家 DataGemma
准确的统计数据、时效性强的信息,一直是大语言模型产生幻觉的重灾区。知识是现成的,但学是不可能学的。并非此身惰怠,只因现实太多阻碍。对于这个问题,谷歌在近日推出了自己筹划已久的大型数据库 Data Commons,以及在此基础上诞生的大模型 DataGemma。论文地址: Commons 是一个庞大的开源公共统计数据存储库,包含来自联合国(UN)、疾病控制与预防中心(CDC)、人口普查局、卫生部、环境机构、经济部门、非政府组织和学术机构等可信来源的大量统计数据。目前,整个语料库包含超过 2500 亿个数据点和超过 2
10/2/2024 11:06:38 PM
汪淼