gpt-4-shi-ru-he-gong-zuo-de-ha-fo-jiao-shou-qin-zi-jiang-shou 的搜索结果

和 GPT-4 并列第一,LMSYS 基准测试显示 Claude-3 模型表现优异

根据 LMSYS Org 公布的最新基准测试报告,Claude-3 得分以微弱优势超越 GPT-4,成为该平台“最佳”大语言模型。IT之家首先介绍下 LMSYS Org,该机构是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内基梅隆大学合作创立的研究组织。该机构推出 Chatbot Arena,这是一个针对大型语言模型(LLM) 的基准平台,以众包方式匿名、随机对抗测评大模型产品,其评级基于国际象棋等竞技游戏中广泛使用的 Elo 评分系统。评分结果通过用户投票产生,系统每次会随机选择两个不同的大模型机器人和用户聊天

OpenAI 的 GPT 商店审核失控:被指充斥侵权和垃圾内容

旨在提供从编程辅助到健身建议等各种功能的 GPT 模型的 OpenAI GPT 商店正面临质量和合规性问题。据 TechCrunch 调查,该商店存在大量涉嫌侵犯版权的 GPT 模型,例如未经授权生成迪士尼和漫威角色内容的“钢铁侠”GPT 或 “米奇老鼠”GPT。IT之家注意到,尽管 OpenAI 采用了结合自动检测和人工审查的审核制度,但大量的 GPT 模型显然逃过了审核。另一个问题是学术诚信,一些 GPT 模型声称可以绕过内容剽窃检测工具,助长抄袭行为。例如,有两个 GPT 模型,一个声称是高级的改写工具,另一

OpenAI CEO 阿尔特曼:GPT-4“有点糟糕”,今年将推出新模型

OpenAI 首席执行官萨姆・阿尔特曼 (Sam Altman) 在周一发布的与列克斯・弗里德曼 (Lex Fridman) 的访谈中表示,他们公司的人工智能模型 GPT-4 其实“有点糟糕(kinda sucks)”,阿尔特曼更期待即将到来的 GPT-5 能够真正配得上大家的期待。“我认为它有点糟糕,” 当被问及 GPT-4 及其最令人印象深刻的能力时,阿尔特曼说道,“展望未来几年,我们应该意识到我们现在拥有的工具将来看来会非常落后,这正是鞭策我们不断进步、创造更美好的未来的动力。”“别误会,我既不想贬低 GPT

OpenAI 官方博客提前泄露 GPT-4.5 Turbo,有望今年夏天发布

感谢OpenAI 近期可能意外泄露了旗下即将发布的 GPT-4.5 Turbo 大型语言模型信息。网友发现,OpenAI 博客上疑似上线了一篇有关 GPT-4.5 Turbo 的文章,但该页面目前已被撤回,搜索引擎也无法再检索到相关信息。泄露的信息显示,GPT-4.5 Turbo 将在速度、准确性和可扩展性方面全面超越其前代 GPT-4 Turbo。更关键的是,泄露的描述中提到了该模型的“知识截止日期”为 2024 年 6 月。这一信息引发了诸多猜测,有人认为是笔误,也有人推测 OpenAI 可能会在今年 7 月或

Sora 团队负责人称 Sora“还不是一个产品”,短期不会向公众开放

感谢近日,YouTube 频道 WVFRM Podcast 在其节目中,邀请了 OpenAI 旗下文生视频模型 Sora 的核心团队成员参与访谈。IT之家注:三名成员包括 Bill Peebles、Tim Brooks 和 Aditya Ramesh,均为 Sora 项目负责人。这三名负责人谈到了 Sora 何时可供用户使用的问题,其称目前 Sora 仍处于反馈获取阶段,“还不是一个产品,短期之内不会向公众开放。”对于什么时候把它变成一个产品,我们目前甚至没有任何时间表。我们正处于获取反馈阶段。我们肯定会改进它,但

强如 GPT-4,也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试

编译 | 赖文昕编辑 | 陈彩娴语言大模型能依据人类设定的规则生成内容吗? 这背后关乎人类用户使用大模型的安全问题。 例如,AI 科技评论想使用 GPT-4 制作一张包含对话框的图片,但没有针对目标生成对话的内容给予明确指示,而 GPT-4 生成的图文效果便如下,显示文本逻辑混乱、字不成章,还有部分“重影”:语言大模型能否遵循人类指示生成合格内容,是人类能否操控人工智能的重要评测标准之一。

GPT-4.5 Turbo意外曝光,官方网页被扒出,网传明天就上线

虽然没等到 GPT-5 的消息,但我们离 GPT-4.5 不远了。Claude 3 一经推出,AI 初创公司 Anthropic 被推上了大模型浪潮顶端。这一波压力立马给到了 OpenAI。不少网友调侃,GPT-5 呢?由于 OpenAI 每次都能给我们超乎想象的 AI 体验惊喜,大家不由得对他们的实力有着更高期待。GPT-5 的发布时机或许还扑朔迷离,但我们离 GPT-4.5 的发布可能真的不远了。最新消息显示,OpenAI 的 GPT-4.5 Turbo 在 Bing 和 DuckDuck Go 等搜索引擎已经

万物皆可《毁灭战士》,专家利用 GPT-4V 模型运行该游戏

英国约克大学研究员 Adrian de Wynter 近日发表研究论文《Will GPT-4 Run DOOM?》,探讨了如何让 GPT-4V 模型来玩《毁灭战士》游戏。de Wynter 为此设计了一个系统,使用 GPT-4V(GPT4 的多模态衍生版本,可以接收图像作为输入)捕捉游戏引擎的画面截图,并返回游戏状态的结构化描述。他设计了一个 Agent 模型,根据视觉输入信息,并对比此前历史记录作出决策,并将其反应转化为《毁灭战士》游戏可以理解的按键命令。简单地说,系统会截取游戏截图,并利用这些截图找出游戏中发生

微软 Copilot 全面升级 OpenAI GPT-4 Turbo 模型,包括免费用户

在经过一系列工作之后,微软现已针对 Copilot 用户群全面升级为 OpenAI 最先进的 GPT-4 Turbo 模型。IT之家提醒,Copilot Pro 用户如果不习惯的话还可以切换回标准 GPT-4 模型,但免费用户是没有选择权的。微软 Copilot 最初是作为 Bing Chat 聊天机器人推出的一款产品,早期迭代依赖于 GPT-3.5 模型,后来升级到 GPT-4 后有了大幅改进,而现在又升级到了 GPT-4 Turbo 模型,这意味着 Copilot 功能又一次实现飞跃。GPT-4 Turbo 以

阿尔特曼、老黄齐预测:AGI 五年内降临,代替 95% 工作!但马斯克断言 AGI 将被电力卡脖子

感谢IT之家网友 lemon_meta 的线索投递!【新智元导读】突然间,AGI 已经成为了一个新的「5 年内实现」的未来技术。从 Altman 到老黄,都在不同场合表示,达到人类智能水平的 AI 将很快到来。而技术路径和未来可能出现的能源短缺,可能是达到 AGI 过程中的最大变数。Claude 3、Sora、Gemini 1.5 Pro 的纷纷出现,以及或许今年内就会被放出的 GPT-5,让所有人都不约而同地隐隐感觉:我们似乎离 AGI 似乎越来越近了。OpenAI CEO Sam Altman 坚定地认为,AG

AI 结合汽车,蔚来宣布 NOMI GPT 领航版开启招募

蔚来汽车今日宣布,2024 NOMI 焕新,GPT 领航版正式开启招募。经历 132 次版本迭代更新、为用户带来了超 2000 项功能的 NOMI,即将进入体验升级新篇章。官方称登陆蔚来 App,关注用户领航团发布的最新招募信息。然而,IT之家暂未找到招募入口,评论区网友也表达了同样的疑惑,蔚来对此表示“别着急,刷一刷就上线了”。IT之家注意到,2024 款蔚来全系车型均将采用全新的中央计算平台 ADAM,搭载高通骁龙 8295 座舱芯片,座舱算力得到明显提升。其中,8295 芯片相较于 8155 芯片,CPU 算

微软开始为 Copilot Pro 用户推出创建自定义 GPT 功能

微软 Bing 副总裁 Michael Schechter 表示,微软已经开始面向 Copilot Pro 用户推出 Copilot GPT Builder 功能,允许用户打造属于自己的自定义 AI 机器人。如图所示,微软 Copilot GPT Builder 目前正在分阶段推出,拥有体验资格的 Copilot Pro 用户可以看到一个新的预览功能,点击即可通过自定义配置创建一个个性化 Copilot GPT。微软今年 1 月为 Copilot 推出了一项可选订阅服务 Copilot Pro,每月收费 20 美元

53页PDF广泛流传,核心员工相继离职,OpenAI到底有什么秘密?

八卦络绎不绝,GPT-5 却一直没来。一份关于「OpenAI 在 2027 年实现 AGI」的 53 页 PDF,正在互联网上广泛流传。文档来源于一个名为「vancouver1717」的 X 账户,该账户注册于 2023 年 7 月,只有两条推文。最新发布的这个 PDF 文档称,OpenAI「将在 2027 年前开发出人类水平的 AGI」,「从 2022 年 8 月就在训练 125 万亿参数的多模态模型」,而且已经「在 2023 年 12 月完成了训练」,但是「由于高推理成本取消了发布」。其中提到,这个模型就是原计

模型偏好只与大小有关?上交大全面解析人类与32种大模型偏好的定量组分

在目前的模型训练范式中,偏好数据的的获取与使用已经成为了不可或缺的一环。在训练中,偏好数据通常被用作对齐(alignment)时的训练优化目标,如基于人类或 AI 反馈的强化学习(RLHF/RLAIF)或者直接偏好优化(DPO),而在模型评估中,由于任务的复杂性且通常没有标准答案,则通常直接以人类标注者或高性能大模型(LLM-as-a-Judge)的偏好标注作为评判标准。尽管上述对偏好数据的应用已经取得了广泛的成效,但对偏好本身则缺乏充足的研究,这很大程度上阻碍了对更可信 AI 系统的构建。为此,上海交通大学生成式

6000字干货!全面了解顶尖AI产品 ChatGPT-4

GPT-4 的看点都有哪些呢?逻辑推理,强到可以代替你考律师啦 角色扮演,cosplay 认定角色不轻易被忽悠 多模态,可以看到图片啦 更安全,想要再轻易忽悠它越狱很难了GPT-4 的论文: 搭载了 GPT-4 的 ChatGPT Plus: 申请 GPT-4 的 API: 接下来的内容会详细介绍 GPT-4 的一切。GPT-4 具有更广泛的通识知识和问题解决能力,可以更有效的解决难题 1. 它更有创造力 GPT-4 比以往任何时候都更具创造性和协作性。它可以与用户一起生成、编辑和迭代创意和技术写作任务,例如

讯飞星火V3.5正式发布,基于全国产算力平台“飞星一号”训练

1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5。2023年10月24日,科大讯飞携手华为,宣布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用。启用后的90多天里,讯飞星火基于“飞星一号”,启动了对标GPT-4的更大参数规模的大模型训练,带来了1月30日这场讯飞星火V3.5升级发布。首个基于全国产算力训练的全民开放大模型讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能

OpenAI官方下场修复GPT-4变懒,上新多个模型、还大降价

今天,OpenAI 一口气宣布了 5 个新模型,包括两个文本嵌入模型、升级的 GPT-4 Turbo 预览版和 GPT-3.5 Turbo、一个审核模型。不知大家是否还记得,去年年底 GPT-4 开始变「懒」的事实。比如在高峰时段使用 GPT-4 或 ChatGPT API 时,响应会变得非常缓慢且敷衍,有时它会拒绝回答用户提出的问题,甚至还会单方面中断对话。 这种情况对于码农来说,更是深有体会,有人抱怨道「让 ChatGPT 扩展一些代码,它竟然让我自己去写。」原本想借助 ChatGPT 帮助自己编写代码,现在好

ChatGPT应用商店终上线,全网GPTs超300万,和OpenAI分钱时代来了

收入分成标准还未确定。ChatGPT 也要像微信、钉钉那样变成全功能 App 了?1 月 10 日,OpenAI 的应用商店 GPT Store 正式上线,分类、趋势、每周精选等栏目一应俱全。正像大部分应用商店那样,GPT Store 包括流行下载的社区排行榜,用户可以按类别搜索,例如写作、生活方式和教育。OpenAI Greg Brockman 表示,这是打造自己的 ChatGPT 的第一步。该产品仍在试验阶段,但希望在未来几周内更广泛地推广。OpenAI 还将在每周重点介绍有用和有影响力的特色 GPT。第一批特