AIGC宇宙 AIGC宇宙

本科学历但创造出GPT,奥特曼盛赞为「爱因斯坦级」天才,OpenAI总裁:他想要的,我们都给

作者:
2025-01-02 07:30
奥特曼称他是爱因斯坦级别的天才;OpenAI总裁更是直言:只要他想要的,我们都给。 Alec Radford大神离职OpenAI,现在牵出更多细节:改变世界的GPT,竟然是在Jupyter notebook上诞生的。 而他只负责提供背后的灵感,剩下的由工程师来解决。

奥特曼称他是爱因斯坦级别的天才;OpenAI总裁更是直言:

只要他想要的,我们都给。

Alec Radford大神离职OpenAI,现在牵出更多细节:

改变世界的GPT,竟然是在Jupyter notebook上诞生的。

而他只负责提供背后的灵感,剩下的由工程师来解决。

图片

(网友:那在Excel也可以做到这一点)

图片

奥特曼高度评价:没有他应有的知名度。

图片

他在Jupyter notebooks上发明了GPT

在奥特曼帖子下面,更多细节轶事被扒了出来。

比如事实是,他差点就放弃了将语言作为通往 AGI 的道路。

据这位OpenAI员工描述,在Alec在职最后一天他们有机会第一次谋面,他向Alec询问了坚持语言模型背后的原因。

图片

大概在2017年,Alec花了几年时间来研究RNN,但是进展不大。

于是Alec就感觉很沮丧,就想着要不要退出OpenAI。最终他决定休息一个月来调整,重新思考自己的方案。

回来后不久,Ilya就跟他推荐了谷歌前同事的新论文,也就是那篇著名的Attention is all you Need

于是乎,他就开始了新的架构尝试,并将其与无监督预训练相结合。

结果效果非常好,GPT时代就此开始

图片

同样还有CLIP,他曾为此闭关一年来解决计算机视觉问题,最终才得以推出。CLIP也成为后续解决2D计算机视觉问题的基础。

图片

不过能造就GPT、CLIP,也是少不了OpenAI诸位同事对他的全力支持——

当时他在Jupyter notebooks上编写代码,然后就让研究工程师在那里翻译。好奇心胜过一切

图片

OpenAI总裁Greg Brockman曾提到过这位天才:只要他想要的,我们都给

图片

当时是在2023年SXSW大会上,Greg Brockman表示,Alec Radford对语言非常感兴趣,一直在研究如何构建小型聊天机器人。

我们非常喜欢他,所以我们非常支持他做任何他想做的事情。与此同时,我们也在投资一些严肃的项目,我们就想,你知道,无论亚历克需要什么,我们都会确保他得到。

也正因如此,2017诞生了第一个有趣的结果——一个根据亚马逊评论训练出来的模型,它可以预测下一个角色、下一个角色、下一个字母是什么。实际上,它学会了最先进的情感分析分类器。你可以给它一个句子,它会说这是正面的还是负面的。这听起来并不令人印象深刻,但就是在这一刻,我们知道它一定能成功。”

还有同行们表示,他的一些想法是整个AI领域研究者们重要灵感来源。并且他从来也不吝惜地去分享他的时间和想法。

图片图片

据这位朋友分享,当时他在学习ML,在MNIST训练一个普通的MLP,结果遇到了一个愚蠢的小问题。

然后Alec没有敷衍,又或者是帮忙修复这个小问题,而是立即开始教关于CNN方面的知识。

图片

奥特曼:爱因斯坦级别的天才

他毕业于富兰克林·欧林工程学院(Franklin W. Olin College of Engineering)。

据网友透露,这是个规模很小、以项目为导向的工程学院。其声誉与Rose-Hulman理工学院和Harvey Mudd College等学校类似。

他们的学生在项目方向上往往有很大的个人自由度,并能直接接触到大量的教师和研究工作,这与其他院校的研究生经历不相上下。

图片

随后就加入OpenAI,一干就是八年。

截至今日,他的论文被引数已超过19万。被引量排名前三的论文,分别与GPT-3、CLIP和GPT-2相关。

图片

这三篇论文都为今天的ChatGPT打下了重要基础,实际上,Alec几乎参与了OpenAI所有的重大突破。

除了被引量最高的这三篇,从第一代GPT到GPT-4o的作者名单中,Alec的名字都赫然在列,并且前两代中都是第一作者。

Alec同样作为一作的CLIP,则是OpenAI在多模态路线上的重要成果,甚至在整个行业都极具影响力;同时,Alec也是OpenAI初代绘图模型DALL·E的参与者。

其他模态方面,OpenAI开源的语音识别系统Whisper,一作仍然是他。不过,最新的o1模型贡献者列表中已经没有了Alec的名字。

图片

接下来,奥特曼表示,期待他以独立开发者的身份与OpenAI合作。

网友:不用博士学位也能干大事?

Alec Radford的经历,牵出来更多研究层面上的讨论。

是不是不用博士学位也能干大事了?Stability AI创始人回忆,他们自己的博士占比也不高,大概80个研究者/工程师中只有16个博士。

图片

这样看,博士学位是不是就不是招聘中的必选项了。

图片

但也有持反对意见,这样以偏概全未免有点夸张和过于简单化了。博士学位不仅仅是一个证书,更是一个教会你如何批判性思考和系统地解决复杂问题的旅程。

图片

而围绕这些细节,另一个讨论的主角是Jupyter notebook,网友们直呼:是个诞生天才想法的地方。

图片图片

所以新的一年,从开始学习如何使用notebook开始吧。

参考链接: 

[1]https://x.com/sama/status/1872666383210971560。[2]https://x.com/Yuchenj_UW/status/1874171107705811285。[3]https://x.com/ahatamiz1/status/1874228975175950487?s=46&t=R82LqSqpRZuVhcZxqH_Vlw。[4]https://x.com/priceindex/status/1873134352395051093?s=46&t=R82LqSqpRZuVhcZxqH_Vlw。

相关标签:

相关资讯

OpenAI发布GPT-4.1指令提示工程指南

4月15日,OpenAI 发布了针对 GPT-4.1的提示工程指南,为开发者提供了全面的建议和最佳实践,帮助他们更高效地构建和优化 AI 应用。 这份指南详细介绍了 GPT-4.1的特性,并提供了从基础原则到高级策略的一系列技巧,旨在帮助开发者充分利用 GPT-4.1的强大能力。 GPT-4.1是 OpenAI 最新的语言模型,它在编程能力、指令遵循能力和长上下文处理能力上相比前代模型有显著提升。
4/15/2025 1:01:48 PM
AI在线

OpenAI推全新语音转录模型gpt-4o-transcribe,语音转文字准确率飙升

继此前在语音 AI 领域引发一些关注后,OpenAI并未停下在该领域探索的脚步,现在这家ChatGPT的创造者再次发力,推出了三款全新的自主研发语音模型,分别为:gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。 其中最受瞩目的当属gpt-4o-transcribe。 目前,这些新模型已经率先通过应用程序接口(API)向第三方开发者开放,开发者们可以利用它们打造更智能的应用程序。
3/21/2025 9:01:00 AM
AI在线

OpenAI发布GPT-4.1系列模型:能力全面超越前代

4月15日,OpenAI 在其官方博客宣布正式发布 GPT-4.1系列模型,涵盖 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。 该系列在编程能力、指令理解及长文本处理等方面实现重大突破,全面超越前代 GPT-4o 及 GPT-4o mini。 其中,模型上下文窗口扩展至100万 tokens,知识库更新至2024年6月,为复杂任务提供更强支持。
4/15/2025 9:00:45 AM
AI在线