当前位置：首页 > 问答 > 正文

OpenAI的高管聊了聊ChatGPT背后那些不为人知的秘密和故事

水靖荷
问答
2025-12-29 08:13:32
4

主要基于OpenAI首席执行官萨姆·奥尔特曼（Sam Altman）、总裁格雷格·布罗克曼（Greg Brockman）以及早期团队成员在各种播客、公开演讲和采访（如与Lex Fridman的对话、TED演讲等）中分享的轶事和见解。

说起来你可能不信,ChatGPT这个如今火遍全球的“智能大脑”，在诞生之初，连它的创造者们都没完全预料到它会如此强大和受欢迎，OpenAI的高管们在后来的聊天中，透露了不少幕后故事，有些听起来甚至有点“戏剧性”。

最初的GPT-3，内部都觉得“有点笨”？

根据OpenAI CEO萨姆·奥尔特曼和联合创始人格雷格·布罗克曼的回忆，当GPT-3这个大型语言模型刚被训练出来时，团队的感觉其实挺复杂的，模型确实很大，参数高达1750亿个，技术上是个巨大飞跃，但当你去实际和它对话时，它经常会“胡言乱语”，答非所问，或者写一段文字写到后面就完全跑偏了。

用他们的话说,GPT-3就像一个拥有海量知识的“睡美人”，它脑子里什么都有，但就是不知道怎么有条理、有逻辑地把这些知识拿出来跟你交流，当时团队里甚至有一种失望的情绪，觉得这个庞然大物可能并没有想象中那么有用，关键的转折点在于一个后来被证明是“神来之笔”的想法——基于人类反馈的强化学习（RLHF）。

ChatGPT的“灵魂”来自一个不起眼的尝试

OpenAI的高管聊了聊ChatGPT背后那些不为人知的秘密和故事

RLHF这个概念听起来高大上,但说白了，就是请人来“调教”AI，OpenAI团队当时做了一次大胆的尝试：他们雇佣了一群外包的“AI训练师”，这些训练师的任务很简单，就是不停地和原始的GPT-3模型聊天。

具体怎么操作呢？分三步走：第一步，训练师们会给出一个问题，然后模型生成几个不同的回答，训练师需要从中挑选出最好、最靠谱的一个，这就像老师从一堆作业里挑出范文。第二步，模型再生成回答时，训练师要像批改作文一样，给这些回答排序，哪个最好，哪个次之，哪个最差。第三步，把这些“人类偏好”数据喂给模型，让它自己学习和琢磨：“哦，原来人类喜欢的是这种调调的回答，不喜欢那种。”

就是这个看似简单甚至有些“笨拙”的方法，彻底激活了GPT-3，萨姆·奥尔特曼曾感慨，当第一个经过RLHF调教后的模型出来时，整个团队都震惊了，它突然变得“听话”了，能理解复杂的指令，能承认错误，能拒绝不当请求，对话起来像个有礼貌、有逻辑的“人”，ChatGPT的灵魂，正是来自于这大量普通人（训练师）的耐心教导。

发布前夜，高管们紧张得睡不着觉

OpenAI的高管聊了聊ChatGPT背后那些不为人知的秘密和故事

ChatGPT在2022年11月底以免费研究预览版发布,据奥尔特曼说，发布前的那个晚上，他和核心团队都非常焦虑，他们完全无法预测公众会作何反应。

他们担心的事情有很多：服务器会不会瞬间被冲垮？模型会不会被滥用，产生大量虚假信息或有害内容？人们会不会觉得它只是个噱头，然后迅速失去兴趣？毕竟，在这之前，AI对话机器人给大众的印象大多还停留在“人工智障”阶段。

结果,发布后的情况让所有人都傻眼了，用户增长的速度像火箭一样飙升，短短几天内就突破了百万用户，这种爆炸式的欢迎程度，远远超出了OpenAI最乐观的估计，奥尔特曼说，那段时间他们几乎不睡觉，全力应对汹涌而来的用户和随之出现的各种技术问题，这种“幸福的烦恼”也让他们确信，他们确实创造出了一个人们真正需要和喜欢的东西。

ChatGPT自己也“吓到”了它的创造者

OpenAI的高管聊了聊ChatGPT背后那些不为人知的秘密和故事

你有没有想过,OpenAI的工程师们自己会不会用ChatGPT？答案是：当然用，而且他们自己也是它的“重度用户”，但高管们也承认，有时候ChatGPT表现出的能力会让他们也感到一丝“惊讶”甚至“不安”。

它能在完全没被专门训练过的任务上表现出色,这种“泛化能力”有时会显得很神奇，格雷格·布罗克曼在一次演示中提到，他们发现ChatGPT能理解一些非常微妙的讽刺和幽默，这并没有写在代码里，这种“涌现”出来的能力，说明AI的学习过程可能还存在很多人类尚未完全理解的黑箱。

这种“不可预测性”也正是OpenAI对AI技术持谨慎态度的原因之一，他们反复强调，需要一边发展一边确保其安全可控，因为就连他们自己，也无法百分百预知这个“大脑”下一步会进化出什么能力。

名字的由来其实很直接

你可能好奇“ChatGPT”这个名字是怎么来的，其实没那么多玄乎的考虑，GPT的全称是“Generative Pre-trained Transformer”（生成式预训练转换器），这是模型的技术基础，因为它主要被优化用于“聊天”（Chat）场景，所以很自然地就被组合成了“ChatGPT”，高管们笑称，起名字的时候更专注于解决技术难题，名字只要简单明了就好。

总结一下

从这些高管的分享中,我们可以看到ChatGPT的成功并非一蹴而就，它背后有技术突破的必然，也有像RLHF这样的“灵光一现”；有发布前的忐忑不安，也有面对巨大成功时的措手不及，更重要的是，它揭示了一个核心观点：AI的未来，不仅仅是算法和算力的竞赛，更是如何让AI更好地理解人类意图、与人类协作共生的探索，ChatGPT的故事，其实是一个关于人类如何教会机器“好好说话”的生动故事。