OpenAI的高管聊了聊ChatGPT背后那些不为人知的秘密和故事
- 问答
- 2025-12-29 08:13:32
- 4
主要基于OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)、总裁格雷格·布罗克曼(Greg Brockman)以及早期团队成员在各种播客、公开演讲和采访(如与Lex Fridman的对话、TED演讲等)中分享的轶事和见解。
说起来你可能不信,ChatGPT这个如今火遍全球的“智能大脑”,在诞生之初,连它的创造者们都没完全预料到它会如此强大和受欢迎,OpenAI的高管们在后来的聊天中,透露了不少幕后故事,有些听起来甚至有点“戏剧性”。
最初的GPT-3,内部都觉得“有点笨”?
根据OpenAI CEO萨姆·奥尔特曼和联合创始人格雷格·布罗克曼的回忆,当GPT-3这个大型语言模型刚被训练出来时,团队的感觉其实挺复杂的,模型确实很大,参数高达1750亿个,技术上是个巨大飞跃,但当你去实际和它对话时,它经常会“胡言乱语”,答非所问,或者写一段文字写到后面就完全跑偏了。
用他们的话说,GPT-3就像一个拥有海量知识的“睡美人”,它脑子里什么都有,但就是不知道怎么有条理、有逻辑地把这些知识拿出来跟你交流,当时团队里甚至有一种失望的情绪,觉得这个庞然大物可能并没有想象中那么有用,关键的转折点在于一个后来被证明是“神来之笔”的想法——基于人类反馈的强化学习(RLHF)。
ChatGPT的“灵魂”来自一个不起眼的尝试

RLHF这个概念听起来高大上,但说白了,就是请人来“调教”AI,OpenAI团队当时做了一次大胆的尝试:他们雇佣了一群外包的“AI训练师”,这些训练师的任务很简单,就是不停地和原始的GPT-3模型聊天。
具体怎么操作呢?分三步走: 第一步,训练师们会给出一个问题,然后模型生成几个不同的回答,训练师需要从中挑选出最好、最靠谱的一个,这就像老师从一堆作业里挑出范文。 第二步,模型再生成回答时,训练师要像批改作文一样,给这些回答排序,哪个最好,哪个次之,哪个最差。 第三步,把这些“人类偏好”数据喂给模型,让它自己学习和琢磨:“哦,原来人类喜欢的是这种调调的回答,不喜欢那种。”
就是这个看似简单甚至有些“笨拙”的方法,彻底激活了GPT-3,萨姆·奥尔特曼曾感慨,当第一个经过RLHF调教后的模型出来时,整个团队都震惊了,它突然变得“听话”了,能理解复杂的指令,能承认错误,能拒绝不当请求,对话起来像个有礼貌、有逻辑的“人”,ChatGPT的灵魂,正是来自于这大量普通人(训练师)的耐心教导。
发布前夜,高管们紧张得睡不着觉

ChatGPT在2022年11月底以免费研究预览版发布,据奥尔特曼说,发布前的那个晚上,他和核心团队都非常焦虑,他们完全无法预测公众会作何反应。
他们担心的事情有很多:服务器会不会瞬间被冲垮?模型会不会被滥用,产生大量虚假信息或有害内容?人们会不会觉得它只是个噱头,然后迅速失去兴趣?毕竟,在这之前,AI对话机器人给大众的印象大多还停留在“人工智障”阶段。
结果,发布后的情况让所有人都傻眼了,用户增长的速度像火箭一样飙升,短短几天内就突破了百万用户,这种爆炸式的欢迎程度,远远超出了OpenAI最乐观的估计,奥尔特曼说,那段时间他们几乎不睡觉,全力应对汹涌而来的用户和随之出现的各种技术问题,这种“幸福的烦恼”也让他们确信,他们确实创造出了一个人们真正需要和喜欢的东西。
ChatGPT自己也“吓到”了它的创造者

你有没有想过,OpenAI的工程师们自己会不会用ChatGPT?答案是:当然用,而且他们自己也是它的“重度用户”,但高管们也承认,有时候ChatGPT表现出的能力会让他们也感到一丝“惊讶”甚至“不安”。
它能在完全没被专门训练过的任务上表现出色,这种“泛化能力”有时会显得很神奇,格雷格·布罗克曼在一次演示中提到,他们发现ChatGPT能理解一些非常微妙的讽刺和幽默,这并没有写在代码里,这种“涌现”出来的能力,说明AI的学习过程可能还存在很多人类尚未完全理解的黑箱。
这种“不可预测性”也正是OpenAI对AI技术持谨慎态度的原因之一,他们反复强调,需要一边发展一边确保其安全可控,因为就连他们自己,也无法百分百预知这个“大脑”下一步会进化出什么能力。
名字的由来其实很直接
你可能好奇“ChatGPT”这个名字是怎么来的,其实没那么多玄乎的考虑,GPT的全称是“Generative Pre-trained Transformer”(生成式预训练转换器),这是模型的技术基础,因为它主要被优化用于“聊天”(Chat)场景,所以很自然地就被组合成了“ChatGPT”,高管们笑称,起名字的时候更专注于解决技术难题,名字只要简单明了就好。
总结一下
从这些高管的分享中,我们可以看到ChatGPT的成功并非一蹴而就,它背后有技术突破的必然,也有像RLHF这样的“灵光一现”;有发布前的忐忑不安,也有面对巨大成功时的措手不及,更重要的是,它揭示了一个核心观点:AI的未来,不仅仅是算法和算力的竞赛,更是如何让AI更好地理解人类意图、与人类协作共生的探索,ChatGPT的故事,其实是一个关于人类如何教会机器“好好说话”的生动故事。
本文由水靖荷于2025-12-29发表在笙亿网络策划,如有疑问,请联系我们。
本文链接:http://www.haoid.cn/wenda/70538.html
