一文读懂GPT-5发布会|价格屠夫、编程惊艳,新功能乏善可陈

“OpenAI的核心研究员Noam Brown把针对发布会的唯一评论,献给了GPT-5在消除幻觉上的进步。
GPT-5在System Card中简要地提到了他们使用的大概方法。 他们一方面强化训练模型能够有效地使用浏览工具来获取最新的信息。
另外,当模型不使用浏览工具,而是依赖其自身的内部知识时,训练的重点是减少在这种情况下产生的幻觉。
更底层的原因,可能是GPT5 thinking经历的强化学习训练。在这些训练里,OpenAI似乎利用了一些最新的训练方法,让这些模型学会了“完善自己的思考过程,尝试不同的策略,并认识到自己的错误”。
也正是因为这个训练模式,GPT-5模型的“欺骗”行为也大幅减少,部分维度上居然可以减少近90%。”
 
 
Back to Top