ChainCatcher 消息,据财联社报道,OpenAI 新推出了一个基于 GPT-4 的模型——CriticGPT,用于捕获 ChatGPT 代码输出中的错误。
CriticGPT 的作用相当于让人们用 GPT-4 来查找 GPT-4 的错误。该模型可以对 ChatGPT 响应结果做出批评评论,从而帮助人工智能训练师在“基于人类反馈的强化学习(RLHF)”过程中发现的错误,为人工智能训练师提供明确的人工智能帮助。
研究发现,当训练师借助 CriticGPT 来审查 ChatGPT 输出代码时,他们的表现要比没有得到帮助的人高出 60%。并且,在 CriticGPT 的帮助下,他们的指正比自己单独做的更加全面。