GPT‑4

2周前发布 321 00

GPT‑4 是一款大型多模态模型(可接受图片和文本输入并输出文本),尽管在许多现实场景中,其能力尚不及人类,但在各类专业和学术基准测试中,它展现出了可媲美人类的性能。

所在地:
美国
收录时间:
2025-11-23

我们已推出 GPT‑4,这是 OpenAI 在扩展深度学习方面的最新里程碑。GPT‑4 是一款大型多模态模型(可接受图片和文本输入并输出文本),尽管在许多现实场景中,其能力尚不及人类,但在各类专业和学术基准测试中,它展现出了可媲美人类的性能。例如,在模拟律师资格考试中,GPT‑4 的成绩位列考生前 10% 左右;相比之下,GPT‑3.5 的成绩则处于后 10% 左右。我们利用来自对抗性测试项目以及 ChatGPT 的经验教训,投入 6 个月时间对 GPT‑4 进行迭代对齐⁠,使其在事实性、可控性以及拒绝打破规则等方面的表现达到了前所未有的水平(尽管与完美仍有很大差距)。

在过去的两年里,我们重构了整个深度学习技术栈,并与 Azure 携手,针对我们的工作负载从头开始共同设计了一台超级计算机。一年前,作为该系统的首次“试运行”,我们训练了 GPT‑3.5。我们发现并修复了一些错误,并完善了理论基础。因此,GPT‑4 的训练过程空前稳定(至少对我们而言),成为首个我们能够提前准确预测其训练性能的大模型。在持续专注于可靠地扩展模型的同时,我们致力于优化方法,帮助我们越来越早地预测模型的未来能力并为之做好准备 — 我们认为这对安全性至关重要。

我们将通过 ChatGPT 和 API(设有候补名单⁠)发布 GPT‑4 的文本输入功能。为推动图片输入功能得到更广泛的应用,我们正在与一家合作伙伴⁠(在新窗口中打开)紧密协作,启动相关工作。此外,我们还将我们用于自动评估 AI 模型性能的框架 OpenAI Evals⁠(在新窗口中打开) 开源,这样任何人都可以向我们反馈模型中存在的不足,指导我们做出进一步的改进。

数据统计

相关导航

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...