从“思考者”到“行动者”。2025 年 1 月 31 日 o3-mini 向所有用户发布,被定位为o1 在需要高精度和高速度的技术领域中的“专业替代品”。它首次引入了“推理强度”的概念(分为低、中、高三档),允许用户在成本/延迟与准确性之间进行权衡 。4 月,o4-mini 发布。o3 与 o4mini 首次能够智能体式地决定何时以及如何使用各种工具,包括网络搜索、通过执行 Python 代码分析上传的文件,甚至是生成图像 。这一能力将模型从一个被动的答案生成器,转变为一个主动的任务执行者。它们通过强化学习不仅学会了如何使用工具,更学会了推理何时需要使用工具,从而能够处理需要外部信息或计算资源的复杂多步骤工作流 。