键词,模型发展形成鲜明双轨制:向上突破的 OpenAIo1 与 GPT-5,通过强化学习(RL)与自我博弈技术内化思维链,消耗更多推理侧算力实现“慢思考”能力,在数学竞赛中正确率达 83.3%,编程能力较前代提升 8 倍,持续试探 AGI上限;向下普及的 DeepSeek 与 Llama 系列,则通过动态序列调整、批处理优化、低精度推理等技术极致压缩成本,其中 DeepSeek 成为行业“性价比度量衡”,迫使所有厂商直面“价格贵 10 倍是否能力强 10%”的拷问,推动各大旗舰模型降低推理成本,让 AI 从昂贵奢侈品转变为水电煤般的基础设施。