K1.5 多模态模型发布,长链能力比肩 OpenAI o1。2025 年 1 月 20 日,Kimi 发布 K1.5 多模态思考模型,此次也为 Kimi 首次公开模型训练技术报告。K1.5 在短链推理模式下数学、代码、视觉与通用能力领先 GPT-4o 和 Claude 3.5 Sonnet 约 550%;长链模式下,K1.5 多项基准与 OpenAI o1 正式版持平,为 OpenAI 之外首个实现该水平的模型。K1.5团队将强化学习上下文扩展到 128 k,并用部分展开、在线镜像下降及长-短迁移策略,在不依赖 MCTS 等复杂技巧的情况下实现强大的性能。