通义千问:2025 年 3 月 6 日,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B,该模型通过大规模强化学习,在数学、代码及通用能力上实现质的飞跃,作为一款参数仅有 320 亿的轻量化模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。同时,QwQ-32B 大幅降低了部署使用成本,在消费级显卡上也能实现本地部署,适合快速响应或对数据安全要求高的应用场景。在一系列权威基准测试中,QwQ-32B 模型表现出色,在测试数学能力的 AIME24 评测集上和评估代码能力的 LiveCodeBench 中,表现与 DeepSeek-R1 相当,远胜于 o1 - mini 及相同尺寸的 R1 蒸馏模型。2025 年 3 月 26 日,阿里巴巴还发布了多模态理解生成大模型 Qwen2.5-omni-7b。