SuperCLUE2025年年度通用测评推理模型推理效能区间分布(含补测)
2026-02-04 14:57:38
29
相关数据
行业数据1
SuperCLUE测评基准2025年年度总体表现(数据截至2026年2月27日)
2026-03-16 08:15:43
29
原图定位
行业数据1
SuperCLUE2025年年度测评六大任务国内Top3
2026-02-04 14:57:38
31
原图定位
行业数据1
SuperCLUE2025年年度测评开闭源大模型6大任务平均分对比
2026-02-04 14:57:38
33
原图定位
行业数据1
SuperCLUE2025年年度测评代码生成总分对比
2026-02-04 14:57:38
29
原图定位
行业数据1
SuperCLUE2025年年度基准测评Qwen3-Max-Thinking六大任务得
2026-02-04 14:57:38
31
原图定位
行业数据1
SuperCLUE2025年年度测评海内外大模型6大任务平均分对比
2026-02-04 14:57:38
29
原图定位
行业数据1
SuperCLUE2025年年度基准测评Kimi-K2.5-Thinking六大任务得分
2026-02-04 14:57:38
38
原图定位
行业数据1
2025年全年SuperCLUE通用基准测评海内外大模型Top3
2026-02-04 14:57:38
36
原图定位
行业数据1
SuperCLUE2025年年度测评精确指令遵循总分对比
2026-02-04 14:57:38
30
原图定位
行业数据1
SuperCLUE2025年年度测评六大任务国内外Top20热力图
2026-02-04 14:57:38
37
原图定位
行业数据1
SuperCLUE2025年年度测评数学推理总分对比
2026-02-04 14:57:38
42
原图定位
行业数据1
SuperCLUE2025年年度基准测评开源模型总分对比
2026-02-04 14:57:38
29
原图定位
行业数据1
SuperCLUE2025年年度测评智能体(任务规划)总分对比
2026-02-04 14:57:38
31
原图定位
行业数据1
SuperCLUE-2025年年度测评选取了国内外有代表性的23个大模型,
2026-02-04 14:57:38
37
原图定位
行业数据1
国资委79号文件央国企信创替代方案
2024-10-10 08:15:13
21464
原图定位
最新数据
行业数据1
区域洞察 英国
2026-04-02 08:30:00
15
原图定位
行业数据1
全球洞察
2026-04-02 08:30:00
18
原图定位
行业数据1
Q14: Thinking about the future, where do you see AI having the biggest impact in HR in 2026? Multiple responses allowed.
2026-04-02 08:30:00
15
原图定位
行业数据1
The State of AI in Small Business HR: 2026 Industry Report
2026-04-02 08:30:00
17
原图定位
行业数据1
2026年小型企业人力资源人工智能状况报告
2026-04-02 08:30:00
17
原图定位
政策法规1
问题9:您的企业是否有人工智能使用政策?
2026-04-02 08:30:00
14
原图定位
1.海外推理模型推理效能整体上显著领先于国 内推理模型。 高效能区均为海外模型(Claude-Opus-4.5-Reasoning Gemini-3系列),没有国内模型,这3个海外模型在保 持顶尖推理质量的同时能够兼顾推理效率,实现了质 量和速度的双维优化。在中效能区,也只有3个国内模 型:Kimi-K2.5-Thinking、Doubao-Seed-1.8- 251228(Thinking)和Qwen3-Max-Preview-Thinking,其 他国内模型均位于低效能区,反映出国内模型在推理 质量和推理效率的协同优化上仍落后于国际顶尖模型, 还有较大的提升空间。 2.国内模型实现“高性能+高效率”已初步显 以Kimi系列模型为例,从Kimi-K2-Thinking(54.02分, 701.09秒/题)到Kimi-K2.5-Thinking(61.50分,224秒/ 题)的迭代过程中,推理能力提升了近14%,推理速 度也提升了近3倍,充分说明了国内模型正在从性能的 单独优化转向性能+效率协同优化,并且取得了不错的
行业数据
原图定位
相关数据
最新数据