2024年更新的部分重点大模型产品,其中采用MoE架构的显著增多
2024-05-31 08:15:49
457
相关数据
其它1
2024公司发布MoE具身大模型萤石蓝海大模型
2025-09-08 13:56:29
102
原图定位
行业数据1
MoE模型训练时仅激活一部分专家及参数
2025-06-10 13:45:05
172
原图定位
行业数据1
MoE模型训练时仅激活一部分专家及参数
2025-05-22 13:39:26
201
原图定位
行业数据1
元象MoE效果超越同期多个同类模型
2025-05-06 13:44:48
196
原图定位
产业概述1
MoE架构下GPU通信机制的迭代历程
2025-03-17 13:47:35
206
原图定位
行业数据1
图7.EPLB两层混合专家(MoE)模型示例
2025-03-03 13:45:46
231
原图定位
行业数据1
MoE模型训练时仅激活一部分专家及参数
2025-02-08 13:45:10
283
原图定位
行业数据1
DeepSeekMoE与传统MoE架构比较
2025-02-06 15:57:05
265
原图定位
行业数据1
发布会上英伟达表示GB200的GPT-MoE推理性能能够达到H200的30倍
2024-11-29 09:56:51
331
原图定位
其它1
Jamba架构(左)吸收了Mamba+Transformer+MoE多种技术
2024-07-02 08:16:43
361
原图定位
其它1
国内外典型MoE模型比较
2024-07-02 08:16:43
387
原图定位
其它1
MoE的理念起源(专家和门控网络系统)
2024-07-02 08:16:43
316
原图定位
其它1
国内外典型MoE模型比较
2024-06-05 08:15:02
573
原图定位
其它1
V-MoE与ViT图像处理性能对比
2023-12-11 08:15:39
293
原图定位
行业数据1
国资委79号文件央国企信创替代方案
2024-10-10 08:15:13
21487
原图定位
最新数据
行业数据1
图11 联合国全球数字和可持续贸易便利化调查评分,2025年
2026-04-03 08:30:00
25
原图定位
行业数据1
图10 印度尼西亚针对其前10大出口产品进入美国市场的主要竞争者及其最新的相应关税水平
2026-04-03 08:30:00
24
原图定位
行业数据1
图9 “最坏情况”贸易战对价格的影响,2025 到 2030 年
2026-04-03 08:30:00
18
原图定位
行业数据1
图 8 “最坏情况”贸易战对印度尼西亚前10大农业食品下游需求部门的影响,2025年至2030年
2026-04-03 08:30:00
13
原图定位
行业数据1
图6 印尼对美国的农业出口,2010年至2024年
2026-04-03 08:30:00
18
原图定位
行业数据1
图7 受到美国互惠关税影响最大的五种农业食品产品
2026-04-03 08:30:00
15
原图定位
国内众多厂商更新产品采用 MoE 架构。2024 年 1 月,MiniMax 发布了国内首个基于 MoE 架构的 abab 6,3 月开始更多新发布或者更新的模型公开其采用了MoE架构,至少有包括阶跃星辰、通义千问(Qwen1.5-MoE-A2.7B)、面壁智能(MiniCPM-MoE-8x2B、商汤科技(“日日新 SenseNova 5.0”)、DeepSeek-V2 等,而这些模型在能力水平上也接近或者超过 GPT-4,但在参数量和成本上并未达到很高的水平。
其它
原图定位
相关数据
最新数据