2020年中国FPGA芯片行业研究报告-200131[47页].pdf

上传人:风亭 文档编号:3742 上传时间:2020-07-28 格式:PDF 页数:47 大小:2.65MB
下载 相关 举报
2020年中国FPGA芯片行业研究报告-200131[47页].pdf_第1页
第1页 / 共47页
2020年中国FPGA芯片行业研究报告-200131[47页].pdf_第2页
第2页 / 共47页
2020年中国FPGA芯片行业研究报告-200131[47页].pdf_第3页
第3页 / 共47页
2020年中国FPGA芯片行业研究报告-200131[47页].pdf_第4页
第4页 / 共47页
2020年中国FPGA芯片行业研究报告-200131[47页].pdf_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《2020年中国FPGA芯片行业研究报告-200131[47页].pdf》由会员分享,可在线阅读,更多相关《2020年中国FPGA芯片行业研究报告-200131[47页].pdf(47页珍藏版)》请在三个皮匠报告文库上搜索。

1、1 2020年 中国FPGA芯片行业研究报告 概览标签 :亿门级、非易失性、逻辑单元、数据中心、 ADAS、消费电子 报告提供的任何内容(包括但不限于数据、文字、图表、图像等)均系 头豹研究院独有的高度机密性文件(在报告中另行标明出处者除外)。 未经头豹研究院事先书面许可,任何人不得以任何方式擅自复制、再造 、传播、出版、引用、改编、汇编本报告内容,若有违反上述约定的行 为发生,头豹研究院保留采取法律措施,追究相关人员责任的权利。头 豹研究院开展的所有商业活动均使用“头豹研究院”或“头豹”的商号、商标 ,头豹研究院无任何前述名称之外的其他分支机构,也未授权或聘用其 他任何第三方代表头豹研究院开

2、展商业活动。 报告作者:贾雁 2020/01 2 2019.11 LeadLeo 400-072-5588 头豹研究院简介 头豹研究院是中国大陆地区首家 B2B模式人工智能技术的互联网商业咨询平台 ,已形成集 行业研究 、 政企咨询 、 产业规划 、 会展会 议 行业服务等业务为一体的一站式行业服 务体系,整合多方资源,致力于为用 户提供最专业、最完整、最省时的 行业和企业数据库服务,帮助 用户实现知识共建,产权共享 公司致力于以优质商业 资源共享为基础,利用 大数据 、 区块链 和 人工智能 等技术,围绕 产业焦点 、 热点 问题,基于 丰富案例 和 海量数据 , 通过开放合作的研究平台,汇

3、集各界智 慧,推动产业健康、有序、可持续发展 300+ 50万+ 行业专家库 1万+ 注册机构用户 公司目标客户群体覆盖 率高,PE/VC、投行覆 盖率达 80% 资深分析师和 研究员 2,500+ 细分行业进行 深入研究 25万+ 数据元素 企业服务 为企业提供 定制化报告 服务、 管理 咨询 、 战略 调整等服务 提供行业分析师 外派驻场 服务,平台数据库、 报告库及内部研究团队提供技术支持服务 地方 产业规划 , 园区 企业孵化服务行业峰会策划、 奖项 评选、行业 白皮书 等服务 云研究院服务 行业排名、展会宣传 园区规划、产业规划 四大核心服务: nMoRnNrOtMoMuMoRsOo

4、RmP6McM6MtRpPtRqQeRoOrOiNmOpQ9PqQvMxNnRqQNZsPqN 3 2019.11 LeadLeo 400-072-5588 报告阅读渠道 头豹科技创新网 PC端阅读 全行业、千本 研报 头豹小程序 微信小程序搜索“头豹”、手机扫右侧二维码阅读研报 图说 表说 专家说 数说 详情请咨询 4 2020 LeadLeo 400-072-5588 概览摘要 FPGA(Field Programmable Gate A rray)芯片基于可编程器件(PAL、 GAL)发展而来,是半定制化、可编 程的集成电路。相对全 球集成电路领域超4,600亿美元的市场规模,F PGA

5、市场规模较小,存在增量释放空间。相较赛灵思、 Intel等巨头,中国FPGA 研发 起步晚,但研发进度逐渐赶上(与全球头部厂商相差3 代缩短至接近2代)。本土芯片在产品硬件性能等方面落后于境外高端产品, 但短期在LED显示、工业视觉等领域出货量较高。202 5年后,边缘计算技术及云计算技术在 智慧交通网络、超算中心全面铺开, 自动驾驶、数据中心领域FPGA应用市场成长速度将超过通信、消费电子市场。 5G通信体系建设提高FPGA芯片需求 通信场景是FPGA芯片在产业链下游应用最广泛的场景( 超40%),随5G通信技术发展 、硬件设备升级,FPGA面临强劲增量市场需求 。 FPGA相对CPU、GP

6、U在功耗及计算速度方 面具备优势,通信设备企业将加 大FPGA器件在基站天线 收发器等核心设备中的应用。 自动驾驶规模化商用提升FPGA量产需求 自动驾驶技术逐步发展,智慧交 通市场空间广阔。自动驾驶领域ADAS系 统、传感器系统、车内通信系统、 娱乐信息系统等板块对FPGA 芯片产品产生增量需求,全球头部FPGA 厂商(赛灵思、英特尔等)积 极布局自动驾驶赛道。 FPGA芯片设计复杂度持续提高 2016年至2018年,全球FPGA研发工作针对高性能、高安全性可编 程芯片设计项目比重提高(2018年安全特性模块项目增至52 %),FPGA 设计复杂度日趋提升,具体可以嵌入式处理器 数量增加、异

7、步时钟域数量增 加、安全特性(安全保证 硬件模块)设计增加为证。 企业推荐: 安路科技、智多晶、高云半导体 5 2020 LeadLeo 400-072-5588 目录 名词解释 - 05 中国FPGA芯片行业综述 - 09 FPGA芯片定义及物理结构 - 09 FPGA芯片特点及分类 - 10 FPGA芯片与其他芯片对比 - 11 FPGA芯片行业产业链 - 14 FPGA芯片行业市场规模 - 18 FPGA芯片关键技术 - 19 执行计算密集型任务 - 19 执行通信密集型任务 - 20 FPGA部署模式 - 21 分享服务器网络部署 - 22 数据中心加速层 - 23 eFPGA嵌入 -

8、 24 执行云计算任务 - 25 全球FPGA大厂竞争 - 26 中国FPGA芯片行业驱动因素 - 27 5G通信体系建设提高FPGA芯片需求 - 27 自动驾驶规模化商用提升量产需求 - 28 中国FPGA芯片行业制约因素 - 29 6 2020 LeadLeo 400-072-5588 目录 中国FPGA芯片行业政策法规 - 30 中国FPGA芯片行业发展趋势 - 31 FPGA芯片设计复杂度持续提高 - 31 广泛应用于机器学习强化项目 - 32 中国FPGA芯片行业竞争格局 - 33 竞争格局概述 - 33 TOP10企业排名 - 34 TOP10企业特点 - 35 投资企业推荐 -

9、36 安路科技 - 36 智多晶 - 38 高云半导体 - 40 专家观点:投资建议 - 42 中国FPGA芯片行业价值投资方向 - 42 中国FPGA芯片行业投资逻辑及风险概述 - 43 方法论 - 44 法律声明 - 45 7 2020 LeadLeo 400-072-5588 微处理器: 由一片或少数几片大规模集成电路组成的中央处理器。微处理器可完成取指令、执行指令,与外界存储器和逻辑部件交换信息等操作,是微型计 算机的运算 控制部分,可与存储器及外围电路芯片组成微型计算机。 DSP: Digital Signal Processor,特殊微处理器,是以数字信号处理大量信息的器件。工作原

10、理是接收模拟信号,转换为0或 1的数字信号,再对数字信号进行修改、删除、 强化,并在其他系统芯片中把数字数据解译回模拟数据或实际环境格式。 CMOS: Complementary Metal Oxide Semiconductor,互补金属氧化物半导体,制造大规模集成电路芯片采用的一 种技术,或用该技术制造的芯片。 TTL: Time To Live,指定IP包被路由器丢弃之前允许通过的最大网段数量。 RAM: Random Access Memory,随机存取存储器,是与CPU直接交换数据的内部存储器,可作为操作系统或其他正在运行中程序的 临时数据存储介质,支持随时从任 何一个指定地址写入(

11、存入)或读出(取出)信息,同时具备数据易失性,断电将造成存储数据丢失。 非易失性内存: Non-Volatile Memory,指当电流关掉后,所存储数据不消失的电脑存储器。非易失性存储器可依存储器内数据是否能在使用 电脑时随时改写分为两大 类产品(ROM只读内存、Flash memory闪存)。 门阵列: 半导体厂商在硅片上形成基本单元的逻辑门母板,并基于母版按用户特定需求设计电路布局的半客户定制品芯片,可分为有信道和无信道两种。 SERDES: Serializer(串行器)、DESerializer(解串器),主流的时分多路复用、点对点串行通信技术,多路低速并行信号在 发送端被转换成高速

12、串行信号,经传输媒 体(光缆、铜线)达到接收端,高速串行信号被转换成低速并行信号。 反向设计: 通过对芯片内部电路提取、分析、整理,实现对芯片技术原理、设计思路、工艺制造、结构机制等深入洞悉,可用以验证设计框架、分析信息流 技术问题, 或助力形成新芯片设计、产品设计方案。 正向设计: 以系统工程理论、方法、过程模型为指导,面向复杂芯片产品和系统改进、改型、技术研发、原创设计。 eFPGA: Embedded FPGA,嵌入式FPGA,将一个或多个 FPGA 以 IP 的形式嵌入 ASIC,SoC 等芯片中。 CPLD: Complex Programmable Logic Device,复杂可

13、编程逻辑器件,一种根据用户自身需求而自行构造逻辑功能的数字 集成电路,属于大规模集成电路。 ASIC: Application Specific Integrated Circuit,专用集成电路,是针对用户对特定电子系统的需求,从根级 设计、制造的专有应用程序芯片,其计算能力和计算效率可 根据算法需要进行定制,是固定算法最优化设计的产物。 名词解释 8 2020 LeadLeo 400-072-5588 SDRAM: Synchronous Dynamic Random-access Memory,同步动态随机存取内存,通过同步接口动态随机存取内存 ,在响应控制输入前等待时钟信号以实现存储器

14、和 计算机系统的总线同步。 EMI: Electromagnetic Interference,电磁干扰,电子产品工作时对周边其他电子产品造成干扰,干扰种类包括传导干 扰、辐射干扰。 MCU: Microcontroller Unit,单片微型计算机,将中央处理器频率与规格做适当缩减,并将内存、计数器、USB、A/D转换 、UART、PLC、DMA等周边接口、LCD驱动 电路整合在单一芯片上形成的芯片级计算机,可针对不同应用场合做不同组合控制。 ADAS: Advanced Driving Assistant System,高级驾驶辅助系统。该系统利用各种车载传感器(毫米波雷达、激光雷达 、单

15、双目摄像头以及卫星导航等),在汽车行驶 过程中随时感应周围环境,收集数据,进行动静态物体辨识、侦测与追踪,并结合导航仪地图数据,进行系统运算分析,预先让驾驶者察觉潜在 危险,有效提升汽车驾 驶的舒适性和安全性。 SoC: System on Chip,系统级芯片,有专用目标的集成电路,包含完整硬件系统并嵌入软件全部内容,用以实现从确定系统功能、软硬件 划分,直至完成设计的整个 过程。 流处理: 大数据处理手段,一种面向动态数据的细粒度处理模式。基于分布式内存,对不断产生的动态数据进行处理,具备快速,高效,低延迟等特性。 引脚: 管脚,从集成电路内部电路引出的与外围电路的接线,引线末端通过软钎焊

16、与印制板焊盘形成焊点,引脚整体构成芯片接口。引脚可划分为脚跟 、脚趾、脚侧等 部分。 CAN总线: Controller Area Network,ISO国际标准化串行通信协议,控制器局域网络简称,是国际应用最广泛的现场总线之一。 部分国家(欧洲国家、美国等)将CAN 总线协议设定为汽车计算机控制系统和嵌入式工业控制局域网的标准总线。 基带: 信源(信息源,发射端)发出的没有经过调制(进行频谱搬移和变换)的原始电信号所固有的频带(频率带宽)。 中频: 按频率高低划分时,频段由300KHz到3,000KHz的频率,多数为AM电台。 QSFP: Quad Small Form-factor Plu

17、ggable,四通道SFP接口(QSFP),QSFP是为了满足市场对更高密度的高 速可插拔解决方案的需求而诞生的。 基准时钟: 数字同步网中,高稳定度的全网最高级时钟源。 名词解释 9 2020 LeadLeo 400-072-5588 PCB: Printed Circuit Board,印制电路板,印刷线路板,核心电子部件,电子元器件支撑体及元器件电气连接载体,采用电子印 刷术制作的。 管芯: 集成电路中制造集成块所用芯片。 Tops/W: 1W功耗情况下处理器运算能力性能指标,代表每秒每瓦万亿次计算量。 OpenCL : Open Computing Language,开放运算语言,面向

18、异构系统通用目的并行编程的开放式、免费标准,统一编程环境,便于软 件开发人员为高性能计算服务器、 桌面计算系统、手持设备编写高效轻便的代码,广泛适用于多核心处理器(CPU)、图形处理器(GPU)、Cell类型架构及数字信号处 理器(DSP)等其他并行处理器。 PCIe: Peripheral Component Interconnect Express,高速串行计算机扩展总线标准,属于高速串行点对点双 通道高带宽传输,所连接设备分配独享通道带宽,不共享总 线带宽,主要支持主动电源管理,错误报告,端对端可靠性传输,热插拔及服务质量(QOS)等功能。 DNN: Deep Neural Networ

19、ks,深度神经网络,可分为输入层,隐藏层、输出层,第一层为输入层,最后一层为输出层,中间层皆为 隐藏层。层与层间实现全连接,每 层任一神经元与其它层任一神经元相连。 DDN: Digital Data Network,数字数据网,为用户提供专用中高速数字数据传信道,以便用户组织自有计算机通信网,或用于传输 压缩数字话音、传真信号。 DPDK: Data Plane Development Kit,数据平面开 发套件,由英特尔等公司开发,基于Linux系统运行并用于快速数据包处 理的函数库与驱动集合,可提高数据处理性能 及吞吐量,提高数据平面应用程序工作效率。 IP核: Intellectual

20、 Property Core,知识产权核或知识产权模块,是集成电路可重用设计方法学中针对芯片设计的可重用模 组。IP分为软IP、固IP和硬IP,软IP是用Verilog、 VHDL等硬件描述语言的功能块,不涉及具体电路元件,固IP是综合功能块,硬IP用来提供设计最终阶段产品“掩膜”。 EDA: Electronics Design Automation,以计 算机为工具,设计者在软件平台上用硬件描述语言VerilogHDL完 成设计文件,再由计算机自动完成逻辑编译、化简、分割、 综合、优化、布局、布线和仿真,直至对特定目标芯片完成适配编译、逻辑映射和编程下载等工作。 Mbps: Million

21、 bits per second,传输速率单位,每秒传输位(比特)数 量,1Mbps代表每秒传输1,000,000比特。 算力: 计算机能够完成一个数学程序的速度,如接收任何一组信息,并将其转换成字母和特定长度数字的速度。 时钟电路: 像时钟一样准确运动的振荡电路,多由晶体振荡器、晶震控制芯片和电容组成,可保证任何电路工作按时间顺序进行。 名词解释 10 2020 LeadLeo 400-072-5588 名词解释 深度学习: 一种机器学习算法,学习样本数据的内在规律和表示层次,最终目标是让机器像人一样具有分析学习能力,能够识别文字、图像和声音等数据。 同构数据: 同构分布式数据库,所有站点使

22、用共同数据库管理系统软件,站点间合作处理用户需求,本地站点需放弃数据库管理系统软件部分更改自治权。 异构数据: 异构分布式数据库,不同站点具备不同模式及不同数据库管理系统软件。站点独立工作,站点间仅在事务处理过程中提供有限合作功能。 kernel: 实时操作系统,可迅速接受外界事件、数据并予以处理,处理结果可在规定时间内控制生产过程或对处理系统给予快速响应,调度资源完成实时 任务,并控制 所有实时任务协调一致运行的操作系统。 DMA: Direct Memory Access,直接内存存取,允许不同速度硬件装置沟通,无需依赖CPU大量中断负载,无需CPU将片段资料 从来源复制至暂存器,支持CP

23、U同时进 行其他工作。 DRAM: Dynamic Random Access Memory,动态随机存取存储器,半导体存储器,利用电容内存储电荷多寡代表二进制比特。 ALU: Arithmetic and Logic Unit,算术逻辑单元,能实现多组算术运算、逻辑运算的组合逻辑电路。 Cache: 高速缓冲存储器,位于CPU和主存储器DRAM之间,规模较小,运行速度较高,多由SRAM(静态存储器)组成。CPU速度远高于内存 ,CPU直接从内存中存取 数据时需特定等待时间周期,Cache可保存CPU使用过或循环使用的部分数据,CPU可从Cache中直接调用保存的数据,鸡儿避免 重复存取,减少

24、CPU等待时间,提高系 统效率。 显存: 帧缓存,用于存储经显卡芯片处理或即将提取的渲染数据,类似计算机内存。 T&L: Transforming and Lighting,光影转换,图形加速卡中处理图形整体角度旋转及光源阴影等三维效果。 PiexlShader: 像素处理器,负责渲染过程中像素级效果运算,如折射,漫反射,泛光,非正常暴光等,PiexlShader运算数据为高精度浮点型,无 法通过CPU直接进行模 拟运算。 浮点运算: 实数运算,计算机只可存储整数,实数为约数,浮点运算较慢且存在误差。 PaaS: Platform as a Service,平台即服务,将云计算时代相应服务器平

25、台或开发环境作为服务进行提供的商业模式。 NRE: Non-Recurring Engineering,一次性工程费用,集成电路生产成本中非经常性发生的开支,新集成电路产品研制开发 费、工艺加工、测试分析等费用。 11 2020 LeadLeo 400-072-5588 中国FPGA芯片行业综述FPGA芯片定义及分类(1/2) FPGA芯片定义及物理结构 FPGA(Field Programmable Gate Array)芯片基于可编程器件(PAL、GAL)发展而来,是 半定制化、可编程 的集成电路。 发明者: 赛灵思联合创始人Ross Freeman 于1984年发明FPGA集成电路 结构

26、。全球第一款 商用FPGA芯片 为 赛灵思XC4000系列 FPGA产品。 FPGA芯片按固定模式处理信号,可执行新型任务 (计算任务、通信任务等)。FPGA芯片相对专 用集成电路(如ASIC芯片)更具灵活 性,相 对传统可编程器件可添加更大规模电路 数量以实现多元功能。 物理结构: FPGA芯片主要由三部分组成,分别为 IOE(input output element,输入输出单元)、 LAB(logic array block,逻辑阵列块,赛灵思 定义为可配置逻辑块CLB)以及 Interconnect(内部连接线)。 来源:berkeley wireless group,阿尔特拉官网,头

27、豹研究院编辑整理 FPGA芯片由三部分结构组成 输入输出单元 ( IOE) 逻辑阵列块 ( LAB) 内部 连接线 ( Interconnect) 连接芯片与外部电路的物理接口 基本接口(LVTTL/LVCMOS) 差分接口(PCI/LVDS/RSDS) 完成输入/输出信号驱动与匹配 FPGA芯片基本单元 数量、特性根据采用器件不同各异 内部连接线包括寄存器间连接线、行间 连接线、直接线、本地内部连接线等 内部连接线可根据逻辑网表拓扑结构形 成,设计方式决定布线资源利用效率 LAB结构 (Altera设计) IOE结构 (Altera设计) FPGA芯片作为专用集成电路(ASIC)领域中半定制

28、电路面市,克服定制电路灵活度不 足的问题以及传统可编程器件门阵列数有限的缺陷 12 2020 LeadLeo 400-072-5588 FPGA芯片分类 FPGA芯片具备以下特点: 设计灵活: 属于硬件可重构的芯片结构 ,内部设置数量丰富的输入 输出单元引脚及触发器。 兼容性强: FPGA芯片可与CMOS、TTL等大 规模集成电路兼容, 协同完成计算任务。 并行计算: FPGA内部结构 可按数据包步骤多少搭建相应数量流 水线,不同流水线处 理不同数据包,实现 流水线并行、数据并行 功能。 适用性强: 是专用电路中 开发周期最短、应用风险最低 的器件之一(部分客户无需投资研发 即可获得适用FPG

29、A芯片)。 地位提升: 早期 在部分应用场景是 ASIC芯片的批量替代品 ;近期随微软等头部互联网企业 数据中心规模扩大,FPGA芯片应用范围扩大。 FPGA芯片特点 中国FPGA芯片行业综述FPGA芯片定义及分类(2/2) 芯片类别 结构 配置信息 系统安全 其他优势 Flash类 编程单元为 单管结构 需从外部器件 加载配置信息 安全性高,硬件 出错几率小 Flash中集成非易失性存储器可应用于消费电 子及汽车电子领域;基于Flash的 FPGA芯片采用内部电荷泵进 行编程,工作频率可达 350MHz,利用率可超 95% SRAM类 采用 6管结构 进 行开关控制 加载电流前配 置信息即有

30、效 安全性一般 基于SRAM的FPGA芯片利用率达到 70%至 75%,加电时可达到瞬间高峰电流, 相对Flash类芯片具备更 高静态功耗、更高动态功耗 FPGA厂商主要提供基于两种技术类型的FPGA芯片: Flash技术类 、 SRAM技术类 (Static Random-access Memory,静态随机存取存储器)。 两类技术均可实现系统层面编程功能 ,具备较高计算性能,系统门阵列密度均可超过 1兆 。 核心区别: 基于Flash的可编程器件 具备非易失性特征 ,即电流关闭后,所存储数据不消失。 基于SRAM技术的FPGA芯片 不具备非易失性特征 ,是应用范围最广泛的架构。 不同类别F

31、PGA芯片特点 来源:阿里巴巴官网,Berkeley Wireless Group,头豹研究院编辑整理 基于Flash技术 (单管结构) 基于SRAM技术 (6管结构) FPGA芯片在实时性(数据信号处理速度快)、 灵活性等方面具备显著优势,在深度学 习领域占据不可替代地位,同时具有开发难度高的特点 13 2020 LeadLeo 400-072-5588 FPGA芯片相较于CPU芯片 中国FPGA芯片行业综述FPGA芯片与其他主流芯片对比(1/3) CPU为通用型器件,FPGA架构相对CPU架 构偏重计算效率,依托FPGA并行计算处理视 觉算法可大幅提升计算速率,降低时延 CPU处理计算指令

32、流程: CPU通过专用译码器接收任务指令,接收过程分为两步: 指令获取 (CPU从专门存放指令的存储器中提取执行指令)以及 指令翻译 (根据特定规则 将指令翻译为数据并传输至计算单元) 。其中计算单元为 晶体管 (CPU基本元件),“开”、“关”分别对应“1”、“0”机器码数字。 CPU处理计算指令特点: CPU物理结构包括Control(指令获取、指 令翻译)、Cache(临时指令存储器)、 计算单元ALU(约占CPU空间 20%)。 CPU为通用型计算任务处理核心,可处理 来自多个设备的计算请求,可随时 终止当前运算,转向其他运算。 逻辑控制单元及指令翻译结构较为复杂,可从 中断点继续计算

33、任务, 为实现 高度通用性 而牺牲计算效率 。 CPU视觉算法与FPGA视觉算法比较: CPU架构: CPU用于处理视觉算法需 按指定顺序执行指令 ,第一 指令在图像整体运行完成后, 第二指令开始运行。在 4步操作 指 令环境下,设定单个操作指令运行需 10毫秒 ,完成总算法耗时 约 40毫秒 。 FPGA架构: FPGA用于处理视觉算法 采取规模化并行运算模式 , 可于图像不同像素内同时运行 4步操作 指令。设定单个操作操作 指令运行需 10毫秒 ,FPGA完成图像整体视觉算法处理时间仅为 10毫秒 ,FPGA图像处理速度显著快于CPU。 “FPGA+CPU”架构: 此架构下,图像在CPU与

34、FPGA之间传输, 包含传输时间在内的算法整体处理时间 仍低于纯CPU架构。 算法案例: 以卷积滤镜图像锐化计算任务为例,系统需通过阈值 运行图像生产二进制图像。CPU 架构下,系统需在阈值步骤前完 成图像整体卷积步骤,FPGA则支持相同算法同时运行, 相对 CPU架构,卷积计算速度提升约 20倍 。 FPGA并行计算相对CPU 可提升视觉算法计算效率 来源:act视觉系统设计,头豹研究院编辑整理 操作指令1 10毫秒 操作指令2 10毫秒 操作指令3 10毫秒 操作指令4 10毫秒 CPU 总计算时长 40毫秒 CPU处理器 操作指令1 操作指令2 操作指令3 操作指令4 FPGA CPU

35、卸载计算至 FPGA FPGA总计算时长 10毫秒 1毫秒 1毫秒 FPGA传递 计算结果至 CPU 传输时延2毫秒 14 2020 LeadLeo 400-072-5588 FPGA芯片相较于GPU芯片 中国FPGA芯片行业综述FPGA芯片与其他主流芯片对比(2/3) GPU作为图形处理器件,计算峰值较高,远期 在机器学习领域(多指令平行处理单一数 据),FPGA相对GPU在灵活性、功耗方面更胜一筹 来源:图像处理知识库 ,头豹研究院编辑整理 FPGA并行计算相对GPU更适于新 型DDN常规及非常规计算任务 GPU物理结构: GPU为图形处理器,针对各类计算机图形绘制行为进行运算(如顶点设置

36、、光影操作、像素操作等),标准GPU包括2D引擎、3D引擎、 视频处理引 擎、显存管理单元等。其中,3D引擎包含T&L单元、 PiexlShader等。 GPU处理计算指令流程: 顶点处理:GPU读取3D图形顶点数据,根据外观 数据确定3D图形形状、位置关系, 建立3D图形骨架 。 光栅化计算:显示器图像由像素组成, 系统需将图形点、线通过算 法转换至像素点。 矢量图形转换为像素点 为光栅化计算过程。 纹理贴图:通过纹理映射对多变形表面 进行帖图处理,进而 生成真实图形 。 像素处理:GPU对光栅化完成的像 素进行计算、处理, 确定像素最终属性 ,多通过Pixel Shader(像素着色器)完

37、成。 GPU与FPGA特点对比: 峰值性: GPU计算峰值( 10Tflops)显著高于FPGA计算峰 值( 小于1TFlops )。GPU架构依托深度流水线等技术可基 于标准单元库实现 手工电路定制 。相对而言,FPGA设计资 源受限, 型号选择决定逻辑资源上限 (浮点运算资源占用 较高),FPGA逻辑单元基于SRAM查找表,布线资源受限。 内存接口: GPU内存接口(双倍数据传输率存储器等)带 宽 优于FPGA 使用的DDR(双倍速率同步动态随机存储器) 接口,满足机器学习频繁访问内存需求。 灵活性: FPGA可根据特定应用编程硬件,GPU设计完成后 无法改动硬件资源,远期机器学习 使用多

38、条指令平行处理 单一数据 , FPGA硬件资源灵活性更能满足需求 。 功耗: GPU平均功耗( 200W)远高于FPGA平均功耗 ( 10W),可有效解决散热问题。 FPGA体系由一系列可配置资源构成 可满足高度客制化需求 FPGA客制化能力可支持精确度较低、 分散、非常规深度神经网络计算需求 随机深度神经网络 FPGA 浮点 计算单元 SRAM (2.5KB) 海量可编程 逻辑块/布线 客制化比特宽度, SRAM组合 (spad、fifo)等 M20K M20K M20K 15 2020 LeadLeo 400-072-5588 中国FPGA芯片行业综述FPGA芯片与其他主流芯片对比(3/3

39、) FPGA芯片相较于ASIC芯片 ASIC芯片专用度高,开发流程非重复成本(流片)极 高,5G商用普及初期,FPGA可依 托灵活性抢占市场,但规模化量产场景下,ASIC芯片更具竞争优势 来源:半导体行业联盟,头豹研究院编辑整理 ASIC与FPGA开发流程区别: ASIC需从标准单元进行设计,功能需求及性 能需求发生变化时,ASIC芯片 设计需经历重新投片,设计流 程时间成本、经济成本较高。 FPGA包括预制门和触发器,具备可编 程互连特性,可实现芯片功能重 新配置。相对而言,ASIC 芯片较少具备重配置功能。 ASIC与FPGA经济成本、时间成本区别: ASIC设计过程涉及固定成本,设计过程

40、造成 材料浪费较少,相对FPGA重复 成本较低,非重复成本较高( 平均超百万美元 )。 FPGA重复成本高于同类ASIC芯片, 规模化量产场景下,ASIC芯片单位 IC成本随产量增加持续走低, 总成本显著低于FPGA芯片。 FPGA无需等待芯片流片周期,编程后可直 接使用,相对ASIC有助于企业 节省产品上市时间 。 技术未成熟阶段,FPGA架构支持灵活改变芯片功 能,有助于降低器件 产品成本及风险, 更适用于5G商用初期的市场环境。 计 算 效 率 Mbps/mW 1,000 100 10 1 0.1 0.01 计算效率更高 灵活度更高 FPGA ASIC 微处理器水平 处理器 数量 DSP

41、水平 专用硬件水平 123456789101121314 1615 总 成 本 FPGA ASIC 处理器数量 NRE T代芯片 成本交叉点 T+1代芯片 成本交叉点 FPGA方案相对ASIC方案计算性能 比较 FPGA方案及ASIC方案成本比较 达到量产规模前, FPGA占据成本优势 16 2020 LeadLeo 400-072-5588 头 部 国际企业 中国企业 中 部 其 他 中国FPGA芯片行业综述中国FPGA芯片行业产业链分析 来源:头豹研究院编辑整理 产品形式 芯片搭配算法 平均售价百元 FPGA模块 (整合画面识别等) 平均售价 超1,000元 终端产品设计 (整合摄像头等) 自动驾驶 视觉工业 数据中心 汽车电子 移动通信 其他 算法成本 100万-200万 IP核授权 基本授权费+版税 (约芯片价格2%) 晶圆成本 12寸晶圆 平均每片 100美元 晶圆代工 底层算法设计 其他 基础 材料 设备 其他 EDA软件 OrCAD单功能 最高接近8,000 美元 下游中游上游 应用场景 中游龙头FPGA企业(赛灵思、Intel)在全球市场 及中国市场均占据垄断地位。 中国FPGA芯片行业产业链由上游底层算法设计企业、EDA工具供应 商、晶圆代工厂、专用材料及设备供应 商,中游各类FPGA芯片制造

展开阅读全文
相关资源
猜你喜欢
资源标签

当前位置:首页 > 电子行业 > 中国芯片

关于我们                               联系我们


copyright@ 2008-2013        长沙景略智创信息技术有限公司版权所有
网站备案/许可证号:湘ICP备17000430号-2