Intel FPGA技术大会分享

9月8日,Intel FPGA技术大会(IFTD)在杭州举办,我和鹏起共同参加了这次技术大会。会上Intel对FPGA未来发展的技术路线和应用场景进行了介绍,并且给我们带来了应用在未来FPGA上的一些新技术。本文着重介绍未来的FPGA和基于FPGA的硬件平台会具有哪些新的功能和特点,以及这些功能和特点对我们互联网企业和云计算的价值。

什么是FPGA

首先向大家介绍一些什么是FPGA。FPGA(Field-Programmable Gate Array)是现场可编程门阵列的英文缩写。简单来说,FPGA就像是一块空白的数字电路,开发者可以通过编写硬件代码的方式来设计一个数字电路,代码编写完成后,类似软件代码中的编译过程,FPGA的综合器会对代码进行综合、布局布线,之后会生成一个二进制文件,将这个二进制文件烧写到FPGA后,原本空白的FPGA就变成了开发者设计的电路,这就是“现场”和“可编程”的含义。同时,FPGA可以反复擦写,通过烧写不同的二进制文件来实现不同的功能。

因此,FPGA是介于专用集成电路(ASIC)和处理器之间的一种硬件。长期以来,FPGA广泛应用于信号处理、ASIC验证等领域。由于FPGA具有高度可定制的特点,因此在FPGA上做计算具有“天然”的并行性,同时,FPGA还具有低功耗的特点。近年来,随着深度学习等计算密集型业务的发展,FPGA并行计算的特性和低功耗的特点受到了互联网企业的关注,越来越多的人在研究如何在数据中心中发挥FPGA的优势。

Xilinx和Altera是世界上最大的两家FPGA厂商,两家厂商共同占据了FPGA市场将近90%的市场份额。在2015年,Intel以167亿美元,11%的溢价完成了对Altera的并购,并购后的Altera成为Intel可编程技术事业部。此次并购足以见得Intel非常看重FPGA在其生态体系中的作用,可以从中看到Intel携手FPGA进军数据中心的决心。下图为一Altera的FPGA芯片。

在这样的背景下,Intel在本次FPGA技术大会上给大家了新一代FPGA产品的特性和FPGA未来发展的蓝图。

FPGA的优势与不足

在介绍新一代FPGA之前,我们先回顾一下传统FPGA在数据中心和互联网的业务场景下都有哪些优势与不足。

优势

低功耗与性能价格比

低功耗是FPGA最引人注目的优势。FPGA计算的绝对性能并不如GPU,但是企业级GPU的功率通常高达数百瓦,而FPGA的功率可以低至20w以下。低功耗带来的直接收益是省电,而在数据中心中,低功耗的意义不仅仅是省电。一台服务器在机房中消耗的成本里,机柜成本占有相当大的比例。通常来说,一整个机柜的成本是固定的,并且具有一个功率上限,因此,机柜中放的机器越多,单个机器平摊下来的机柜成本就越低。由于GPU的功耗很高,一个机柜仅仅能够承受寥寥数台GPU机器的功耗,导致GPU机器的单机成本很高。而FPGA机器功耗低,机柜密度可以做大,从而减低FPGA机器的单机成本,因此,虽然FPGA计算的绝对性能不如GPU,但FPGA在性能价格比方面具有潜在的优势。对于云计算来说,FPGA能够很好地满足这对价格和成本更加敏感的用户需求。

计算并行性与流水线

FPGA设计可以做到全定制,设计者可以精确控制FPGA内部所有的逻辑单元、寄存器和数字运算单元在任何一个时钟周期的行为。因此,FPGA上所有的运算单元都可以同时工作,在计算时具有天然的并行性。除此之外,开发者还可以精确地控制流水线,最大程度地对计算单元加以利用。FPGA在计算方面具有的并行性,使其适用于以深度学习为代表的各种并行计算的业务场景。

可重置与弹性

FPGA内部的逻辑可擦写,可以通过烧写不同的二进制文件来使FPGA实现不同的功能。相比于ASIC加速方案,FPGA可重置的特性显然使其更加灵活。更加重要的是,可重置的特性使得FPGA支持的服务具有弹性,比如当某个业务的高峰期到来时,FPGA可以刷新成支持该业务的加速核,当高峰期过去后,FPGA再刷新成其他功能,支持其他业务。弹性是云计算至关重要的特性,相信FPGA的弹性对于服务云端的业务具有很大的潜力。

不足

浮点计算

多数的计算场景中数据类型都是浮点型,比如深度学习、地球物理、流体力学甚至基因计算、高频交易等。而传统的FPGA中并没固化在FPGA内部的浮点运算单元。传统FPGA中的运算单元都是定点的,如果需要浮点运算,必须利用定点的计算单元和逻辑资源去构建“软”的浮点运算器,用这种方法在FPGA做浮点运算不仅仅无法获得良好的计算性能,还会占用大量的资源。

存储与带宽

FPGA片内有存储资源,在FPGA内部,数据可以非常灵活地在计算单元和存储单元之间转移。但是FPGA片上的存储资源极为有限,典型的大小为50Mbit左右。有限的容量远远无法满足数据庞大的计算密集型业务。通常只能通过外挂DDR来弥补存储资源的不足,但外挂DDR后,访存的带宽往往会成为计算的瓶颈。

时钟频率

FPGA的另一个弱势是时钟频率过低。无论是CPU还是GPU,主频的频率动辄在2到3GHz甚至更高,而FPGA工作的典型频率在200-400MHz之间,由此可见,较低的时钟频率成为制约FPGA性能的因素之一。

新一代FPGA特性

在此次大会中,Intel为我们带来了新一代FPGA的介绍,可以看出,为了使FPGA更具有竞争力,Intel对FPGA的不足之处进行了针对性的改进。10系列的FPGA是Altera最新一代的FPGA,其中Arria系列是Altera的中端系列,更注重性价比,Stratix系列是Altera高端定位的FPGA,具有更好的性能。Arria10系列的产品已经量产并且上市,Stratix10系列计划在明年上市。

浮点DSP硬核

为了解决FPGA浮点运算的问题,Altera在其Arria10系列的产品中推出了业界第一款带浮点硬核的FPGA。相比于用逻辑资源和整形运算单元组合成的浮点运算软核,固化在FPGA内的硬核经过优化与定制,具有更强的性能。以Arria10GX1150这款FPGA为例,其内部具有1500个以上的浮点硬核,同系列FPGA最高浮点性能可以达到1.5TFLOPS。在Stratix10系列的FPGA中,DSP数量最多可达5000个以上。

HyperFlex架构大幅度提高时钟频率

在传统的FPGA中,时钟频率受限于关键路径,有限的资源导致的布线拥塞会使得信号在关键路径上的时延增加,从而降低了时钟频率。通过时序重排的方法理论上可以一定程度上解决时序问题,但是使用这种方法需要依赖额外的寄存器,但寄存器的数量是有限的且位置固定,这使得时序重排的方法只能发挥有限的作用。Stratix10 FPGA采用HyperFlex架构,在这种架构中,FPGA内部增加了大量的可旁路寄存器,在这些旁路寄存器的帮助下,时序重排方法可以最大程度地发挥作用,较少信号在关键路径上的延时,从而提高FPGA的时钟频率。在Stratix10的时钟频率相较于传统的FPGA可以提高2倍以上。结合5000+的浮点DSP,Stratix10的单精度浮点性能可达10TFLOPS。

系统级封装技术(SiP)

由于FPGA片上存储资源很少,通常需要通过外挂DDR的方法解决存储资源不足的问题,在这种情况下,访问带宽往往成为瓶颈。Stratix10采用SiP技术,将HBM(High Bandwidth Memory)和FPGA封装到一起,在这种结构中,存储资源从片外到了封装内,从板内互联变成封装内互联,大幅度提高了FPGA访存的带宽,和传统的外挂DDR相比,Stratix10的访存带宽可以提高10倍。

工艺

Intel并购Altera后,Stratix10系列的FPGA将使用Intel 14nm的工艺。在14nm工艺中FPGA资源的密度更高,单位面积上集成的资源会更多。同时,作为IC界的老大,Intel的半导体工艺非常成熟,成熟的工艺也使得流片的良率提高,降低FPGA的成本。同时,Stratix10可以支持更低的供电电压,在Intel的工艺中FPGA的半导体参数也可以进一步调优,更低的电压和更优的参数会使Stratix10的功耗进一步降低。低成本和低功耗进一步增强了FPGA在计算的性能价格比方面的优势。

智能FPGA

除了上述的特性之外,Altera还对未来FPGA的规划了智能特性。比如,传统的FPGA在下载和调试时依赖很多现场操作。而未来的FPGA会具有远程控制和调试的功能,便于对FPGA进行远程原理,增强了FPGA的可运维性。同时,FPGA将来还可以支持资源监控的功能,比如监控DDR带宽,cache miss等。

从此次Intel介绍的FPGA未来的技术路线上可以看出,Intel携手Altera投入了大量的资源,非常有针对性地对FPGA当前的弱点进行了弥补。Stratix10系列的FPGA非常值得我们期待。

CPU+FPGA平台

Intel并购Altera后,另一大亮点是Intel将推出CPU+FPGA架构的硬件平台,本次大会Intel也为我们带来了该平台的最新介绍。该平台预计于2017年量产,届时,一片Skylake架构的Xeon CPU和一片Stratix10的FPGA将“合二为一”,在流片时就将两者集成在一起,彻底打破两者之间的界限,使FPGA获得高带宽、低延迟的数据通路,这使得FPGA能够更紧密地为CPU提供加速功能。在这种形态中,FPGA加速核不再作为外部设备,而是本身就成为了CPU的一部分,更够更友好地被CPU开发者利用,甚至在未来,CPU地开发者都不必“感知”到FPGA的存在就可以充分利用FPGA来加速自己的业务。

然而,CPU+FPGA的平台对我们阿里云技术创新团队来说已经不陌生,我们团队早在一年多以前就多Intel的CPU+FPGA平台展开了预研。目前已经做了RSA加解密和深度学习方面的加速研究。具体情况欢迎大家咨询阿里云HPC团队的以亭、鹏起和甘泽。

总结

由于FPGA在功耗、性能价格比方面具有的竞争力,进军数据中心成为FPGA发展方向之一,Intel在并购Altera后,也对FPGA投入了大量的资源。Intel在本次Intel FPGA技术大会上为我们介绍了新一代FPGA的强大功能和潜在的应用场景,相信FPGA在未来应用值得我们期待。我们技术创新团队已经对FPGA做了很多研究工作,在未来我们会投入更多的资源,更加深入地对FPGA的应用和优化展开研究。

注:CPU+FPGA平台的图片来自互联网

时间: 2016-09-29

Intel FPGA技术大会分享的相关文章

MongoDB最佳实践及性能优化(DTCC中国数据库技术大会分享PPT)

云数据库 MongoDB 版 基于飞天分布式系统和高性能存储,提供三节点副本集的高可用架构,容灾切换,故障迁移完全透明化.并提供专业的数据库在线扩容.备份回滚.性能优化等解决方案. 了解更多 上周五在北京DTCC分享了「32 Tips to Boost MongoDB Performance」,本文是分享的PPT以及重要内容的注解. 注解:本次分享主要「自底向上」的介绍提升 MongoDB 服务性能需要注意的问题,从硬件.操作系统.服务端一直到应用端,前面3个层次的建议主要面向DBA及运维人员,

LiveVideoStackCon 2017 打造最专业的音视频技术大会

10个年头前--2007年1月,乔布斯在Macworld大会上公开了第一代iPhone,时至今日这台电子设备在全球各地已经售卖出超过12亿台.随处可用的WiFi.3G.4G网络,让iPhone成为连接世界的有效工具.你也许没有听说过WebRTC.HEVC.HLS,但你肯定知道FaceTime.YouTube.微信,这些流行的应用离不开许多多媒体技术的支撑.我们的世界已经被网络.移动设备和各种多媒体应用连接着. 2017年10月,由LiveVideoStack社区主办的LiveVideoStack

GNTC全球网络技术大会盛大开幕 新技术·新架构·新网络引领未来

2016年12月7日,由下一代互联网国家工程中心主办的GNTC全球网络技术大会于北京盛大开幕.­围绕"新技术.新架构.新网络"这一主题,近百位行业权威专家通过主题演讲.圆桌论坛.展览展示等多种形式,分享最前沿的技术演讲,探讨全球网络发展趋势.一场代际跃迁.开放融合的网络重构革命浪潮已呼之欲出,势必将影响产业链的方方面面,为全球网络带来超乎想象的全新机遇与挑战. GNTC全球网络技术大会受到了业内的强烈关注,大会现场火爆异常.据下一代互联网国家工程中心副主任张旭东介绍,大会线上报名观众超

GPU技术大会:异构技术构建云计算平台

2011年由英伟达(NVIDIA)公司主办的GPU技术大会亚洲站(GTC Asia)隆重开幕,该大会主要探讨的话题是热门的"GPU计算"等,本次会议邀请了高性能计算领域顶级科学家分享GPU计算中最新的科学研究及其商业应用,尤其是GPU计算落地中国的最新成果.大会第二天12月15日,记者参加了由产品总监戴荣发表了主题为"使用异构技术构建云计算平台"的报告. 本次报告中,戴荣重点谈到了四点,第一是异构计算与云计算介绍;第二.曙光GPU技术:服务器产品线GPU监控.GPU

2014中国大数据技术大会圆满落幕

2014年12月12-14日,作为大数据领域最具影响.规模最大的IT盛会--2014中国大数据技术大会暨第二届CCF大数据学术会议在北京新云南皇冠假日酒店圆满落幕.大会历时三天,以国际化的视野,分享了海内外大数据技术的发展趋势:从技术与实践角度探讨"大数据生态系统"."大数据技术"."大数据应用"."大数据基础设施 "等新技术应用和实践经验:通过创新大赛和培训课程等特色活动,解密大数据创业热点,分享行业实战经验.2014中国大

中国大数据技术大会走向新阶段

摘要: 由中国计算机协会(CCF)主办,CCF大数据专家委员会协办,中科院计算所与CSDN共同承办的第七届中国大数据技术大会(Big Data Technology Conference 2013,BDTC 2013) 将于2013年12月5-6日在北京世 由中国计算机协会(CCF)主办,CCF大数据专家委员会协办,中科院计算所与CSDN共同承办的第七届中国大数据技术大会(Big Data Technology Conference 2013,BDTC 2013)将于2013年12月5-6日在北

Docker实践者不能错过2014 Container技术大会的九大理由!

摘要:2014年10月18日,CSDN&<程序员>主办的2014 Container技术大会将在北京召开,目前议题已经基本确定.为帮助更多同学进一步了解本次大会,主办方总结了技术团队不应错过2014 Container技术大会的九大理由. Container技术已经出现了十几年,但直到2013年Docker项目的出现,才逐渐火热起来,广为人知.如今,Docker拥有超过500个代码贡献者,20个核心Maintainer,超过8000个创建在GitHub上的Docker相关项目,30多个

数据库技术大会

在本届数据库技术大会中,众多数据库领域资深专家将围绕数据库架构设计.基于数据库应用开发.数据库运维管理等主题展开深入的探讨,来自新浪.百度.阿里巴巴等IT巨头的讲师届时也将与大家分享数据库领域最先进的技术经验和趋势.盛拓传媒CEO秦致指出,"目前国内互联网经济形势大热,团购.社交等网络企业成长速度惊人,传统行业的信息化进程也相当快,数据库在业务发展中扮演的角色越来越重要,特别是现阶段企业的信息化的建设过程当中,数据库的使用已经成为企业信息化的'根'."去年的首届数据库技术大会,参会规模

图文:Intel开源技术中心北京研发总监杨继国

图为:"开源中国,开源世界"高峰论坛现场,Intel开源技术中心北京研发总监杨继国演讲.(胡秀岩/摄 新浪网) "开源中国,开源世界"高峰论坛及圆桌会议于6月29-30日在北京召开,论坛由中国开源软件推进联盟主办.全球顶尖的开源软件专家.大师.IT企业高管.开源社区的负责人.开源倡导者.爱好者以及国内相关政府主管.业内专家和主要用户群体参加会议.新浪科技全程直播. 以上图为:"开源中国,开源世界"高峰论坛现场,Intel开源技术中心北京研发总监杨