主页 > 互联网+ > 正文

OpenCAPI:突破传统计算世界的维度藩篱

2020-01-18 16:44来源:99科技综合编辑:时寒峰

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

  原标题:OpenCAPI:突破传统计算世界的维度藩篱

  云计算、万物互联、大数据分析,以及不断涌现的人工智能等,对应用负载提出了越来越高的期待,企业对于系统性能的要求自然也是水涨船高。

  在传统轨迹上,挤牙膏式地对处理器进行加强是多年来的不二法门。然而时过境迁,支撑处理器的摩尔定律已经接近边缘尽头,在多元化且近几何级的计算需求面前,应用负载更需要进入全新的、系统级别的提升。

  对异构计算的探索跋涉就是一种对于计算性能瓶颈的突破。异构计算是一种特殊形式的并行和分布式的计算,它通过引入GPU、ASIC、FPGA或其它加速器,配合CPU去执行各自最擅长的任务,从而实现计算性能和成本的最优化。

  以异构计算为基础的计算系统能够打破 CPU 和外围设备间数据传输的瓶颈,让更多的硬件设备参与计算,如用专用硬件完成密集计算或者外设管理等,从而显著提高系统性能。

  作为异构计算领域的开拓者,IBM这些年来也一直在探索更高带宽、更低延迟的异构计算接口,减少CPU和异构核心之间的接口的传输能力对异构计算性能优势的限制。

  2013年,IBM推出第一代CAPI 1.0接口(Coherent Acceleration Processor Interface 1.0),同时,为了加速OpenCAPI的应用,IBM与几家顶级的国际化公司(包括AMD、Google、IBM、Mellanox、Micron、Xilinx)建立了独立的标准化组织OpenCAPI,在异构计算的潮流中致力于推动高速硬件接口设计全面进入内存一致性时代。如今第三代CAPI接口开放给更多的异构计算开发者使用,名为OpenCAPI接口。

  需要强调的是,虽然OpenCAPI首发于POWER9,但是它的设计特性并没有绑定在POWER架构上,完全可以嵌入到其他种类的处理器架构之上。

  OpenCAPI接口能够有效地分担CPU的负荷,为客户提供一种可订制、高效易用的硬件加速解决方案——这一原始定义非常朴素,但方寸之间,深不见底,它是新一代异构计算的基础设施。

  从2018年开始,通过在中国举办OpenCAPI异构计算大赛,IBM希望来自高校的理工学子能够通过了解OpenPOWER和OpenCAPI进一步实践异构计算,在未来逐渐成长为科技创新的储备军和中坚力量。

  2019年鸣锣的OpenPOWER + OpenCAPI异构计算设计大赛则是吸引了来自14所高校的21支队伍。显然,OpenPOWER + OpenCAPI的组合正在吸引更多的关注,新的生态逐渐孵育成熟,正在蓄势待发。

  OpenPOWER+OpenCAPI

  李孝聪,西安交通大学在读硕士。本次大赛中,他和他的队友们顺利闯过初赛,与其他9支队伍共同杀入到复赛当中。

  作为一枚经常参加各种校外比赛的“研究僧”,李孝聪表示,在大学里接触异构计算的场合并不是很多,此前基本上是通过阅读论文、搜索资料这样远距离的学习来获取理解,而大赛提供了多次与OpenPOWER+OpenCAPI“亲密接触”的机会,李孝聪和他的队友们也得以与许多共同学习OpenCAPI技术的参赛团队进行深入交流。

  远超李孝聪预期的是,主办方为参赛队伍提供了一对一的企业导师,导师们传播知识、理解应用场景,能为参赛方案提出优化建议和点睛式的改进点拨,这是同类赛事其它主办方难以提供的优势资源。

  此外,主办方还提供了服务器与板卡,参赛者不仅可以在理论上讨论加速效果,更可以在服务器上实现加速效果,亲自感受OpenCAPI异构计算的巨大威力。在接下来的时间里,李孝聪希望进一步改进方案,完成最终的设计。

  李孝聪团队的方案主要是围绕密码学的算法。由于计算量非常大,算法也比较复杂、串行度大,因此团队的设计初衷就是利用FPGA(Field-Programmable Gate Array,现场可编程门阵列),更灵活地设计逻辑电路,赋予它更强大的加速能力。

  相较而言,他的感受是,OpenCAPI有着非常领先的前瞻性和技术水准。譬如AES、SM3等算法,它们在计算速度上没有什么问题,但是对带宽要求非常高,一般的系统上是很难实现的。而OpenCAPI则是优势明显,第三代协议的OpenCAPI已经能够提供25GB/s的接口速度。

  李孝聪表示,在不占用资源的情况下,团队会尽可能使用OpenCAPI的接口带宽,并根据FPGA的资源情况适当地调整一下它的流水线级数,保证更好的工作效率。

  在高带宽之外,OpenCAPI还具有低延时的特性,能够为数据从FPGA端传送到CPU端或是反向传输,提供极好的支撑。

  以SM2椭圆曲线公钥密码算法为例,如我们所知,这是个运算量比较大的算法,同时也对数据传输有着很高的要求。由于具备低延时的特点,OpenCAPI不仅能够加速SM2算法的运算,还可以让数据的传输更快,整个系统也由此更具安全优势。

  生态的“移山”之旅

  大赛规模的扩充,一方面令IBM中国OpenPOWER总经理吴伟明欣喜不已,另一方面也令他深陷“烦恼”:与上届比赛相比,主办方需要做出更多“痛苦”的决定,比如将21支初赛队伍最终缩减为10支挺进复赛的队伍。

  从2013年一路走来,OpenCAPI已经迭代到第三代,日趋成熟,并且拥有上佳的技术水准。然而现实是以GPU为主的开发,仍未被充分利用,IBM提供开源工具套件的初衷,是希望帮助开发者更加快捷、容易地开发应用,加速创新。

  IBM一贯重视与大学和科研机构的合作,他们客观、包容,可以接受新的东西,也乐于实现科技的快速落地。吴伟明表示,大赛的目的是把创新技术展示出来,让客户们看到在单纯的CPU加持之外,实际上还有一条更为可靠的、CPU+加速器的硬件加速解决方案。

  他注意到,与上届相比,本届大赛的参赛方案出现了一些极具意义的变化:此前的应用基本是面向超算中心或是互联网公司,而本次则涌现出一批与工业控制相关的方案。与此同时,很多方案也瞄准了企业应用的实际方向,这是一个非常好的迹象。

99科技网:http://www.99it.com.cn

相关推荐