目前以深度学习为代表的异型自动插件机人工智能计算需求,主要采用GPU、FPGA等已有的适合并行计算的通用芯片来实现加速。异型自动插件机在产业应用没有大规模兴起之时,使用这类已有的通用芯片可以避免专门研发定制芯片(ASIC)的高投入和高风险。但是,由于这类通用芯片设计初衷并非专门针对深度学习,因而天然存在性能、功耗等方面的局限性。随着人工智能应用规模的扩大,这类问题日益突显。
GPU作为图像处理器,设计初衷是为了应对图像处理中的大规模并行计算。因此,在应用于深度学习算法时,有三个方面的局限性:
第一,应用过程中无法充分发挥并行计算优势。异型自动插件机深度学习包含训练和推断两个计算环节,GPU在深度学习算法训练上非常高效,但对于单一输入进行推断的场合,并行度的优势不能完全发挥。
第二,无法灵活配置硬件结构。异型自动插件机GPU采用SIMT计算模式,硬件结构相对固定。目前深度学习算法还未完全稳定,若深度学习算法发生大的变化,GPU无法像FPGA一样可以灵活的配制硬件结构。
第三,运行深度学习算法能效低于FPGA。
尽管FPGA倍受看好,甚至新一代百度大脑也是基于FPGA平台研发,但其毕竟不是专门为了适用深度学习算法而研发,实际应用中也存在诸多局限:第一,基本单元的计算能力有限。为了实现可重构特性,FPGA内部有大量极细粒度的基本单元,但是每个单元的计算能力(主要依靠LUT查找表)都远远低于异型自动插件机CPU和GPU中的ALU模块;第二、计算资源占比相对较低。异型自动插件机为实现可重构特性,FPGA内部大量资源被用于可配置的片上路由与连线;第三,速度和功耗相对专用定制芯片(ASIC)仍然存在不小差距;第四,异型自动插件机FPGA价格较为昂贵,在规模放量的情况下单块FPGA的成本要远高于专用定制芯片。
所以越来越多的企业都开始采用自动化设备来代替人工,从而降低生产成本,在制造异型自动插件机的企业当中,佳永自动化科技有限公司拥有着成熟的技术团队,同时自主研发了异型自动插件机,其中采用了多轴高速精密运动控制,多角度视觉系统标定,伺服/视觉精准协同控制实现8-12个取插头电动夹持的力/位控制。在所有视觉系统均开启的情况下,单个插件速度也仅需0.6秒,可全面实现了异形元件插装标准化作业。
以上就是小编关于异型自动插件机在深度学习算法训练上非常高效的介绍,希望对大家有用哦!
责编:文文